J4 ›› 2010, Vol. 32 ›› Issue (1): 136-140.doi: 10.3969/j.issn.1007130X.2010.
摘要:
为适应中文问答系统中汉语语言的特点,本文对信息检索模块进行了深入分析,相对于传统的主流信息检索模型,找到了一种更有效的检索方法——基于SLM的语言模型的信息检索技术(SLMIR)。同时,研究了Ngram模型的参数N选取及其几种主要的数据平滑技术,并通过对各种数据平滑方法的实验对比,讨论了影响这些数据平滑方法性能的有关因素,如训练集规模等,最终给出了在不同情况下的最优选择方案。
中图分类号: