摘要:
如何从海量文本中自动提取有价值的主题信息已成为重要的技术挑战,当下的研究方法大多数是在假设主题相互独立的前提下进行的,但实际上主题与主题之间有着复杂的内在联系。为解决以上问题,将相关性理论与改进的图分析方法相结合,基于主题相关性和术语共现性对主题检测进行建模,高精度语义信息和潜在共现关系同时被用于主题检测,来发现重要且有意义的主题和趋势,仿真实验验证了本文模型的有效性。
马长林,程梦丽,王涛. 基于图分析方法和余弦相似性的主题检测研究[J]. 计算机工程与科学.
MA Changlin,CHENG Mengli,WANG Tao.
Topic detection based on graph
analytical method and cosine similarity
[J]. Computer Engineering & Science.