摘要:
针对传统的网页排序算法中容易出现的忽略搜索结果主题相关性和主题漂移的问题,提出了结合PCM聚类算法的网页排序,用来提高搜索结果中网页主题的相关性并减少其主题漂移。首先,通过查询某个主题,运用随机行走(RWM)的方法来计算两个网页之间的对称社会距离(SSD);然后,用SSD和PCM聚类算法对网页进行聚类,得到相关主题的各个社区,通过计算得到各个社区中成员属于该社区的概率表示;最后,根据各社区成员的概率和网页的推荐度对网页进行排序。实验结果表明,与PageRank算法相比,该算法搜索结果中网页主题的相关程度更高;另外,由于是针对某个主题的排序,该算法减少了主题漂移。