摘要:
针对网络中海量的Web服务聚类时,因其表征数据稀疏而导致使用传统建模方法所获效果不理想的问题,提出了一种基于BTM主题模型的Web服务聚类方法。该方法首先利用BTM学习整个Web服务描述文档集的隐含主题,通过推理得出每篇文档的主题分布,然后应用KMeans算法对Web服务进行聚类。通过与LDA、TFIDF等方法进行对比发现,该方法在聚类纯度、熵和FMeasure指标上均具有更好的效果。实验表明,该方法能够有效解决因Web服务描述所具有的短文本性质而导致的数据稀疏性问题,可显著提高服务聚类效果。
陈婷1,2,刘建勋1,2,曹步清1,2,李润2. 基于BTM主题模型的Web服务聚类方法研究[J]. 计算机工程与科学.
CHEN Ting1,2,LIU Jianxun1,2,CAO Buqing1,2,LI Run2.
Web services clustering based on Biterm topic model
[J]. Computer Engineering & Science.