J4 ›› 2004, Vol. 26 ›› Issue (9): 62-63.
• 论文 • 上一篇 下一篇
王天江 刘芳 卢正鼎
出版日期:
发布日期:
Online:
Published:
摘要:
记录匹配算法在异构数据的集成和数据开采等领域应用广泛,其主要任务是找出来自不同数据源中代表同一对象实体的记录,这些记录具备相似的属性和属性值。为避免组合爆炸问题,现有的记录匹配算法不再对数据库中的记录数两两匹配,而是结合排序策略和静态聚类匹配方法实现,但这种静态方法不适应数据的动态变化。因此,本文提出基于聚类汇总的记录匹配算法,该算法可以解决静态方法导致的匹配记录丢失问题,同时能够减少计算量,提高匹配记录搜索效率。
关键词: 聚类汇总 记录匹配 模式匹配 重复记录发现 聚类分析
王天江 刘芳 卢正鼎. 基于聚类汇总的记录匹配算法[J]. J4, 2004, 26(9): 62-63.
0 / / 推荐
导出引用管理器 EndNote|Ris|BibTeX
链接本文: http://joces.nudt.edu.cn/CN/
http://joces.nudt.edu.cn/CN/Y2004/V26/I9/62