• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

J4 ›› 2015, Vol. 37 ›› Issue (02): 379-383.

• 论文 • 上一篇    下一篇

低空间复杂度的LSH算法及其在图像检索中的应用

曹玉东,刘艳洋,孙福明,贾旭   

  1. (辽宁工业大学电子与信息工程学院,辽宁 锦州 121001)
  • 收稿日期:2013-05-10 修回日期:2013-11-21 出版日期:2015-02-25 发布日期:2015-02-25
  • 基金资助:

    国家自然科学基金资助项目(61272214);辽宁省自然科学基金资助项目(2013020020);辽宁省教育厅一般项目(L2013241);辽宁工业大学教师科研启动基金(X201216)

LSH with low space complexity for image retrieval  

CAO Yudong,LIU Yanyang,SUN Fuming,JIA Xu   

  1. (College of Electronics & Information Engineering,Liaoning University of Technology,Jinzhou 121001,China)
  • Received:2013-05-10 Revised:2013-11-21 Online:2015-02-25 Published:2015-02-25

摘要:

局部敏感哈希LSH算法是有效的高维数据索引方法,如何生成哈希函数是算法的关键部分。LSH算法的哈希函数是基于p稳态分布随机生成的,为了提高算法性能就需要增加哈希表的数量,但这会增加算法的空间复杂度。改进后的LSH算法(ILSH)在生成哈希函数时不需要有标记的训练样本,而是仅仅利用数据点的分布信息构造投影方向。实验结果表明,在不显著降低检索性能的情况下,ILSH有效地降低了内存的使用量,适合处理大规模数据。

关键词: 高维数据索引, 局部敏感哈希索引, 图像检索, Gist特征

Abstract:

Locality sensitive hashing (LSH) is quite popular in high dimensional data indexing.The Hash function in the original LSH algorithm is generated based on pstable distribution.So the number of hash tables must be increased in order to improve the performance of the algorithm,which however leads to a high space complexity.An improved LSH (ILSH) algorithm is proposed,which does not require the labeled samples but only uses the distribution of data to construct the projection direction.The experimental results show that ILSH can greatly save the memory without degrading its retrieval performance.

Key words: high data indexing;LSH indexing;image retrieval;Gist feature