计算机工程与科学 ›› 2022, Vol. 44 ›› Issue (01): 110-117.
王保成1,刘利军1,黄青松1,2
WANG Bao-cheng1,LIU Li-jun1,HUANG Qing-song1,2
摘要: 随着智能设备的不断出现,图像数量急速增加,但是很多图像因为没有被标注所以未被充分利用。为了能够使该问题得到较好解决,提出了基于LDA和卷积神经网络的半监督图像标注方法。首先把图像训练集中的所有文字信息放入LDA中,生成图像的文字标注词;然后使用卷积神经网络获得图像的高层视觉特征,同时用加入注意力机制和修改损失函数的方法来对卷积神经网络进行优化;接着把LDA生成的标注词和已获得的图像的高层视觉特征进行结合并同时使用半监督学习来完成模型的训练;
最后把标注词间的相关性和使用最终模型预测的结果相结合来完成图像的最终标注。通过在IAPR TC-12 图像数据集上的相关实验对比可知,文中所提方法的标注更精确。