摘要:
随着数字媒体等技术的发展,出现了弹幕系统这种新型的评论模式并逐渐流行。它能够使视频观众即时发布关于视频情节内容的评论,也可以帮助观众理解视频内容。弹幕文本数据的产生,为短文本处理和实时数据处理提供了新的素材。研究弹幕数据的特点和其表达的情感,可以帮助我们更好地理解视频情节;研究弹幕内容之间的相似度进而分析用户之间的关联关系,不仅能够深入了解弹幕用户的特点、发掘不同视频之间的潜在联系,而且可以为视频制作时受众群体的选择提供更为准确的解决方案。首先将弹幕文本数据进行收集和预处理,然后计算这些文本的情感值。针对弹幕文本口语化的特点,建立了网络弹幕常用词词典。通过改进传统的k-means聚类算法,对所有发表弹幕的用户进行基于情感值的分类。这样的分类可以帮助我们了解观看特定类型视频的观众在情感上的异同点。
洪庆,王思尧,赵钦佩,李江峰,饶卫雄. 基于弹幕情感分析和聚类算法的视频用户群体分类[J]. 计算机工程与科学.
HONG Qing,WANG Siyao,ZHAO Qinpei,LI Jiangfeng,RAO Weixiong.
Video user group classification based on barrage
comments sentiment analysis and clustering algorithms
[J]. Computer Engineering & Science.