计算机工程与科学 ›› 2025, Vol. 47 ›› Issue (7): 1226-1236.
张锦1,3,吴星瑾1,张洋2,许舜宇1
ZHANG Jin1,3,WU Xingjin1,ZHANG Yang2,XU Shunyu1
摘要: 在开源软件中,准确识别软件开发辅助机器人(Bot)和人类贡献者对于理解和评估贡献活动至关重要。针对深度学习模型在自然语言处理和软件工程相关领域中的优异表现,提出了一种基于Transformer架构的Bot自动检测模型BotChecker。通过在Transformer中引入增强的全连接层和专用的二分类器结构,该模型能有效学习Bot和人类账户的评论文本数据,进而对Bot进行检测。实验验证了BotChecker在Bot检测任务中的有效性,准确率、召回率和F1值分别达到0.941,0.894和0.938。此外,还分析了模型超参数、零样本学习对于BotChecker性能的影响。所提出的模型可为开源社区Bot账户识别提供技术支撑,并为后续研究提供方法基准。