计算机工程与科学 ›› 2023, Vol. 45 ›› Issue (06): 1116-1122.
许浪1,2,李代伟1,2,张海清1,2,唐聃1,2,何磊1,2,于曦3
XU Lang1,2,LI Dai-wei1,2,ZHANG Hai-qing1,2,TANG Dan1,2,HE Lei1,2,YU Xi3
摘要: 传统的医学文本数据分类方法忽略了文本的上下文关系,每个词之间相互独立,无法表示语义信息,文本描述和分类效果差;并且特征工程需要人工干预,因此泛化能力不强。针对医疗文本数据分类效率低和精度低的问题,提出了一种基于Transformer双向编码器表示BERT、卷积神经网络CNN和双向长短期记忆BiLSTM神经网络的医学文本分类模型CMNN。该模型使用BERT训练词向量,结合CNN和BiLSTM,捕捉局部潜在特征和上下文信息。最后,将CMNN模型与传统的深度学习模型TextCNN和TextRNN在准确率、精确率、召回率和F1值方面进行了比较。实验结果表明,CMNN模型在所有评价指标上整体优于其他模型,准确率提高了1.69%~5.91%。