首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于特征融合的医疗病例实体识别方法
作者姓名:帅英杰
作者单位:广西民族大学人工智能学院
摘    要:在医学领域,传统的命名实体识别方法在医疗病历实体识别过程中,存在文本提取特征单一及不充分等问题,导致模型识别精准度不高。针对此问题,文章提出一种基于语义、词序、BER T预训练模型相结合的多特征融合提取方法。引入Word2vec对文本进行语义特征提取,利用Fasttext对文本的词序特征进行提取,通过BER T预训练模型获取词向量,解决Word2vec无法解决一词多义的问题。将多元特征向量融合,对相关数据的特征进行提取融合。通过卷积神经网络对融合特征进行再提取,得到更有价值的数据特征。最后通过双向长短时记忆神经网络结合条件随机场模型(BiLSTM-CRF)进行实体识别。实验结果表明:此方法在ChineseBLUE(c MedQANER)数据集上,其精准度、召回率、F1-Measure值等评价指标都有显著的提升。

关 键 词:医疗病历  实体识别方法  双向transformer编码模型(BER  T)预训练词向量  文本卷积神经网络  长短时记忆神经网络  条件随机场
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号