首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
在分析工程文本中命名实体实际特征的基础上,提出一种基于CRF与规则相结合的工程领域命名实体识别方法。在完善用户词典并对文本进行分词后,以短语级的粒度为原则从中确定特征,将文本交由CRF算法进行处理;分析CRF的处理结果,根据语言学规律及工程文本特点编写规则,对CRF处理结果进行优化。实验表明,该方法的全局F1值能够达到93.45。  相似文献   

2.
HMM、CRF等机器学习算法在中文实体抽取任务上存在大量依靠特征提取及准确率低的缺陷,而基于BiLSTM-CRF、BERT等深度神经网络算法在中文实体识别准确率高,但BiLSTM模型依赖大规模标注数据,BERT存在参数量大、效率低等问题。该研究提出了基于ALBERT-Attention-CRF模型进行中文实体抽取的方法。首先将glove、Word2vec等静态词向量替换为ALBERT预训练模型字向量,可有效解决分词错误、数据稀疏、OOV、过拟合以及一词多义等问题;然后采用ALBERT作为编码层并对其输出利用Attention机制捕获上下文语义特征;最后结合CRF作为解码层输出实体正确标签,摒弃主流BiLSTM-CRF模型,最终在《人民日报》数据的测试集上取得了理想的效果。试验结果表明,该方法有助于提升通用中文实体识别的准确率和效率,其有效性也得到了较好的验证。  相似文献   

3.
针对利用当前神经网络模型进行中文位置语义解析存在多义词解析效果差、泛化能力差等问题,提出一种基于BERT-BiLSTM-CRF模型的中文位置语义解析方法.首先利用BERT预训练模型对中文位置信息进行预训练,获取所有层中的上下文信息,增强中文位置信息的语义表征能力,然后通过BiLSTM模型提取向量特征信息,最后通过CRF...  相似文献   

4.
新闻文本分类是长文本分类的典型问题,因此提取词与词之间的关系特征就尤为重要.提出了基于双向Transformer编码表示的预训练模型(Bidirectional Encoder Representations from Transformers, BERT)和双向长短时记忆网络(Bi-directional Long Short-Term Memory, BiLSTM)以及注意力机制的对抗训练分类模型(BBA-AT).将预处理新闻文本数据经过BERT进行训练得到词嵌入编码,在训练后的词向量级别上进行扰动达到数据增广的效果,以此来进行对抗训练,之后通过双向长短时记忆网络对数据集进行编码提取双向语义表征.本文提出的BBA-AT模型F1值在TNEWS数据集上比BERT模型提升了1.34%.  相似文献   

5.
中文电子病历命名实体识别对于医学知识库的构建和临床决策作用关键。针对中文电子病历结构化实体识别困难的问题,提出一种多特征融合的中文电子病历命名实体识别方法。该方法基于条件随机场,通过逐一融合语言符号、词性、关键词、词典、词聚类等多种特征,采用递增式学习策略验证其有效性,在最优特征组合下识别出疾病、症状、检查和治疗4类实体。实验结果表明,该方法识别准确率达到90.99%,有效满足了应用需求。  相似文献   

6.
命名实体识别是自然语言处理基础任务之一。针对“数字敦煌”项目应用命名实体识别技术存在的实体边界难以确定等问题,通过构建小规模敦煌石窟专有名词数据集,对基于BERT-BiLSTM-CRF的命名实体识别基本方法,和基于Multi-digraph的词汇增强方法进行了实验对比,结果表明基本方法已具备较高的识别准确率,而基于词汇增强的方法对未登录词识别效果提升显著。最后将训练得到的模型应用于“数字敦煌”资源库命名实体识别任务,证明了方法的有效性。  相似文献   

7.
识别一篇生物医学文献中的核心实体是准确提取该文献信息的前提。针对目前生物医学文献实体识别和筛选方法的局限性,提出了基于LSTM的生物医学核心实体提取模型。该模型以LSTM为核心,通过更为优秀的词向量和输入生成规则改良模型输入,使用双向LSTM模型改进处理过程,将结果保存为树形结构并对该树进行合理剪枝获取标注链,实现输出结果处理,最终使实体识别的F1值达到了89.35%。此外,在核心实体筛选过程中,基于TF/IDF算法规则,充分考虑了词频、位置、逆文档频率等因素,使核心实体筛选的F1值达到了76.85%。  相似文献   

8.
针对现有命名实体识别存在数据处理效率低的问题,该文提出了一种并行化Block-BAC模型.提出了前处理中的数据分块优化算法,并基于Hadoop实现并行化的运作机制;采用局部注意力优化机制,有效减少模型的隐层节点.与已有的BERT-BAC模型相比,在确保较高F1值(精确率和召回率的调和平均数)的情况下,该模型训练时间和实...  相似文献   

9.
模型要素的理解和应用能帮助学生学习和建构化学模型.在分析梳理"组成结构"模型、"作用力"模型、"变化规律"模型和"状态"模型要素的基础上,归纳出自上而下式与自下而上式两种要素识别方式,进而提出"合理选择要素识别方式""明晰要素表示方式""引导学生亲历要素识别及生成的思维活动"和"要素多维表征"等模型要素的生成策略,以原...  相似文献   

10.
命名实体识别模型Lattice LSTM集成字信息和词信息,在路由词信息的过程中会退化成词模型,不能有效利用字信息内在关联性.针对上述问题,提出基于多头注意力机制的Lattice LSTM模型,获取字信息的内在关联和远距离语义信息,同时对模型进行调参优化与改进.在多个数据集上的实验验证,该模型相对于基线模型F1值提高了0.48%~1.11%.  相似文献   

11.
应用BERT模型,设计了一种基于多任务联合学习的古籍文本信息标注工具,可实现对标点、专名信息的自动标注。相较于以往同类技术而言,该工具对人名、地名、时间名、书名的有效识别度更高,并将有助于“远读”方法在古籍文献领域的实现。以《四库全书》所收雍正《畿辅通志》为例,专名自动识别技术可快速提取文献出处、建筑设施的建造时间、人口分布等历史信息,也可以快速提取作家作品、经典意境。在对水利设施的兴建与对黄河水患的书写中,可以看出治河名臣李卫在编纂《畿辅通志》时的个人意志。  相似文献   

12.
世界各国家地区,为了确保基础教育的质量,莫不对于中小学教育内涵及师生作为有一些要求或规范.这些规范的公布周知,经常用了不同名称,例如课程标准、教育法案、教育标准、教学计划、课程计划、教学大纲及课程指引等.经由历史文献内容的分析、比较和推论,我们可以探究课程标准所具有的组成要素.从上世纪中国百年来的课程标准、教学计划、教学大纲及外国的课程标准的内容分析,我们可以发现课程标准所具有的一些组成要素,如目标、科目、时间、科目内容、教材教法、教学及名称等,作者最后提出五项结论供读者参考.  相似文献   

13.
空间是建筑最主要的目的,建筑内部空间———建筑的围合部分———是建筑的主体。在建筑内部空间中,各种非实体空间要素的设计具有极为重要的作用,它们包括空间构成、色彩要素、采光照明、景观配饰等方面。  相似文献   

14.
利用条件随机场能够任意添加特征的优点,基于条件随机场模型在字粒度一级进行中文人名识别的研究.根据中文人名在文本中出现的基本特征和上下文特征,结合模型的综合性能,合理构造条件随机场的特征模板,在大规模标注语料上进行训练,统计中文人名在文本中的条件概率分布,获得模型参数,并采用序列标注的方式完成中文人名识别任务.多次闭合测试和开放测试结果表明,F值基本都高于90%.  相似文献   

15.
传统基于统计的命名实体识别方法存在需要大量人工标注的缺陷,导致识别准确率较低。为了提升识别效果,提出一种基于条件随机场的半监督学习方法(S-CRF)对命名实体进行识别。该方法将实体识别看作序列标注问题,对少量数据进行人工标注并构建实体集,通过K-means聚类算法选取有代表性的未标注数据文本进行自动标注,采用条件随机场对语料进行训练测试。选取中文应急预案文档进行实验,该方法在各个标签上的识别效果分别达到93.52%、93.04%、95.81%。实验结果表明,该方法优于传统规则方法,能有效提高应急预案命名实体的识别效果。  相似文献   

16.
本文旨在从培训的角度全面分析教师继续教育的要素融合,即对组织形式的“来”与“去”融合、课程内容的“虚”与“实”融合、培训模式的“学”与“用”融合、制度建设的“柔”与“刚”融合,并对其做出了较系统的阐述。  相似文献   

17.
针对传统基于规则的简历实体提取方法效率低、迁移能力差的问题,提出了一种基于Transformer双向编码器表示(bi-directional encoder representations from Transformers,BERT)的深度学习模型,用于识别相关命名实体.模型通过BERT对简历信息进行字符级别编码,得...  相似文献   

18.
本文运用波特钻石模型的六大要素,即生产要素、行业需求、相关及联动产业、产业结构和同业竞争与合作、面临的机遇、政府行为,针对合肥会展业竞争力展开了深入分析,通过分析阐释了合肥会展的优劣所在.  相似文献   

19.
综合回顾了顾客价值要素识别理论的发展演进,利用规范分析和案例分析相结合的研究方法,论证了利用顾客价值要素识别的重要意义;同时重点分析了Gale的基于质量与价格的顾客价值识别法和Woodruff的顾客价值确定系统这两种居于主流地位的顾客价值识别方法,对顾客价值研究现状进行了简要评价。  相似文献   

20.
目前,随着社会的发展,心理应激问题引起了许多学者的关注,各学科从不同的角度对应激进行了探讨,每种理论都提出了不同的观点。首先对已有的心理应激的主要理论模型进行了简介及评述,从系统科学的研究视角,分析了现有应激多因素系统模型的不足,然后运用UML(统一建模语言)视图,提出了基于系统要素的应激过程模型,从全新的视角定义和诠释了应激系统模型框架,从而构建了开放的、可扩展的理论框架。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号