共查询到20条相似文献,搜索用时 0 毫秒
1.
命名实体识别(Named Entity Recognition)是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等.首先对我国关于命名实体识别研究的文献进行了总结,给出命名实体识别的主要方法及模型.并针对文献中对这些命名实体识别方法的效果进行统计分析,探讨各种识别对象、识别模型的效果及适用性.经过对现有研究文献的统计,结论为:在不考虑运行效率的情况下,对于机构名,识别效果最好的是层叠CRF模型;对于地名,测试效果最好的是CRF方法与专家知识相结合;人名识别方法中表现不错的则是边界模版和局部统计相结合的模型. 相似文献
2.
3.
[目的/意义]菊花古典诗词的命名实体识别有助于深度挖掘菊花诗词文本之间的关联,传承菊花文化,助力菊花产业及乡村文化旅游,同时也为其他花卉诗词的文本深度挖掘提供了思路。[方法/过程]文章通过网络、论文和书籍进行菊花古典诗词数据的采集,重点选择诗词中涉及的时间、地点、季节、花名、花色、人物和节日7类命名实体进行标注和识别,得到BiLSTM、BiLSTM-CRF和BERT模型不同识别结果,并与CRF模型识别结果进行对比。[结果/结论]BERT模型在菊花古诗词文本的命名实体识别中表现优异,实体识别的调和平均数高于其他模型,最优调和平均数达到91.60%。BERT模型可用于菊花古诗词文本的深层次挖掘研究,并可向更多的花卉诗词扩展,古诗词文本的命名实体标注体系可以为后续研究提供借鉴。 相似文献
4.
5.
基于规则和统计相结合的中文命名实体识别研究 总被引:3,自引:0,他引:3
介绍命名实体识别在文本信息处理领域的重要地位,分析了中文命名实体识别存在的困难,介绍中文命名实体识别的一般过程、评价标准及方法。提出了一种在构造内部规则和外部规则的同时采用概率统计的中文命名实体的识别方法,并利用这种基于规则和统计相结合的方法。实验证明该方法获得了较高的准确率和召回率,具有可行性和合理性,同时也指出了它的局限性。 相似文献
6.
情感识别是情感智能与计算机技术相结合的一个崭新的研究课题,情感的计算机自动识别是通向情感计算的第一步。本文针对日常生活中最常见的四种情感状态:生气、高兴、悲伤和惊奇的汉语语音信号的情感识别进行了研究,并研究了基于采用隐马尔可夫模型(HMM)对情感特征数据的情感识别,得出了相关的实验结果。 相似文献
7.
提出了基于小波变换和隐马尔可夫模型的人像鉴别算法. 该算法首先对图像进行3级小波分解,然后把3个不同分辨率的低频子图像由小到大排列成树状结构,形成低频小波树. 接着利用独立元分析对每个小波树枝进行去相关、降维,形成特征小波树枝,并把它作为观测向量对隐马尔可夫模型进行训练,把优化的模型参数用于人脸识别. 分析了观测向量维数与识别率的关系,以及状态个数和高斯概率混合成分的个数对识别率的影响,定性描述了隐马尔可夫模型的本质. 在ORL人脸数据库上,同其他四种相关方法进行了比较,实验结果表明,该方法识别率较高,工程上易于应用. 相似文献
8.
为了适应强噪声环境下的语音识别,进行了基于美尔倒谱系数特征及隐马尔可夫模型的识别算法研究,主要对提取语音信号的线性预测系数、端点检测、语音特征参数提取、语音算法识别流程等进行了初步研究,并进行了说话人识别系统的仿真验证。 相似文献
9.
10.
11.
12.
【 目的/意义】开展面向领域的细粒度命名实体识别研究对于提升文本挖掘精度具有重要的意义,本文以番
茄病虫害命名实体为例,探索采用深度学习技术实现面向领域的细粒度命名实体识别研究方法。【目的/意义】文章
以电子书、论文、网页作为数据源,选择品种、病虫害、症状、时间、部位、防治药剂六类实体进行标注,利用BERT和
CBOW 预训练字向量分别输入 BiLSTM-CRF 模型训练,并在识别后补充规则控制实体的边界。【结果/结论】
BERT预训练的字向量和BiLSTM-CRF结合,在补充规则控制后F值达到了81.03%,优于其它模型,在番茄病虫害
领域的实体识别中具有较好的效果。【创新/局限】BERT预训练的字向量可以有效降低番茄病虫害领域实体因分
词错误带来的影响,针对不同实体的特点,补充规则可以有效控制实体边界,提高识别准确率。但本文的规则补充
仅在测试阶段,并没有加入训练过程,整体的准确率还有待提高。 相似文献
13.
李国晖 《内蒙古科技与经济》2007,(21):417-418
马氏链预测法是通过对事物不同状态的初始分布及状态之间的转移概率的研究来预测事物的未来状态,本文利用此方法来建立相应的遗传模型,并讨论模型在常染色体遗传中的应用. 相似文献
14.
[目的/意义]本文针对农业领域提出一种基于融合多重特征词嵌入模型的农业命名实体识别方法,以提高识别准确度。[方法/过程]通过使用结合字符、位置语义、领域知识字典特征等多重特征向量作为嵌入层,充分考虑字符的位置信息和上下文语义信息,并根据农业领域的中文实体的特点改进了单一字符向量嵌入,获得更多的农业实体特征,同时采用双向长短时记忆网络BiLSTM和多头注意力机制来学习文本的长距离依赖信息,再利用条件随机场CRF获得全局最优标注序列。[结果/结论]本文在农业领域中文实体语料数据集中与9种基于基线方法进行对比实验,模型的Precision为92.2%,Recall为92.0%,F1值为92.11%,均优于其他基线模型,说明本文模型对于中文农业命名实体识别更精确。 相似文献
16.
首先分析了互联网文本中命名实体分布特征;然后使用UIMASDK构建一个文本分析引擎在文档中寻找命名实体,将结果写入抽取信息数据库EIDB中;最后对文本中包含的命名实体的强关联关系进行了关联分析。实验证明该框架非常有效。 相似文献
17.
18.
19.
以泛滥型阻断服务攻击为研究目标,提出一个基于可扩张马尔可夫的快速精准网络攻击检测模型,针对模型中的分群与节点新增算法在空间上的特性进行改进,以加快分群的速度,从而可以有效地检测出异常的封包. 相似文献
20.
[目的/意义]研究利用深度学习的循环神经网络GRU结合条件随机场CRF对标注的中文文本序列进行预测,来抽取在线评论文本中的实体-属性。[方法/过程]首先根据设计好的文本序列标注规范,对评论语料分词后进行实体及其属性的命名实体标注,得到单词序列、词性序列和标注序列;然后将单词序列、词性序列转为分布式词向量表示并用于GRU循环神经网络的输入;最后输出层采用条件随机场CRF,输出标签即是实体或属性。[结果/结论]实验结果表明,本文的方法将实体-属性抽取简化为命名实体标注,并利用深度学习的GRU捕获输入数据的上下文语义以及条件随机场CRF获取输出标签的前后关系,比传统的基于规则或一般的机器学习方法具有较大的应用优势。 相似文献