首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
[目的/意义]菊花古典诗词的命名实体识别有助于深度挖掘菊花诗词文本之间的关联,传承菊花文化,助力菊花产业及乡村文化旅游,同时也为其他花卉诗词的文本深度挖掘提供了思路。[方法/过程]文章通过网络、论文和书籍进行菊花古典诗词数据的采集,重点选择诗词中涉及的时间、地点、季节、花名、花色、人物和节日7类命名实体进行标注和识别,得到BiLSTM、BiLSTM-CRF和BERT模型不同识别结果,并与CRF模型识别结果进行对比。[结果/结论]BERT模型在菊花古诗词文本的命名实体识别中表现优异,实体识别的调和平均数高于其他模型,最优调和平均数达到91.60%。BERT模型可用于菊花古诗词文本的深层次挖掘研究,并可向更多的花卉诗词扩展,古诗词文本的命名实体标注体系可以为后续研究提供借鉴。  相似文献   

2.
3.
丁浩  孔令圆  刘清  胡广伟 《现代情报》2023,(11):135-145
[目的/意义]本文针对农业领域提出一种基于融合多重特征词嵌入模型的农业命名实体识别方法,以提高识别准确度。[方法/过程]通过使用结合字符、位置语义、领域知识字典特征等多重特征向量作为嵌入层,充分考虑字符的位置信息和上下文语义信息,并根据农业领域的中文实体的特点改进了单一字符向量嵌入,获得更多的农业实体特征,同时采用双向长短时记忆网络BiLSTM和多头注意力机制来学习文本的长距离依赖信息,再利用条件随机场CRF获得全局最优标注序列。[结果/结论]本文在农业领域中文实体语料数据集中与9种基于基线方法进行对比实验,模型的Precision为92.2%,Recall为92.0%,F1值为92.11%,均优于其他基线模型,说明本文模型对于中文农业命名实体识别更精确。  相似文献   

4.
基于规则和统计相结合的中文命名实体识别研究   总被引:3,自引:0,他引:3  
潘正高 《情报科学》2012,(5):708-712,786
介绍命名实体识别在文本信息处理领域的重要地位,分析了中文命名实体识别存在的困难,介绍中文命名实体识别的一般过程、评价标准及方法。提出了一种在构造内部规则和外部规则的同时采用概率统计的中文命名实体的识别方法,并利用这种基于规则和统计相结合的方法。实验证明该方法获得了较高的准确率和召回率,具有可行性和合理性,同时也指出了它的局限性。  相似文献   

5.
刘佳  边俊伊 《现代情报》2023,(11):37-46
[目的/意义]针对藏医古籍知识组织与开发不足的问题,利用混合深度学习方法构建面向藏医古籍的命名实体识别模型,为藏医古籍知识的深度开发与利用提供方法支持。[方法/过程]根据藏医古籍知识特点,构建ALBERT-BiLSTM-CRF模型。以《四部医典》为数据集,在人工标注与文本预处理的基础上,进行命名实体识别实验,并将实验结果与其他3种常见模型进行对比分析。[结果/结论]ALBERT-BiLSTM-CRF模型对藏医古籍实体识别效果最好,F1-score达到96.28%,与其他方法相比提升约7个百分点。  相似文献   

6.
7.
丁晟春  方振  王楠 《现代情报》2009,40(3):103-110
[目的/意义] 为解决目前网络公开平台的多源异构的企业数据的散乱、无序、碎片化问题,提出Bi-LSTM-CRF深度学习模型进行商业领域中的命名实体识别工作。[方法/过程] 该方法包括对企业全称实体、企业简称实体与人名实体3类命名实体识别。[结果/结论] 实验结果显示对企业全称实体、企业简称实体与人名实体3类命名实体识别的识别率平均F值为90.85%,验证了所提方法的有效性,证明了本研究有效地改善了商业领域中的命名实体识别效率。  相似文献   

8.
命名实体识别(Named Entity Recognition)是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等.首先对我国关于命名实体识别研究的文献进行了总结,给出命名实体识别的主要方法及模型.并针对文献中对这些命名实体识别方法的效果进行统计分析,探讨各种识别对象、识别模型的效果及适用性.经过对现有研究文献的统计,结论为:在不考虑运行效率的情况下,对于机构名,识别效果最好的是层叠CRF模型;对于地名,测试效果最好的是CRF方法与专家知识相结合;人名识别方法中表现不错的则是边界模版和局部统计相结合的模型.  相似文献   

9.
化妆品标准有助于规范化妆品市场,同时也是相关部门进行安全监管的重要依据。为了解决化妆品标准文本中专有命名实体具有上下文敏感性、长序列存在语义稀释等问题,本文提出了一种融合了注意力机制的BERT-BiLSTM-Attention-CRF模型来提取文本中的实体和关系,引入的注意力机制能够优化权重分配、消除噪音,进而提高抽取的准确性。为了验证模型的有效性,我们与几种常见的深度网络模型进行了对比,结果证明我们的模型在自建的化妆品标准数据集上的F1值比其他模型高了3.9%~12.1%,进一步验证了模型的有效性和合理性。  相似文献   

10.
[目的/意义]提出一种农业领域的本体构建方法(手工+机器学习法),构建番茄病虫害的领域本体,旨在为番茄病虫害信息检索系统、诊断系统等平台的开发提供支撑.[方法/过程]首先,利用叙词表、文献资料确定本体类及层次和属性,构建初始本体框架;其次,通过机器学习从文献资料和网页信息中抽取相关实例;最后,通过本体描述语言将本体类、...  相似文献   

11.
在分析工程文本中命名实体实际特征的基础上,提出一种基于CRF与规则相结合的工程领域命名实体识别方法。在完善用户词典并对文本进行分词后,以短语级的粒度为原则从中确定特征,将文本交由CRF算法进行处理;分析CRF的处理结果,根据语言学规律及工程文本特点编写规则,对CRF处理结果进行优化。实验表明,该方法的全局F1值能够达到93.45。  相似文献   

12.
徐飞  宋英华 《科研管理》2018,39(7):131-138
对食品安全事件当中的实体进行分析和识别,不仅有助于人们加深对食品安全事件的了解,而且有利于管理者应对食品安全事件。以食品安全事件的新闻报道文本为语料,通过系统地统计和分析人名和机构名的内部与外部特征,在制定的含有多个特征的识别模板的基础上,基于条件随机场模型,本文完成了对食品安全事件当中的机构名和人名这两个命名实体进行识别的任务。通过与最大熵模型的测试结果进行比较,实验表明条件随机场模型的整体性能比较突出,取得了较好的准确率和召回率。  相似文献   

13.
[目的/意义]为了帮助情报学学科背景的就业人员掌握市场对情报学人才的具体需要,为情报学的教育者拟定情报学的教育体系和人才培养的目标提供指导。[方法/过程]采集国内各大招聘网站情报学相关职位招聘公告,构建情报学招聘语料库,基于CRF机器学习模型和Bi-LSTM-CRF、BERT、BERT-Bi-LSTM-CRF深度学习模型,从语料库中抽取5类情报学招聘实体进行挖掘分析。[结果/结论]通过在已有2000篇经过标注的职位招聘公告语料库上开展情报学招聘实体自动抽取对比实验,识别效果最佳的CRF模型的整体F值为85.07%,其中对"专业要求"实体的识别F值达到了91.67%。BERT模型在"专业要求"实体识别任务中更是取得了92.10%的F值。使用CRF模型对全部符合要求的5287篇招聘公告进行实体抽取,构建了情报学招聘实体社会网络,并通过信息计量分析与社会网络分析的方式挖掘隐含知识。  相似文献   

14.
彭玉芳  陈将浩 《情报科学》2022,39(1):141-147
【目的/意义】从海量的学术文献内容中,抽取科研人员所需要的目标数据,一方面有助于提高研究者的科 研效率,另一方面有利于改善目前文献数据库的检索服务。【方法/过程】根据科研人员的学术需求,首先通过深度 学习方法从大量的学术文献中抽取目标数据。其次使用NER和TF-IDF抽取目标数据的“5W”规则,接着对目标 数据做第二层需求规则过滤,凡是满足“5W”规则的数据,被鉴定为目标数据。最后对目标数据做第三层人工校 验,最终生成学术文献“目标数据”。【结果/结论】本文构建的学术文献“目标数据”抽取模型的准确率可达0.88,再融 合“5W”规则的过滤和最后的人工校验,不仅有利于提高科研工作者的学术文献查准率,而且一定程度上辅助文献 数据库机构的检索工作。【创新/局限】深度学习与需求规则融合,实现学术文献的检索结果从学术文献的题录信息 层面到进入学术文献内容的数据层面。  相似文献   

15.
16.
[目的/意义]围绕图书功用分类问题,提出开展图书功用自动化分类研究,并融合预训练和深度学习方法进行实现方案设计,为图书功用属性揭示和信息组织提供参考。[方法/过程]文章基于功用视角进行图书分类体系调研与数据验证,构建图书功用分类体系框架。在此基础上,融合BERT预训练模型和BiLSTM模型构建图书功用分类模型,并基于大规模数据集进行实验验证。[结果/结论]实验结果显示,模型的准确率达到0.89以上,召回率达到0.87以上,总体效果相对较好,能够较为准确地实现图书功用特征的提取。  相似文献   

17.
叶佳鑫  熊回香  孟璇 《情报科学》2023,41(1):166-173
【目的/意义】通过深度学习方法对图书评论进行细粒度挖掘,并基于挖掘结果优化图书间相似度计算结果。【方法/过程】首先从在线书评网站上采集图书评论,对评论进行词性分析构建属性词表,随后基于属性词表对评论进行类型标注,通过BERT-BiLSTM模型对标注数据进行学习以实现评论自动分类,最后通过BERT对分类后的评论进行向量表示,通过余弦相似度计算评论间的相似度以表征图书相似度。【结果/结论】本文构造的BERT-BiLSTM评论分类模型准确率、召回率和F1值分别达到0.922、0.921和0.921,可以较好地实现评论分类。通过模型将评论划分为文笔、人物、情节、概要、读者态度5种类型来计算图书间相似度可以得到较为契合的相似度结果。【创新/局限】相较于其他类型的评论,通过人物与情节类评论计算图书相似度的效果有待提高。以后可对这两类评论进行更为细粒度的分析。  相似文献   

18.
[目的/意义]智慧医养由医养结合演进而来,是交叉融合智慧养老和智慧医疗而成的新兴理念,在我国社会老龄化程度不断加深的当下,智慧医养将成为应对老年人医疗、养老困境的新模式与新方法。目前,智慧医养的建设还存在顶层设计不足的问题,需要多部门跨领域共同推进,在信息技术被广泛运用的当下,不同部门间围绕智慧医养开展的事务协同主要体现为政务信息协同。[方法/过程]为了加强我国智慧医养顶层设计中各参与主体间的政务信息协同,文章综合采用命名实体识别和社会网络分析方法,识别出面向智慧医养顶层设计的政务信息协同这一社会网络结构的节点(即政府部门与群众组织)与节点关系(即不同政府部门与群众组织间的政务信息协同关系),进而对面向智慧医养顶层设计的政务信息协同网络结构进行识别与分析。采用度中心性分析方法测度节点影响力,采用k-plex方法分析节点关系影响力,在此基础上识别出面向智慧医养顶层设计的政务信息协同网络结构的优化路径,并对其进行仿真研究。[结果/结论]研究表明,现阶段我国面向智慧医养顶层设计的政务信息协同网络结构共含有22个节点和208组节点关系。该社会网络结构的优化路径为强化国家发展和改革委员会与工业和...  相似文献   

19.
[目的/意义]旨在量化开放获取在推动论文可见性、知识传播时效性和科学发展中所起的作用。[方法/过程]收集了2013—2018年发表于《图书情报工作》上的2849篇论文的引文数据,首先宏观对比了每年发表的OA与非OA论文的发文量和引文量,之后基于细粒度的方法从论文点击量、起步三年的引文情况和以“月”为单位的首次被引用所需时间3个方面具体探究了OA论文的特征与产生优势的原因。[结果/结论]分析结果验证了OA论文具有引用优势,该优势不仅具有持续性而且在扩大,混合期刊中OA论文的比重也在上升。同时OA论文比非OA论文点击下载量高,首次被引速度快,在起步时响应高效。  相似文献   

20.
基于深度学习模型的摘要结构功能识别方法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号