首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
刘佳  边俊伊 《现代情报》2023,(11):37-46
[目的/意义]针对藏医古籍知识组织与开发不足的问题,利用混合深度学习方法构建面向藏医古籍的命名实体识别模型,为藏医古籍知识的深度开发与利用提供方法支持。[方法/过程]根据藏医古籍知识特点,构建ALBERT-BiLSTM-CRF模型。以《四部医典》为数据集,在人工标注与文本预处理的基础上,进行命名实体识别实验,并将实验结果与其他3种常见模型进行对比分析。[结果/结论]ALBERT-BiLSTM-CRF模型对藏医古籍实体识别效果最好,F1-score达到96.28%,与其他方法相比提升约7个百分点。  相似文献   

3.
命名实体识别(Named Entity Recognition)是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等.首先对我国关于命名实体识别研究的文献进行了总结,给出命名实体识别的主要方法及模型.并针对文献中对这些命名实体识别方法的效果进行统计分析,探讨各种识别对象、识别模型的效果及适用性.经过对现有研究文献的统计,结论为:在不考虑运行效率的情况下,对于机构名,识别效果最好的是层叠CRF模型;对于地名,测试效果最好的是CRF方法与专家知识相结合;人名识别方法中表现不错的则是边界模版和局部统计相结合的模型.  相似文献   

4.
王仁武  孟现茹  孔琦 《现代情报》2018,38(10):57-64
[目的/意义]研究利用深度学习的循环神经网络GRU结合条件随机场CRF对标注的中文文本序列进行预测,来抽取在线评论文本中的实体-属性。[方法/过程]首先根据设计好的文本序列标注规范,对评论语料分词后进行实体及其属性的命名实体标注,得到单词序列、词性序列和标注序列;然后将单词序列、词性序列转为分布式词向量表示并用于GRU循环神经网络的输入;最后输出层采用条件随机场CRF,输出标签即是实体或属性。[结果/结论]实验结果表明,本文的方法将实体-属性抽取简化为命名实体标注,并利用深度学习的GRU捕获输入数据的上下文语义以及条件随机场CRF获取输出标签的前后关系,比传统的基于规则或一般的机器学习方法具有较大的应用优势。  相似文献   

5.
基于规则和统计相结合的中文命名实体识别研究   总被引:3,自引:0,他引:3  
潘正高 《情报科学》2012,(5):708-712,786
介绍命名实体识别在文本信息处理领域的重要地位,分析了中文命名实体识别存在的困难,介绍中文命名实体识别的一般过程、评价标准及方法。提出了一种在构造内部规则和外部规则的同时采用概率统计的中文命名实体的识别方法,并利用这种基于规则和统计相结合的方法。实验证明该方法获得了较高的准确率和召回率,具有可行性和合理性,同时也指出了它的局限性。  相似文献   

6.
7.
[目的/意义]菊花古典诗词的命名实体识别有助于深度挖掘菊花诗词文本之间的关联,传承菊花文化,助力菊花产业及乡村文化旅游,同时也为其他花卉诗词的文本深度挖掘提供了思路。[方法/过程]文章通过网络、论文和书籍进行菊花古典诗词数据的采集,重点选择诗词中涉及的时间、地点、季节、花名、花色、人物和节日7类命名实体进行标注和识别,得到BiLSTM、BiLSTM-CRF和BERT模型不同识别结果,并与CRF模型识别结果进行对比。[结果/结论]BERT模型在菊花古诗词文本的命名实体识别中表现优异,实体识别的调和平均数高于其他模型,最优调和平均数达到91.60%。BERT模型可用于菊花古诗词文本的深层次挖掘研究,并可向更多的花卉诗词扩展,古诗词文本的命名实体标注体系可以为后续研究提供借鉴。  相似文献   

8.
命名实体是文本中基本的信息元素,是正确理解文本的基础。命名实体识别就是要判断一个文本串是否代表一个命名实体,并确定它的类别,即发现命名实体和标注命名实体。利用了隐马尔可夫模型(HMM,Hidden Markov Model)和改进的隐马尔可夫模型进行英文命名实体的识别。  相似文献   

9.
任妮  鲍彤  沈耕宇  郭婷 《情报科学》2021,39(11):96-102
【 目的/意义】开展面向领域的细粒度命名实体识别研究对于提升文本挖掘精度具有重要的意义,本文以番 茄病虫害命名实体为例,探索采用深度学习技术实现面向领域的细粒度命名实体识别研究方法。【目的/意义】文章 以电子书、论文、网页作为数据源,选择品种、病虫害、症状、时间、部位、防治药剂六类实体进行标注,利用BERT和 CBOW 预训练字向量分别输入 BiLSTM-CRF 模型训练,并在识别后补充规则控制实体的边界。【结果/结论】 BERT预训练的字向量和BiLSTM-CRF结合,在补充规则控制后F值达到了81.03%,优于其它模型,在番茄病虫害 领域的实体识别中具有较好的效果。【创新/局限】BERT预训练的字向量可以有效降低番茄病虫害领域实体因分 词错误带来的影响,针对不同实体的特点,补充规则可以有效控制实体边界,提高识别准确率。但本文的规则补充 仅在测试阶段,并没有加入训练过程,整体的准确率还有待提高。  相似文献   

10.
丁晟春  方振  王楠 《现代情报》2009,40(3):103-110
[目的/意义] 为解决目前网络公开平台的多源异构的企业数据的散乱、无序、碎片化问题,提出Bi-LSTM-CRF深度学习模型进行商业领域中的命名实体识别工作。[方法/过程] 该方法包括对企业全称实体、企业简称实体与人名实体3类命名实体识别。[结果/结论] 实验结果显示对企业全称实体、企业简称实体与人名实体3类命名实体识别的识别率平均F值为90.85%,验证了所提方法的有效性,证明了本研究有效地改善了商业领域中的命名实体识别效率。  相似文献   

11.
基于认知科学的研究提出一个新颖的计算模型用于物体识别.特征整合理论为计算模型提供了总体路线.基于最大熵原理构建学习过程,获得必要的先验知识构成认知网络.利用认知网络,将底层的图像特征和高层知识捆绑起来.利用条件随机场的基本概念和原理建模捆绑过程.将计算模型应用于现实世界的物体识别,在标准图像库上进行评估,取得了很好的效果.  相似文献   

12.
针对“互联网 ”的核心理念,构建食品安全管理中“互联网 ”行为的演化博弈模型,探讨“互联网 ”行为策略的演化机制及其影响因素。研究发现:各行为主体选择“互联网 ”行为的概率与投入产出比、正常收益呈正相关关系,与成本、“搭便车”收益呈负相关关系,并且政府的激励机制和约束机制,可以提高行为主体选择“互联网 ”行为的概率。最后提出促进“互联网 食品安全管理”实施的对策建议。  相似文献   

13.
根据国内外文献综合分析、大量调研及专家访谈,提出诱发供应链环境下食品质量安全风险传导的九大关键动因。在此基础上,利用ISM技术,构建食品供应链质量安全风险传导动因的五级递阶结构模型,从而清晰表征各种风险传导动因之间相互影响的等级层次关系。进而揭示驱动食品质量安全风险在食品供应链上进行传导的最直接动因和最根本动因,同时还可以清楚地看出各诱发动因对食品质量安全风险传导后果影响的作用路径。  相似文献   

14.
李欣  温阳  黄鲁成  苗红 《科研管理》2021,42(1):20-32
研究前沿是科技创新过程中最具潜力和前瞻性的研究方向,尽早识别研究前沿对科学研究、企业研发资源优化配置、政府创新战略前瞻部署等至关重要。针对目前在研究前沿识别研究中存在的不足,提出一种基于机器学习的研究前沿识别方法。该方法首先通过构建机器学习模型来识别出潜在高被引论文,解决利用引文分析法来识别研究前沿的时滞性问题,并将潜在高被引论文纳入研究前沿识别的高被引论文核心文档集中;其次,以高被引论文核心文档集为数据源,利用聚类分析法识别出研究前沿主题,并对研究前沿主题进行对比和评价分析,进而识别出研究前沿;最后,以太阳能光伏电池研究领域为例进行了实证研究,验证了该方法的可行性和有效性,为研究前沿识别提供了新的研究方法。  相似文献   

15.
本文研究对象为汉语中较为复杂的兼语结构,通过对大规模语料中兼语结构的分布观察,进行其内部语言特征及外部语言特征分析;一是从定量角度对其结构研究提供数据支持,二是为计算机自动识别提供语言学支持。基于这些特征建立模板,从而构建条件随机场模型,对兼语结构进行自动识别。在开放训练中,F值最高可达85.71%,这个结果表明条件随机场在兼语结构识别中已经接近应用水平,可以作为兼语结构识别的有效方法。  相似文献   

16.
从食品供应链的视角出发,提出食品质量安全风险的概念及内涵。采用内容分析法,根据国内外文献分析、实际调研及专家访谈的结果,探究供应链视角下的食品质量安全风险因素及其产生根源。在此基础上,利用ISM技术,建立风险因素结构模型,给出供应链视角下的食品质量安全风险因素之间的相互影响关系,进而揭示供应链视角下食品质量安全风险的生成机理。该研究成果将有助于进一步拓展供应链环境下食品质量安全风险演变规律的理论研究与实践应用。  相似文献   

17.
马颖  丁周敏  张园园 《科研管理》2015,36(6):168-176
网络已经成为人们日常生活中必不可少的发布和获取信息的渠道,越来越多的消费者依靠网络获取突发事件的相关信息,因此,网络舆情在推动突发事件发展的过程中越来越重要。本文基于传染病模型理论,构建了食品安全事件网络舆情传播演变中的模仿传染模型,研究网民在食品安全事件网络舆情传播中的模仿传染机理和行为,并以双汇"瘦肉精"事件为例,对模型进行仿真以验证模型的正确性,以期为食品安全事件利益相关者正确应对网络舆情演变过程中网民的传染行为提供决策参考。  相似文献   

18.
孟超  胡健 《科研管理》2016,37(8):153-160
本文从资源、供需、运输、灾害、环境、市场六个方面构建涵盖供给安全和使用安全在内的煤炭安全评价体系,应用BP神经网络进行中国煤炭安全评价的实证分析。研究发现:凭借BP神经网络在能源等非线性复杂系统高效的仿真能力和逆向输出的优势,仿真训练结果准确率高,模拟预测简便易行。虽然丰富的资源储量和较高的自给水平确保了煤炭的供给安全,但CO2和SO2排放造成严重的环境问题和温室效应,使得使用安全仍是煤炭安全需要关注的焦点。今后,需要在降低煤炭在能源结构中的比重,提升电煤消费份额,大力发展洁净煤技术等方面采取有效的应对措施。  相似文献   

19.
基于安全大数据的安全科学创新研究探讨   总被引:1,自引:0,他引:1  
为明晰大数据对安全科学发展的影响,从而把握大数据背景下的安全科学研究与发展方向,提出安全数据与安全大数据的概念。提炼基于安全大数据的安全科学研究的核心原理,分析安全大数据对安全科学研究的影响,构建并解析基于安全大数据的安全科学研究的基本范式体系。在此基础上,基于安全大数据对安全科学学科体系调整提出构想,提出安全大数据学的概念,并构建基于安全大数据的三维结构模型,指出安全大数据学的主要研究内容。结果表明:基于安全大数据非常有助于研究宏观安全规律,安全大数据学的产生是大势所趋,其主要研究内容包括安全大数据应用基础与安全大数据应用实践。  相似文献   

20.
采用文献计量学方法,以SCI数据库收录的2004-2013年食品安全研究期刊论文为数据源,对食品安全研究领域的高发文国家、机构、核心期刊、基金资助等情况进行定量分析;进一步利用社会网络分析法,构建高频关键词共现网络,探讨国际食品安全研究热点。研究结果显示,我国基金机构对食品安全研究的资助力度较高,但与欧美等发达国家拥有一些企业和企业家等机构进行科研资助的模式相比,资助来源相对单一;高频关键词网络连通性良好,"food"和"risk"是食品安全研究领域的中心点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号