首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
[目的/意义]面向藏医学专业研究人员和医疗工作者的科研需求,探索实现藏医古籍知识组织与服务的实现路径,设计藏医古籍服务平台的知识服务功能。[方法/过程]在设计藏医古籍知识本体模型与知识图谱的基础上,探索知识检索、知识推理、知识推送3种服务功能在藏医古籍知识服务中的应用。[结果/结论]研究显示,将人文计算等智能算法应用于藏医古籍知识的处理,能够为用户提供更加精准和高效的知识服务,以充分发掘与利用藏医古籍的活力与价值。  相似文献   

2.
丁晟春  方振  王楠 《现代情报》2009,40(3):103-110
[目的/意义] 为解决目前网络公开平台的多源异构的企业数据的散乱、无序、碎片化问题,提出Bi-LSTM-CRF深度学习模型进行商业领域中的命名实体识别工作。[方法/过程] 该方法包括对企业全称实体、企业简称实体与人名实体3类命名实体识别。[结果/结论] 实验结果显示对企业全称实体、企业简称实体与人名实体3类命名实体识别的识别率平均F值为90.85%,验证了所提方法的有效性,证明了本研究有效地改善了商业领域中的命名实体识别效率。  相似文献   

3.
丁浩  孔令圆  刘清  胡广伟 《现代情报》2023,(11):135-145
[目的/意义]本文针对农业领域提出一种基于融合多重特征词嵌入模型的农业命名实体识别方法,以提高识别准确度。[方法/过程]通过使用结合字符、位置语义、领域知识字典特征等多重特征向量作为嵌入层,充分考虑字符的位置信息和上下文语义信息,并根据农业领域的中文实体的特点改进了单一字符向量嵌入,获得更多的农业实体特征,同时采用双向长短时记忆网络BiLSTM和多头注意力机制来学习文本的长距离依赖信息,再利用条件随机场CRF获得全局最优标注序列。[结果/结论]本文在农业领域中文实体语料数据集中与9种基于基线方法进行对比实验,模型的Precision为92.2%,Recall为92.0%,F1值为92.11%,均优于其他基线模型,说明本文模型对于中文农业命名实体识别更精确。  相似文献   

4.
[目的/意义]为挖掘旅游平台游记文本蕴含知识,协助旅游者高效获取符合需求的信息和知识,为制定旅游计划提供科学决策的信息支持。[方法/过程]首先面向用户需求提出基于布尔矩阵和集合逻辑改进Apriori算法的思路;然后融合命名实体识别实现了游记文本关联知识挖掘及聚合,构建了基于关联知识挖掘的个性化推荐服务模式,并以携程网中杭州相关的游记文本进行了实证研究。[结果/结论]研究发现,融合命名实体识别和改进的Apriori算法,能够有效挖掘游记文本蕴含知识,实验结果验证了在算法性能及结果上要优于传统Apriori算法,并能够根据挖掘结果向用户提供个性化推荐服务,协助旅行者科学、高效地制定旅游计划。研究结论丰富了游记文本挖掘的方法论,为旅游平台服务推荐优化提供了新的思路。  相似文献   

5.
[目的/意义]基于知识元理论对水书习俗非遗资源知识元进行知识抽取与组织,助力水书习俗非遗资源的开发与利用。[方法/过程]构建水书习俗非遗资源知识元语义描述模型,基于知识元语义模型与深度学习技术对水书习俗非遗资源进行知识元抽取,并对水书习俗非遗资源进行细粒度知识组织与可视化研究。[结果/结论]实现水书习俗非遗资源多维知识关联关系的揭示,促进了水书习俗非遗资源的传承、开发与利用。  相似文献   

6.
谭晓  李辉 《现代情报》2019,39(8):29-36
[目的/意义]面对科技创新演变的加剧和交叉融合加速的大环境,利用情报研究方法及其他学科方法准确识别科技前沿成为获取科技战略情报的重要任务。研究前沿不仅提供了对当前重点和未来趋势的预见,而且为政府决策提供了关键指标。[方法/过程]通过内容分析对当前研究前沿的识别框架、方法以及多元关系、深入内容层面分析方法的应用等现状进行总结,发现目前在研究前沿识别模型和方法中仍存在不足。[结果/结论]针对不足,结合多源数据进行知识融合初步设计了综合宏观和微观的前沿识别模型,将多实体和多关系融合应用到主题关联,利用图模型的社团结构识别和Clique所含信息进行主题表示;划分研究前沿类型并构建前瞻性指标体系,完成科技前沿的识别,以期更准确、高效、全面地识别科技前沿。  相似文献   

7.
[目的/意义]为了帮助情报学学科背景的就业人员掌握市场对情报学人才的具体需要,为情报学的教育者拟定情报学的教育体系和人才培养的目标提供指导。[方法/过程]采集国内各大招聘网站情报学相关职位招聘公告,构建情报学招聘语料库,基于CRF机器学习模型和Bi-LSTM-CRF、BERT、BERT-Bi-LSTM-CRF深度学习模型,从语料库中抽取5类情报学招聘实体进行挖掘分析。[结果/结论]通过在已有2000篇经过标注的职位招聘公告语料库上开展情报学招聘实体自动抽取对比实验,识别效果最佳的CRF模型的整体F值为85.07%,其中对"专业要求"实体的识别F值达到了91.67%。BERT模型在"专业要求"实体识别任务中更是取得了92.10%的F值。使用CRF模型对全部符合要求的5287篇招聘公告进行实体抽取,构建了情报学招聘实体社会网络,并通过信息计量分析与社会网络分析的方式挖掘隐含知识。  相似文献   

8.
[目的/意义]基于数字人文视角,以藏医学古籍《四部医典》为例,探索藏医学病症关系、病因关系、用药规律以及新处方挖掘路径,有利于藏医学古籍资源的开发与利用,从具体实践中帮助解读和传播少数民族医学资源。[方法/过程]本研究使用Python、Gephi等工具软件,按照文档识别与校对、文本分词与提取、数据分析处理、数据可视化、结果阐释的研究过程,对藏医学进行病症关系分析、病因关系分析、用药规律挖掘以及新处方预测分析。[结果/结论]相关的分析过程和结果有助于完成藏中医古籍知识发现路径,确定藏医学古籍内容挖掘的可行方法,为中医学古籍内容挖掘与知识发现提供新思路。  相似文献   

9.
刘春丽  陈爽 《现代情报》2023,(12):143-163
[目的/意义]科学文献中的知识实体的挖掘、利用与评价对知识发现、构建知识网络、探索知识之间潜在关联均具有重要意义。随着机器学习、深度学习和大语言模型的发展及其应用,相比最早的基于人工标注的知识实体抽取技术,如今已经发生了翻天覆地的变化;此外,近年来,学者对科学文献中知识实体的评价也进行一些探索,取得了较大进展。[方法/过程]在相关文献调研基础上,回顾并比较了基于人工标注的方法、基于规则的方法、传统机器学习、基于深度学习与大语言模型在知识实体抽取方面的优缺点,列举了相关数据集、软件与工具及相关专业会议;从提及频率、替代计量及其影响因素、实体共现网络及实体扩散/引文网络、基于知识实体的同行评议、基于知识实体的论文新颖性和临床转化进展五大方面,对知识实体的评价研究最新进展进行了归纳与整理。[结果/结论]针对目前存在的问题,建议在具体的知识实体抽取任务中,抽取方法选择应权衡多方面因素,再依此选择一个或多个模型完成实体抽取任务;在知识实体评价方面,应重视指标多样化、可靠性、有效性、系统性和规范化研究,关注对知识实体评价指标的影响因素、指标间相关关系与因果关系的实证分析,构建基于知识实体的论文评价...  相似文献   

10.
[目的/意义]实体语义关系分类是信息抽取重要任务之一,将非结构化文本转化成结构化知识,是构建领域本体、知识图谱、开发问答系统、信息检索系统的基础工作。[方法/过程]本文详细梳理了实体语义关系分类的发展历程,从技术方法、应用领域两方面回顾和总结了近5年国内外的最新研究成果,并指出了研究的不足及未来的研究方向。[结果/结论]热门的深度学习方法抛弃了传统浅层机器学习方法繁琐的特征工程,自动学习文本特征,实验发现,在神经网络模型中融入词法、句法特征、引入注意力机制能有效提升关系分类性能。  相似文献   

11.
彭博  童兆莉 《情报科学》2023,(3):100-108
【目的/意义】面对网络中大量由非结构化数据构成的文化遗产信息资源,如何从中抽取知识构建知识图谱并进行应用研究,是新媒体时代进行文化遗产知识深度利用的基础。【方法/过程】文章首先根据信息资源的内容与结构特征按照主题与类型进行分类,随后采用有针对性的关键词抽取方法获取概括信息资源主题的关键词,通过SPARQL检索在外部知识库中进行文化遗产信息资源的命名实体识别,最后利用词汇相似度算法依托本体进行知识融合,构建文化遗产信息资源知识图谱。【结果/结论】在实验中进行了网络文化遗产信息资源的知识抽取与知识图谱构建,利用深度学习进行文化遗产知识推理,开展了知识图谱的应用研究。研究结果表明文章方法能够充分利用网络中的文化遗产信息资源进行知识图谱构建,满足多种应用场景下分析需求。【创新/局限】由于文化遗产领域内容庞大,有关研究数据有待进一步扩充以更好的研究文章方法的适用性。  相似文献   

12.
[目的/意义]基于数据科学与情报学领域的密切联系,对数据科学任职要求知识进行深入挖掘,有利于掌握社会对于情报学相关领域人才的需求,从而完善情报学教育的培养方案,帮助实现社会需求与高校教育的良好对接。[方法/过程]文章采集了国内主流招聘网站中数据科学相关工作岗位的招聘信息,并对数据进行解析、去重等清洗工作,对招聘信息中的任职要求实体进行人工标注,比较了LSTM,BiLSTM-CRF和BERT三种深度学习模型应用于实体识别的效果。[结果/结论]结果表明,BiLSTM-CRF模型对任职要求实体的识别效果最好,相较于其他两种深度学习模型具有一定的优势。文章根据抽取出的任职要求实体从实践能力、学历要求、脚本语言、数据处理、综合素质等方面总结了目前情报学人才应当具备的技能和素质,并由此提出了针对情报学教育的人才培养方案。  相似文献   

13.
[目的/意义]反讽作为一种隐性而间接的情感表达方式,在社交评论中被广泛使用,正确识别用户的反讽情感对于网络平台和服务商具有重要意义。[方法/过程]文章基于深度学习构建多模态反讽识别模型,以在线旅游评论为例,运用深度学习模型分别提取文本、表情符号和图片的特征向量,通过不同的特征融合方式进行反讽识别。[结果/结论]通过与单模态反讽识别模型进行对比实验,发现文章提出的多模态旅游评论反讽识别模型在准确率、召回率等指标上的结果更优,验证了多模态模型比单模态模型反讽识别效果更佳的结论。  相似文献   

14.
王仁武  孟现茹  孔琦 《现代情报》2018,38(10):57-64
[目的/意义]研究利用深度学习的循环神经网络GRU结合条件随机场CRF对标注的中文文本序列进行预测,来抽取在线评论文本中的实体-属性。[方法/过程]首先根据设计好的文本序列标注规范,对评论语料分词后进行实体及其属性的命名实体标注,得到单词序列、词性序列和标注序列;然后将单词序列、词性序列转为分布式词向量表示并用于GRU循环神经网络的输入;最后输出层采用条件随机场CRF,输出标签即是实体或属性。[结果/结论]实验结果表明,本文的方法将实体-属性抽取简化为命名实体标注,并利用深度学习的GRU捕获输入数据的上下文语义以及条件随机场CRF获取输出标签的前后关系,比传统的基于规则或一般的机器学习方法具有较大的应用优势。  相似文献   

15.
彭博 《情报杂志》2022,(8):156-162+178
[研究目的]实体间关联关系是知识的基本载体,对网络文物信息资源中实体关系进行抽取是大数据环境下进行文物知识发现、绘制文物知识图谱的前提,也是文物信息资源开发利用需要解决的重要问题。[研究方法]针对网络文物信息资源结构化数据标准详实、实体关系特征明确、语言描述规范等特征,从知识库中查询实体关系并依照规则进行实体关系标注,利用元数据标准进行实体关系对齐,使用预训练语言模型获取字符特征,应用深度学习有关方法获取语义特征,进行了非结构化文物信息资源实体关系的抽取。[研究结论]研究表明,在与其他预训练语言模型及深度学习方法的关系抽取对比实验中,该方法的综合效率相对较高,并根据实体关系分类的不同进行特征挖掘,为文物信息资源的研究与推广提供了有益的参考。  相似文献   

16.
[目的/意义]从研究成果中抽取数据线索,进而构建针对特定主题的数据索引,有助于提升研究者查找数据的全面性。[方法/过程]以社会科学领域所有学科中文核心期刊中关于“COVID-19”论文的题录信息为例,分三步进行了探索。(1)随机抽取1000篇摘要进行人工标注,然后以此为基础使用自适应增强等模型训练分类器,进而使用分类器识别出使用了数据的论文。(2)从使用数据的论文摘要中标注出数据线索实体,进而使用隐马尔可夫、长短期记忆网络等模型进行实体识别。(3)使用Neo4j数据库,基于抽取出的数据线索与题录中的其他信息构建知识图谱。[结果/结论]在判断论文是否使用了数据的任务中,自适应增强模型的F1值最高,达到0.869。在数据线索实体识别任务中,隐马尔可夫模型的F1值最高,达到0.805。由抽取出的数据线索与论文关键词、作者、期刊等信息融合构建的知识图谱能够实现基于主题词查找数据线索、基于数据线索查找其他信息等应用。  相似文献   

17.
[目的/意义]针对在线医疗社区问答文本复杂程度高、结构化程度低的特点,结合卷积神经网络(CNN)和双向长短记忆神经网络(BiLSTM)两种深度学习模型以及条件随机场(CRF)模型,提出一套适用于在线医疗问答文本的实体识别方法并进行验证。 [过程/方法] 将问答文本进行清洗和BIO标注后,分别用CNN和BiLSTM进行字级别的特征抽取,将两种模型抽取到的特征进行融合,后放入CRF中训练出实体预测模型,再将问答文本放入训练好的模型中得到最终的实体识别结果。[结果/结论]在所选取的乳腺癌医疗社区问答文本数据集上,所提出的方法结果优于其他模型,且识别准确率达到92.3%,召回率达到89.3%,F值达到90.8%。  相似文献   

18.
[目的/意义]提出一种基于异质信息网络的电子政务平台治理辅助决策技术方法,提升电子政务平台建设绩效。[方法/过程]首先,在领域知识规范下,利用命名实体识别、关系抽取技术在委局级电子政务平台承载的多项目非结构化数据中获取项目相关的7类核心实体对象及其关系,进而表示出电子政务平台异质信息网络的网络模式并基于该模式完成实例化,得到电子政务平台的异质信息网络;其次,运用文章提出的MultiPathSim算法分别计算单个电子政务项目和平台中其他多个电子政务项目的相似度并将结果可视化;最后,利用统计分析方法得到平台中的项目实体概念间的关联关系。[结果/结论]利用数据挖掘新技术结合知识管理的方法针对电子政务平台治理的问题发现具有实际价值。文章提出的方法可以有效发现电子政务平台中的功能重复建设问题及多项目间的实体关联关系,为电子政务平台治理提供了一种有效的辅助决策技术方法。  相似文献   

19.
[目的/意义]虚假危机信息类型复杂,利益牵扯甚广,传播动机较为分散与隐蔽,有必要从溯源角度进行主体识别与动机叙事研究。[方法/过程]首先,在确定文本情感值、实体数、时序率、聚类簇与重叠量5个识别要素的基础上,设计深度隐晦语义理解、虚假危机信息判别、关联主体锁定与主体确证流程实现虚假危机信息传播主体识别功能,并通过画像对特征予以暴露。然后,以事理图谱为底座,在意图理解基础上构建动机叙事模型。最后,将两种方法糅合后开发自适应可视化操作界面以提升应用效率。[结果/结论]以“5·23卡塔尔立场声明”事件信息为例开展实证,结果表明此研究方法能够识别煽动型、造势型、转化型、侦查型与钳制型5种传播主体,动机分别集中在意见价值共鸣、宣扬自身力量、破除信息壁垒与渗透官方作业等方面。方法对比实验表明,文本设计较于其他方法具有更佳性能,然而仍有优化余地,如主体特征暴露与动机叙事粒度还有待提升。  相似文献   

20.
[目的/意义]随着大数据和人工智能时代的来临,基于数据驱动的医疗辅助决策以及医疗健康知识挖掘受到人们的极大关注。医疗知识图谱是医疗信息分析和知识服务的基础,在医疗人工智能和医疗信息检索中发挥着重要作用。[方法/过程]本文以医疗领域的实际应用需求为出发点,从医疗大数据获取、医疗实体及关系标注、医疗实体识别、医疗实体链接、医疗实体关系挖掘、中文医疗知识图谱表示和存储等关键技术入手,提出了多数据源融合的医疗知识图谱构建的理论框架。[结果/结论]面向医疗领域的知识图谱构建是一项非常重要的基础任务,同时也是人工智能领域的重要发展方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号