首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
谭荧  唐亦非 《情报科学》2020,38(4):23-27
【目的/意义】将知识抽取的粒度细化到知识构成的最小单元--知识元,能提高知识获取的效率和精准度。【方法/过程】本文利用命名实体识别和事件抽取技术,探索了在科学文献中自动抽取事实知识元的方法。【结果/结论】实验结果表明,该方法能有效识别科学文献中的事实知识元,自动抽取效果出色。  相似文献   

2.
【目的/意义】构建一个面向上市公司公告的篇章级信息抽取框架,实现多种类型信息的抽取,并服务于投 资和监管。【方法/过程】以深圳A股市场公告中的635篇并购重组公告为例,从中抽取了交易信息和公司财务指标 等信息,对框架和方法进行验证。【结果/结论】运用本文所提框架和方法实现的字段抽取准确率为87.6%,效果较 好。本文提出的信息抽取框架及方法在上市公司公告信息抽取中是有效的,可以为投资者的投资决策和监管机构 的监管提供数据基础。  相似文献   

3.
【目的/意义】突发事件通过互联网形成网络舆情,网络舆情又将突发事件反复发酵,使突发事件舆情信息 生态链系统得以演化。【方法/过程】基于信息生态链理论构建突发事件舆情信息生态链系统,分析其系统构成要 素,利用协同学理论及系统动力学方法,阐述突发事件舆情信息生态链系统的协同演化机理。【结果/结论】提出突 发事件舆情信息生态链系统的治理策略。  相似文献   

4.
【目的/意义】面对海量的信息,人们需要更为高效准确的信息获取方式。数值信息抽取的研究使隐含在无 序信息载体中的大量有价值数值信息可以得以利用,从而满足科研工作者数据驱动型研究的信息需求。【方法/过 程】本文旨在总结和归纳数值信息抽取研究的相关内容,包括数值信息抽取的内涵、数值信息抽取研究概况、面临 的困境和制约因素以及应用等。【结果/结论】数值信息抽取仍然面临着巨大的挑战,且现有的数值信息抽取研究较 少,对于数值信息的抽取,基于规则和统计学习的方法各有利弊,总体来说,基于规则的抽取方法仍是主流方法。  相似文献   

5.
【目的/意义】对南海历史事件中具有标识意义的事件要素进行提炼与梳理,是构建南海大事记、讲好中国南海故事的基础。【方法/过程】首先总结南海历史事件的特殊性,进而论述南海叙事的具体维度,在此基础上定义事件要素划分标准实现对南海历史事件的规范建模,接着提出了一种结合规则与深度学习的事件要素自动抽取方法,最后以南海相关学术论文为对象,通过实证研究验证了该方法的有效性及效率。【结果/结论】研究表明,BERT+BiLSTM+CRF模型表现优于其它对比模型,宏观F1值达到87.73%;通过规则约束优化BERT+BiLSTM+CRF模型后,宏观F1值达到88.76%,取得了不错的效果,在面向泛化南海历史事件文本时能快速、有效地抽取出各类型事件要素实例。【创新/局限】结合南海历史事件的特征,探索了面向多维度南海叙事的事件要素自动抽取方法,实现学术论文中各类型事件要素的抽取,后续有待在更多文献资料类型上进行泛化实验。  相似文献   

6.
李枫林  柯佳 《情报科学》2018,36(3):169-176
【目的/意义】从大量非结构化文本中抽取出结构化的实体及其关系,是优化搜索引擎、建立知识图谱、开发 智能问答系统的基础工作。【方法/过程】介绍了深度学习框架下不同神经网络模型实现实体关系抽取的方法,比较 了各种模型的优劣势,结合远程监督和注意力机制进一步提高关系抽取性能,最后指出了深度学习模型的不足及 未来发展方向。【结果/结论】实验发现,卷积神经网络擅长捕获句子局部关键信息,循环神经网络擅长捕获句子的 上下文信息,能反映句子多个实体之间的高阶关系,递归神经网络适合短文本的关系抽取。如果模型能结合自然 语言的先验知识,实体关系抽取将会取得更好的效果。  相似文献   

7.
廖建军 《情报科学》2018,36(7):123-129
【目的/意义】为给数字出版知识服务系统提供高质量的文本语料以供知识抽取,本文提出了基于标签样式 和密度模型来抽取网页正文的方法。【方法/过程】该方法先根据标签样式将网页文本进行分块,再根据各块文本内 容的文本密度、标点密度、非超链接密度计算出综合密度,最后通过阈值判断抽取出网页中信息含量高的正文。【结 果/结论】该方法简单高效无需人工编写规则或训练,能完整地抽取出网页正文。通过随机选取新闻网页进行实 验,结果表明该方法能有效地自动抽取网页正文,适用于不同设计风格的网站,而且准确率和召回率优于基于统计 的 CEPR抽取方法。  相似文献   

8.
【目的/意义】分析大数据背景下农业科技信息传递联动机制,有助于提升农业科技创新与成果转化协同能 力和运行效率。【方法/过程】从农业科技信息传递中面临的现实问题出发,探讨在大数据背景下农业科技信息有效 传递的历史机遇,分析基于大数据背景农业科技信息传递的联动机制与路径选择。【结果/结论】提出完善农业科技 信息传递联动机制的政策建议.  相似文献   

9.
明海  杨晓农 《情报科学》2022,40(9):130-136
【目的/意义】提高科技服务机构创新供给能力评价的指标合理度和结果准确率。【方法/过程】提出基于事 件树的科技服务机构创新供给能力评价方法,通过事件树分析法从技术创新能力、经济效益、未来发展潜力、示范 带动能力和产能利用状况五方面组建合理度较高的科技服务机构创新供给能力评价指标体系,采用网络分析法构 建科技服务机构创新供给能力评价模型,实现科技服务机构创新供给能力的评价。【结果/结论】实验结果表明,所 提方法选取的评价指标临界比率值、峰度系数和偏度系数都控制在合理的范围内,可以对科技服务机构创新供给 能力进行有效评价。【创新/局限】本文提出基于事件树的科技服务机构创新供给能力评价方法,选取了合理性较高 的评价指标,提高了评价结果的准确性,将有效推进区域经济的可持续发展。本文方法的局限性在于研究对象的 全面性不足,未对具有一定代表性的行业性信息机构进行创新供给能力评价,评价结果存在一定偏向性。  相似文献   

10.
陈震  王静茹 《情报科学》2020,38(4):51-56
【目的/意义】目前网络舆情事件与社会稳定密切相关,其中定量计算方法在网络舆情事件分析中占有重要地位。【方法/过程】本文提出了一种基于贝叶斯网络(Bayesian Network下文简称BN)分析网络舆情事件趋势的方法。先根据先验知识和专家指导设计BN拓扑结构;再利用EM算法推算条件概率表;最后通过训练集和测试集的方法检验BN的有效性。【结果/结论】本文以随机抽取的2018年100件网络舆情事件为数据源进行实验,结果表明本文设计的BN在预测网络舆情事件趋势方面是可靠的。这为基于BN处理网络舆情事件提供了一定理论依据。  相似文献   

11.
【目的/意义】本文提出了借助知识图谱的知识互联和可视化分析等功能,为公共危机事件智能治理提供知 识支撑的观点。【方法/过程】以“港独”为例,从新华网、人民网、中国新闻网等“港独”新闻语料中抽取实体,构建公 共危机事件知识图谱模型。从知识图谱本体构建和实体数据填充两个方面,对“港独”知识图谱的实体抽取、关系 抽取、知识融合、知识加工和知识推理等构建环节进行重点论述和实践,最后,利用Neo4j数据库实现知识存储,生 成的“港独”知识图谱。【结果/结论】通过Cypher语句对“港独”知识图谱进行查询,能够呈现可视化语义网结构图, 利于知识隐重发现。【创新/局限】本文的创新之处在于把知识图谱技术应用于公共危机事件治理中,为其智能查 询和决策分析提供数据支持。在今后实践中,数据源的选取不必局限于网络新闻语料,还可以适当对“港独”人员 的微博、微信、论坛中的信息进行采集和抽取,以此扩大知识关联,从而更为全面、高效地进行公共危机事件智能 治理。  相似文献   

12.
【目的/意义】科技智库是驱动科技创新的有力支撑,及时感知科技智库研究现状与动向,对于把握科技智库运作态势、发挥服务科技战略决策功能具有重要意义。【方法/过程】文章基于文献调研的方法,围绕科技智库研究进行述评。从科技智库理论基础、研究方法、数据信息保障、知识与情报服务、传播力与影响力、经验借鉴与建设探索等方面进行系统性回顾,总结当前国内研究现状,并对未来科技智库研究作出建议及展望。【结果/结论】建议今后深化智库方法探索,重视数据信息资源建设,提升科技智库服务能力,并健全科技智库评价体系,同时推动理论研究成果的应用。【创新/局限】系统梳理了我国科技智库研究的脉络与现状,未来将跟进对国外科技智库研究的追踪与探讨。  相似文献   

13.
【目的/意义】将双链区块链技术纳入突发公共卫生事件信息共享研究范畴对推进我国突发公共卫生管理体系和能力现代化建设具有重要价值。【方法/过程】通过深入分析双链区块链融入突发公共卫生事件信息共享的赋能机理,从数据存储层、网络共识层、智能合约层和服务应用层四方面构建了基于双链区块链赋能的突发公共卫生事件信息共享模型,并以疫情下某医疗机构信息共享为例分析其运行机理,最后分析了其面临的挑战风险。【结果/结论】本研究为解决突发公共卫生事件信息共享难题、提升我国疫情防控应急管理水平提供了一定的理论基础支撑和科学决策支持。【创新/局限】本研究结合双链区块链和突发公共卫生事件信息共享之间的天然耦合性,提供了双链区块链赋能突发公共卫生事件信息共享的全新视角,但缺乏具体的实际案例进行分析。  相似文献   

14.
【目的/意义】随着Web网页的爆炸式增长和网页噪声不断增多,企业竞争情报系统和智能化网站的开发 以及移动终端的阅读都急需一种可以高效精确抽取网页信息的方法。【方法/过程】本文提出了基于重复模式识别 的信息提取新方法,通过页面解析、相似度计算、聚类并形成群组、删除横幅广告和导航链接等步骤,提取到了详情 页面的标题和主要内容。【结果/结论】对于结构稳定的页面,本文实现了较高质量的信息抽取。不足之处是聚类和 相似度的计算量较大,时间较长。  相似文献   

15.
【目的/意义】为准确抽取科技文献中的方法知识元,实现科技文献更细粒度知识组织和检索。【方法/过程】 本研究提出一种基于规则的方法知识元抽取方法,该方法主要分为两个阶段:方法知识元初始描述规则半自动化 识别阶段和方法知识元及其描述规则自动化抽取和更新阶段。第一阶段根据方法知识元的特征,以人工—机器相 结合的方法识别方法知识元的组成维度及初始描述规则。第二阶段依据第一阶段识别的方法知识元初始描述规 则,自动从科技文献中提取方法知识元,并基于PreFixSpan算法从新识别的方法知识元中挖掘出新的方法知识元描 述规则,以实现方法知识元及其描述规则的动态更新。【结果/结论】在对16篇科技文献的初步评估中,实验结果P、 R以及F值分别为0.71、0.80和0.73(均>0.5)表明该方法的可行性和有效性,该抽取方法对更细粒度的知识组织和 检索也有一定借鉴作用。【创新/局限】方法的局限性在于需要一定的人工参与方法知识元描述规则的提取。  相似文献   

16.
钱晨  黄卫东 《情报科学》2019,37(2):46-51
【目的/意义】明析事件态势发展对于事件的监视与调控有重要意义,事件态势通过事件的某些属性体现。 【方法/过程】本文引入信息论中信息量的概念,定义超信息,并扩展为扩展超信息并以此为标建立微博事件态势感 知模型。在数据集上使用该模型,将统计结果与以微博条数为标的态势比较。【结果/结论】该模型可以清楚地提取 出事件的重要信息增长点,并有效滤除大量无用重复的微博对事件态势的评估。  相似文献   

17.
【目的/意义】旨在从网络舆情用户信息及文本内容视角出发,构建不同维度的网络舆情主题图谱,结合主 题图谱对网络舆情进行特征演化及可视化分析,为舆情管理提供参考。【方法/过程】本文以实体抽取和关系构建技 术为基础,构建了网络舆情主题图谱模型,并以“台风利奇马”事件为例,建立了三个不同维度的主题图谱,结合用 户和文本等多维度微观数据,对网络舆情特征演化进行分析。【结果/结论】在该事件中,用户影响力节点具备多元 化、相关性、官方主导性等特点;网络舆情演化对应台风事件发展存在一定的滞后性;PC终端存在传播媒介种类少、 发博数量多且用户集中等特点,移动终端存在传播媒介种类多、发博数量少且用户分布均匀等特点。【创新/局限】 本文借助主题图谱,构建了网络舆情用户节点和文本节点及其关联关系,从用户、账户、内容三个维度系统且全面 的展示了网络舆情特征的演化规律。  相似文献   

18.
柯佳 《情报科学》2021,39(10):165-169
【目的/意义】实体关系抽取是构建领域本体、知识图谱、开发问答系统的基础工作。远程监督方法将大规 模非结构化文本与已有的知识库实体对齐,自动标注训练样本,解决了有监督机器学习方法人工标注训练语料耗 时费力的问题,但也带来了数据噪声。【方法/过程】本文详细梳理了近些年远程监督结合深度学习技术,降低训练 样本噪声,提升实体关系抽取性能的方法。【结果/结论】卷积神经网络能更好的捕获句子局部、关键特征、长短时记 忆网络能更好的处理句子实体对远距离依赖关系,模型自动抽取句子词法、句法特征,注意力机制给予句子关键上 下文、单词更大的权重,在神经网络模型中融入先验知识能丰富句子实体对的语义信息,显著提升关系抽取性能。 【创新/局限】下一步的研究应考虑实体对重叠关系、实体对长尾语义关系的处理方法,更加全面的解决实体对关系 噪声问题。  相似文献   

19.
李春杰  马建玲 《情报科学》2019,37(4):157-164
【目的/意义】图情领域在数字资源发现、组织与应用中越来越多使用到信息抽取技术,本文将对该领域在 信息抽取技术方面的研究进展及应用情况等进行分析,为本领域相关人员提供参考。【方法/过程】以国内图书馆 学、情报学领域中国核心期刊和国外33种图情期刊为信息源对其中刊载的信息抽取相关研究成果进行计量分析, 检索过程不设置时间限制,并利用CNKI、EndNote、Excel、Python分析工具对主题相关的165篇中文文献和35篇外 文文献进行年度趋势分析、期刊发文量分析、机构分析、作者分析以及论文主题分布研究。【结果/结论】得出图情领 域信息抽取研究的发展趋势、重要的信息源、重要作者、主题研究以及信息抽取技术在图情领域的具体应用。  相似文献   

20.
【目的/意义】本世纪以来,非典、新冠肺炎疫情等重大公共卫生事件频发,危及人民生命财产安全。重大公共卫生事件相关信息复杂多样,其应对是一个多阶段多主体协同的决策过程。重大公共卫生事件协同决策方法是国家公共卫生治理和疫情防控体系建设的重要内容。【方法/过程】在总体国家安全观下,本文将决策实验室分析法(DEMATEL)和后悔理论融入案例推理过程,提出一种基于案例推理的重大公共卫生事件协同决策方法,为重大公共卫生事件应急情报分析与智能决策平台建设提供方法和技术手段支撑。【结果/结论】案例研究结果证明,所提方法在应急决策中具有较好的效果,反映了决策过程中决策者的心理行为给决策结果带来的影响,并提高了突发公共卫生事件应急管理决策的科学性。【创新/局限】未来随着历史案例的增加,在重大公共卫生事件应急决策过程中可用案例信息更加丰富,综合考虑多个历史案例信息进行决策可能会获得更好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号