首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 296 毫秒
1.
基于规则的学术概念属性抽取   总被引:2,自引:0,他引:2  
学术文献作为科研成果的结晶,蕴含着丰富的知识,属性抽取作为知识抽取的一种应用,是把不同学术文献中对于某一学术概念的属性描述集中起来,用来构建属性描述知识库。本文通过人工构建规则的方法,形成了属性抽取的九大类描述规则,并对属性描述进行了数量关系和情感信息方面的分析,然后对学术概念属性抽取系统进行设计和实现,并对《情报学报》2007年和2008年的文章进行抽取实验,对系统抽取的结果和人工标记的结果进行了测评,并进行了实验结果的分析。  相似文献   

2.
从知识抽取相关概念辨析看知识抽取的特点和发展趋势   总被引:4,自引:0,他引:4  
通过知识抽取与知识获取、信息抽取、知识发现等概念之间的概念辨析确定知识抽取的研究范畴。知识抽取以学术文献为抽取对象,以总结学术文献的特征规律为特色,构建以知识元为存储单位的知识库,必将会给图书情报学的发展带来新的机遇与活力。  相似文献   

3.
设计了一种定义抽取系统,通过混合使用模式规则、语法规则和词频统计以达到定义抽取的目的。详细介绍了系统中的各项关键技术,包括分词技术、抽取规则导入技术、句子抽取技术和加权词处理技术。并选取《情报学报》2007-2008年的235篇论文全文作为实验数据,通过与人工抽取结果进行对比分析,测试了抽取系统_的抽全率与抽准率。  相似文献   

4.
[目的/意义]学术名词是专业知识的基础,通过对学术名词跨学科迁移与发展进行揭示,有助于深入探究学科间的知识共享与交流。[方法/过程]文章构建了学术名词跨学科迁移与发展模型,以14本CSSCI图书情报类核心期刊为研究对象,从文献引用角度测量学科间的知识流动,对跨学科学术名词进行抽取,识别不同迁移类型的学术名词,并判断其发展趋势;最后根据实证结果总结出学术名词迁移与发展特征。[结果/结论]文章直观全面地展示了不同的跨学科迁移类型与发展情况,旨在为探寻科学发展规律提供有益参考。  相似文献   

5.
数字图书馆作为一种以网络技术为环境基础的知识网络系统,是重要的知识来源。为了满足用户精细化信息需求,数字图书馆数字资源的知识管理单位进一步细化到知识元。以事实知识元为研究对象,在对数字图书馆的数字资源管理现状及知识元的研究现状进行综述后,提出事实知识元的定义,针对事实知识元的特点,建立起事实知识元描述模型及抽取规则,以该抽取规则为基础,对事实知识元的抽取流程进行梳理,提出事实知识元描述框架。  相似文献   

6.
句子级知识抽取在情报学中的应用分析   总被引:3,自引:0,他引:3  
通过比较句子级知识抽取与词语级知识抽取的差异性,分析句子级知识抽取在情报学中的意义,表现在四类典型应用系统:学术抄袭检测系统、参考文献自动标注系统、文献自动综述系统、知识库构建系统。分析了知识抽取的难点与关键技术,针对难点与关键技术提出了知识抽取的3个转向:抽取对象转向以学术文献为主;抽取技术转向以内容结构分析为主;抽取目标转向以构建知识元数据库为主。  相似文献   

7.
为提高科技文献中各类型知识元抽取的效率,提出一种基于序列模式的科技文献知识元抽取模型。该方法首先在各类型知识元描述规则的基础上,对知识元语句进行依存句法分析,生成融入语义的知识元序列模式;其次,基于知识元序列模式,通过模式匹配算法实现各类型知识元的抽取;最后,基于Prefixspan算法,从抽取的知识元中挖掘出新的描述知识元的序列模式,以实现知识元序列模式的不断动态更新与扩展,进而依据知识元序列模式提高知识元的抽取效率。基于序列模式的科技文献中知识元的抽取方法,克服了基于规则匹配的语义局限,具有学科延展性,提高了知识元抽取的效率。  相似文献   

8.
[目的/意义]近年来,科技文献资源呈爆炸性增长,海量科技文献中依旧存在大量非结构化摘要。非结构化摘要一方面不利于学者阅读与理解;另一方面不利于对摘要内部信息进行知识的自动化抽取和相应的检索。研究科技文献非结构化摘要的知识表示模型及其自动化抽取方法,对学者快速阅读和机器自动化处理具有重要意义。[方法/过程]文章在分析科技文献非结构化摘要结构的基础上,结合知识元本体理论,构建了一个面向科技文献非结构化摘要的知识元本体模型。通过分析非结构化摘要的写作特征,将文本按句子级划分为目的、方法、结果或结论三个要素,统计每个要素句中的线索词、句型和位置,建立相关规则库,根据本体模型和规则库构建相关抽取算法。最后,下载《计算机技术与发展》中的部分文献进行实验。[结果/结论]通过增加句型集和线索词集,完善了非结构化摘要的要素,构建了非结构化摘要知识元本体模型。实验结果表明,根据本文提出的模型能有效地对非结构化摘要中的知识元进行抽取。[局限]实验的不足之处是需要人工对摘要中的句型和线索词进行归纳总结。  相似文献   

9.
【目的/意义】利用网络分析方法对融入引文内容的引文网络中的知识流动规律与模式展开系统研究,以期 为引文网络中的知识扩散、转化与创新提供理论与实证依据。【方法/过程】选取描述性统计量和网络分析指标,对 知识节点的知识流动能力及角色、知识群落的知识流动类型及结构、整体网络的知识流动分布特征及结构特征进 行深度刻画和剖析。【结果/结论】依据CNKI数据库主题期刊论文为测度数据,分别构建“智库”“数字人文”“数据治 理”三个主题的引文网络,并依据文中方法比较分析其间知识流动特征的异同。文中方法能够深入挖掘学术文献 间的知识关联,弥补过去引文网络知识流动研究中因忽略深层次引用信息而产生的缺陷。【创新/局限】本文采用多 种指标与方法对引文内容视角下引文网络知识流动规律与模式展开系统研究,但是未从整体引文网络中抽取反映 某一或某些知识属性的个体引文网络进行分析。  相似文献   

10.
彭玉芳  陈将浩 《情报科学》2022,39(1):141-147
【目的/意义】从海量的学术文献内容中,抽取科研人员所需要的目标数据,一方面有助于提高研究者的科 研效率,另一方面有利于改善目前文献数据库的检索服务。【方法/过程】根据科研人员的学术需求,首先通过深度 学习方法从大量的学术文献中抽取目标数据。其次使用NER和TF-IDF抽取目标数据的“5W”规则,接着对目标 数据做第二层需求规则过滤,凡是满足“5W”规则的数据,被鉴定为目标数据。最后对目标数据做第三层人工校 验,最终生成学术文献“目标数据”。【结果/结论】本文构建的学术文献“目标数据”抽取模型的准确率可达0.88,再融 合“5W”规则的过滤和最后的人工校验,不仅有利于提高科研工作者的学术文献查准率,而且一定程度上辅助文献 数据库机构的检索工作。【创新/局限】深度学习与需求规则融合,实现学术文献的检索结果从学术文献的题录信息 层面到进入学术文献内容的数据层面。  相似文献   

11.
We propose answer extraction and ranking strategies for definitional question answering using linguistic features and definition terminology. A passage expansion technique based on simple anaphora resolution is introduced to retrieve more informative sentences, and a phrase extraction method based on syntactic information of the sentences is proposed to generate a more concise answer. In order to rank the phrases, we use several evidences including external definitions and definition terminology. Although external definitions are useful, it is obvious that they cannot cover all the possible targets. The definition terminology score which reflects how the phrase is definition-like is devised to assist the incomplete external definitions. Experimental results show that the proposed answer extraction and ranking method are effective and also show that our proposed system is comparable to state-of-the-art systems.  相似文献   

12.
【目的/意义】为准确抽取科技文献中的方法知识元,实现科技文献更细粒度知识组织和检索。【方法/过程】 本研究提出一种基于规则的方法知识元抽取方法,该方法主要分为两个阶段:方法知识元初始描述规则半自动化 识别阶段和方法知识元及其描述规则自动化抽取和更新阶段。第一阶段根据方法知识元的特征,以人工—机器相 结合的方法识别方法知识元的组成维度及初始描述规则。第二阶段依据第一阶段识别的方法知识元初始描述规 则,自动从科技文献中提取方法知识元,并基于PreFixSpan算法从新识别的方法知识元中挖掘出新的方法知识元描 述规则,以实现方法知识元及其描述规则的动态更新。【结果/结论】在对16篇科技文献的初步评估中,实验结果P、 R以及F值分别为0.71、0.80和0.73(均>0.5)表明该方法的可行性和有效性,该抽取方法对更细粒度的知识组织和 检索也有一定借鉴作用。【创新/局限】方法的局限性在于需要一定的人工参与方法知识元描述规则的提取。  相似文献   

13.
李庆 《科教文汇》2014,(9):165-165,167
在化学概念教学实践中,要关注学生已有的知识基础,并采用多种方法。通过三种导入新概念的策略院提供适当的范例,促进新概念的形成;找准恰当的已知概念,促进新概念的链接;消除混淆,促进相互有关联概念的联系与辨别。使学生在不经意间进入新概念的学习中,对概念的理解更容易。  相似文献   

14.
针对目前学界在理论层面对安全预测研究极其缺乏的问题,立足于学科建设高度,进行安全预测学的建立研究。首先,根据预测的定义,基于系统视角,给出安全预测的定义,并分析其内涵。其次,提出安全预测学的定义,并深入剖析其内涵及创立安全预测学的依据。最后,系统探讨安全预测学的学科性质、研究内容、学科分类与学科基础4个学科基本问题。结果表明,安全预测的本质是一种安全科学研究与实践的方法论;安全预测学是专门研究与探讨系统未来的安全状态发展变化规律的一门新兴综合交叉学科,是安全科学中势在必建的分支学科。  相似文献   

15.
马玉春  孙冰 《情报科学》2005,23(9):1376-1380
针对股票的网站越来越多,如何从这些网站的有关页面进行信息抽取,并得到相关知识,为股民提供股票交易的决策参考,是一个值得研究的课题。本文剖析了信息抽取常用的Wrapper方法,以及抽取知识的获取方法。最后,根据可视化信息抽取的原则,设计了一个可视化信息抽取的实验,取得了良好的效果。  相似文献   

16.
基于读秀中文图书被引用报告,作者从被引图书出版年分布、类别、作者、次数等4个方面进行统计,初步总结和探析学术发展的一些特点和规律:百年来我国学术发展虽有曲折,但总趋势是前进的、上升的。被引次数越多,学术影响力越大。学术发展是各种因素相互作用的过程,我们应该把内部评估与外部评估结合起来评价图书,以推动我国学术向前发展。  相似文献   

17.
徐扬 《情报杂志》2012,31(4):148-152
随着知识经济时代的来临,知识管理成为人类各项活动中的重要问题,而对于知识价值的研究一直是知识管理领域最活跃而又最具挑战性的工作.分析了知识的增值过程,对知识效用和知识价值进行了科学定义,并且引入了对于知识价值进行定量度量的方法,最后归纳了知识增值过程中的一般规律,并据此提出了知识管理过程中的建设性意见.  相似文献   

18.
陈海珠  徐辉 《现代情报》2009,29(8):32-36
学科信息门户是一种支持系统资源查询的因特网服务,是当前网络学术信息组织和开发利用的有效手段,从某种意义上讲就是网络学术图书馆,可以帮助用户寻找网络上的高质量信息。本文通过分析探讨制定并规范学科信息门户评价指标体系的意义,从资源选择政策、系统功能、维护与更新、个性化服务等方面提出关于学科信息门户的评价指标体系的初步构想。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号