首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
本文提出一种新的基于语义核的中文实体关系抽取方法,在通常的序列核中嵌入语义信息,然后用改进后的k均值算法进行聚类。实验结果证明我们的方法是比较有潜力的。  相似文献   

2.
对利用关键动词(即语义关系动词)进行关系抽取的研究进行回顾,并对生物医学语义关系抽取的常用方法进行详细介绍。认为目前关系抽取研究中所利用的关键动词主要是人工选取的,涉及的主观因素较多,影响关键动词选取的客观性、准确性和全面性。因此,如何自动化地找到这些动词可能会成为今后关系挖掘的一项关键任务。  相似文献   

3.
本体中同种语义关系间的可传递规律研究   总被引:2,自引:2,他引:0  
语义传递是研究知识组织、语义相关度以及知识挖掘与推理等信息科学领域的关键因素,但是由于缺乏语义传递判断的计算机模拟限制了其在信息科学领域的应用.语义关系间的可传递性是语义传递判断的关键因素,其规律性特质反映出了语义传递的相对稳定性,这种稳定性使得语义传递判断的计算机模拟成为可能.本文主要围绕同种语义关系间的可传递性规律获取方法,基本获取方法的经典型语义关系的传递规律,规律检测以及传递规律应用四个方面展开了研究,目的在于为语义传递判断的计算机模拟以及语义传递在信息领域中的应用提供基础.  相似文献   

4.
语义传递是信息科学领域多种研究的关键因素,但是由于缺乏语义传递判断的计算机模拟限制其在信息科学领域的应用.语义关系间的可传递性是语义传递判断的关键因素,其相对稳定的特质使得语义传递的计算机模拟成为可能,本文以异种关系间的可传递规律为研究对象,从传递规律获取方法,方法评述以及方法的具体应用展示3个方面进行了分析,目的在于为语义传递判断的计算机模拟以及语义传递在信息领域中的应用提供基础.  相似文献   

5.
本文通过研究开源自然语言处理平台GATE和条件随机场模型,提出一种高效的电子产品领域命名实体识别策略,为实习项目中的初步工作--通过计算机智能方法识别出电子产品领域的产品品牌、属性等命名实体提出解决方案,并为下一步可能开展的领域内自动问答系统等高层应用提供底层支撑.该方法是基于层叠模型的规则与统计相结合的新的方法,分别继承了基于规则和基于统计识别方法的优点.最终,通过分析电子产品领域自身的领域特点实现了如品牌、重量等二十余种命名实体的识别.对比实验结果表明,该系统达到了令人满意的识别效果.  相似文献   

6.
7.
李斌  马宁  蒋平  郭玉良 《信息系统工程》2011,(5):142-144,146
本文介绍了一种在维基百科文档中进行实体关系抽取的方法。首先根据维基百科文档中的超链接特征识别相关的实体,然后抽取文档中关于实体的类别信息、消歧信息、关键词等特征,并采用向量空间模型来表示。最后通过计算待测实体对与训练实体对的相似度,得出待测实体对所属的关系类别。我们分别对实体关系抽取进行了封闭测试和开放测试实验,并取得了较好的测试结果。  相似文献   

8.
重点讨论非结构化中文文本中表达式命名实体(ENE)的抽取和分类过程,尝试构造匹配模式集合,建立基于层次模式匹配的ENE识别模型(HPM_ENE_EM),作为竞争情报系统、用户兴趣度获取等情报学应用研究的基础,并以学术论文中的术语缩略语识别为例探讨该模型的具体应用。  相似文献   

9.
研究了OntoText实验室的研究成果KIM Platform(Knowledge and Information Management Platform)。通过研究发现KIM在技术上借助了目前在本体及自然语言处理领域比较受推崇的三个开源项目,GATE、Sesame和Lucene。此外,本文对KIM系统进行了汉化,并详细介绍了实体查找、实体模式搜索、预先定义模式搜索和关键词搜索的实现。最后指出了KIM系统存在的问题以及未来的发展方向。  相似文献   

10.
赵华茗  钱力  余丽 《图书情报工作》2020,64(11):108-115
[目的/意义]探索科研命名实体及其关系的识别与抽取,提升其在长句等复杂情况下的识别效果,为进一步的应用提供参考与借鉴。[方法/过程]以依存句法特征分析为基础,提出一种科研命名实体关系抽取方法,过程包括:①使用Standford Tagger工具对目标文本进行词性标注;②基于标注结果,围绕核心谓词和SAO结构,将目标文本分割为结构规范的语义片段;③通过依存句法分析,找出与核心谓词语义相关的主语和宾语,构成(实体,关系,实体)三元组。[结果/结论]与Ollie、Reverb等主流算法进行的对比测试表明,该方法可以有效提升科研命名实体识别的准确性。  相似文献   

11.
将基于特征向量的平面核和基于句法分析树的结构核组合,进行中文实体关系抽取.首先进行特征选择实验,为构造平面核中的特征向量选择最优特征集合,特征包括实体大类、实体子类、实体类别等实体信息以及实体对在句子中的前后词信息.在定义结构核函数时,从包含两个实体的句子中提取最短路径包含树(shortest path tree,SPT),然后使用卷积树核函数来计算两棵SPT树的相似度.在ACE RDC 2005中文语料库上进行实体关系大类的抽取实验,其F值达到了68.50%,比两个单独核函数的方法分别提高4.36%和17.37%.同时,在组合核中也进行了特征选择实验,得到了最好关系抽取性能的F值为70.58%,说明单独平面核的最优特征集在组合核中未必最优.结果表明,本文利用实体语义信息构造平面核并与结构核组合,对于中文实体关系抽取具有较好的性能.  相似文献   

12.
基于词形规则模板的术语层次关系抽取方法   总被引:1,自引:0,他引:1  
术语层次关系抽取是领域概念关系体系构建的重要基础.针对目前术语关系抽取中手工实现的问题,提出了基于词形规则模板匹配的术语层次关系抽取方法,实现从科技论文文本中抽取类属关系(IS-A)和整体部分关系(PART-OF)关系.利用复合术语的head和modifier特征,比较两个术语之间存在的边缘共用词汇,构造模板来确定它们之间的IS-A和PART-OF关系;提出泛化度指标,用于测量两个术语在概念层次树上的相对位置;提出相关度概念,用于测量两个术语之间在语义上的相关性.对不存在共用词汇和不匹配模板的术语采用泛化度差值和相关度来判断它们之间是否存在层次关系.实验从信息资源管理领域的论文文本中提取层次关系术语对1306对,准确率达到92.5%,证明提出的方法是有效的.  相似文献   

13.
GATE系统关键组件的应用开发接口研究和应用   总被引:2,自引:0,他引:2  
近年来,谢菲尔德大学研究开发的GATE(General Architecture for Text Engineering,文本工程通用框架)不断发布新版本的同时,在科研、教育、商业等领域获得广泛应用.文章从GATE基本架构入手,分析GATE关键组件,结合开发实例研究GATE主要接口应用开发方法,并探讨了Gazetteer和JAPE等资源的扩展方法,为基于GATE更深层次的应用提供基础.在研究其应用开发接口基础上,文章进一步展示了基于GATE扩展的知识抽取系统的应用实例.该文为2008年第9期本期话题"知识抽取"的文章之一.  相似文献   

14.
跨学科科研合作是学术研究的重要形式和趋势,将对未来科学发展产生深远影响,对知识创新和社会进步都具有重要的推动作用。深入研究跨学科科研合作的运行机制,厘清合作中的关键要素和作用机制,有助于推动合作的高效运行和可持续发展。文章以斯坦福大学跨学科研究机构为例,从价值感知与合作氛围、学术交流模式与科研基础设施、团队凝聚力、利益保障机制、宗旨和目标、政策与战略、科研资助、管理模式等八个方面,对组织视角下的跨学科科研合作实践关键要素进行剖析,在此基础上构建组织视角下跨学科科研合作运行模型,涵盖3层要素,即"3个阶段、1个纽带、8个影响因素"。  相似文献   

15.
[目的/意义]传统的文献主题提取方法主要是通过关键词、摘要、全文等提取文献的主题内容,使得主题内容不全面或存在"噪音",而从文献内容语义出发,结合引用内容提取文献的主题,能够更加准确地提取出多文档的主题内容。[方法/过程]提出一种面向多文档的基于语义和引用加权的科技文献主题提取算法,利用文献的引用内容和关键词构建Labeled-LDA主题模型,形成文档-主题概率向量,再根据K-means聚类方法聚类文档,提取每类文档集的主题内容。[结果/结论]以PubMed生物医学数据库中的数据作为实验数据,测试该方法的可靠性,结果证明该方法能够准确、全面地提取出多文档的主题内容。  相似文献   

16.
ABSTRACT

Stanford University Libraries has recently acquired and made available to researchers the personal and professional papers of Russian poet Yevgeny Yevtushenko.  相似文献   

17.
实体关系抽取的技术方法综述*   总被引:3,自引:0,他引:3  
对实体关系抽取研究以MUC和ACE评测为主线的发展进行总结,并指出实体关系抽取任务普遍存在的三个问题是特定领域标引数据集的获取、模式的获取以及共指消解。在对当前关系抽取的相关文献、系统和项目进行分析研究的基础上,将基于非结构化文本的实体关系抽取技术方法归纳为:基于模式匹配的关系抽取、基于词典驱动的关系抽取、基于机器学习的关系抽取、基于Ontology的关系抽取以及混合抽取方法,旨在为进一步构建实体关系抽取系统提供良好借鉴。  相似文献   

18.
领域本体的关系抽取研究   总被引:3,自引:0,他引:3  
利用机器学习和自然语言处理技术中的有关方法,研究从语料中抽取概念关系为领域本体构建服务。对等级关系以及领域关系的抽取方法作详细阐述,并通过实验证明该方法是有效的。  相似文献   

19.
ABSTRACT

This paper offers a look at some facets of the 1905 Revolution in Latvia, at the time part of the Russian Empire, and their interpretation in historiography from 1905 to 2015. Using resources in the Stanford University Libraries and the Hoover Institution Library and Archives, the paper provides an overview of the causes and the character of the 1905 Revolution in Latvia while also discussing various debates among historians of 1905. The main focus is on collective violence and political activism. The article is written from the point of view of a librarian and historian. It has two parallel goals: to tell the history of the Baltic collections at Stanford and to acquaint the reader with current scholarship on the subject of 1905 in Latvia. Even though some papers have been written that examine Baltic collections in American libraries, few, if any, of these have concentrated on individual historical topics.  相似文献   

20.
针对本体系统中,知识的表现形式有限,OWL本身无法建立一般领域的规则,导致很多存在于社会关系本体中的隐含关系信息尚待挖掘的问题,将推理系统中的本体和规则相互分离,在社会关系领域本体的基础上,构建一系列SWRL规则以进行隐含关系的自动挖掘。在实验中,共定义22条关系规则,推理得出50条新的公理,由此进行社会关系本体的自动更新。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号