共查询到18条相似文献,搜索用时 78 毫秒
1.
为充分发挥知识组织在企业专利战略中的作用,在分析专利文献的基础上,根据中文专利文献句法描述的特点,利用最大串频匹配、蚁群聚类、多层KMeans聚类、改进关联规则计算、基于规则和CRFs的术语关系抽取等算法,设计出一套领域本体的半自动构建系统,包括术语抽取、分类关系抽取、非分类关系抽取、本体形式化等模块,初步实现结构化数据和非结构化文本的本体半自动构建。 相似文献
2.
基于统计自然语言处理技术的领域本体半自动构建研究 总被引:1,自引:0,他引:1
本体的构建是影响语义Web成功与否的重要因素之一.本文借鉴机器学习以及自然语言处理等技术成果尝试半自动构建本体,以专业研究论文为研究语料,采用N-Gram文本表达法从语料中抽取关键概念,计算主题度获取领域概念.利用改进的层次聚类算法对领域概念进行聚类以获取其等级体系,采用句法分析与统计相结合的方法从语料中获取可能的主、谓、宾模式为领域关系提供参考,并以农业史为例,设计开发了一个领域本体半自动构建实验系统,文中重点介绍了本体构建中概念的获取、等级关系、领域关系的构建以及形式化处理等关键技术的实现过程. 相似文献
3.
4.
国家知识产权局CNIPR等著名专利检索系统仍是基于关键词的传统检索方式,会漏掉很多重要的相关专利数据。为提高专利信息的利用率,文章提出一种基于专利本体的语义检索模型,并采用Java语言编程实现,最后设计实验测试其检索效果。实验结果表明本研究能根据专利本体库中已经存在的知识和人为定义的规则,推导出库中原来没有的新的隐含知识,有效提高了相关信息的查全率和查准率。 相似文献
5.
基于领域本体的专利信息检索系统研究与实现 总被引:1,自引:0,他引:1
针对传统信息检索方法在当今网络信息环境下所面临的问题,提出基于领域本体的专利信息检索模型,从用户检索请求处理、本体构建、本体可视化与语义扩展、检索及存储的过程和技术实现进行研究,并开发一个基于服装领域本体的专利信息检索原型系统。比较测试表明,该模型在确保信息检索准确性的同时能够极大地提高其全面性。 相似文献
6.
专利是获取竞争对手信息的重要来源,如何提高专利分析的效率和效果是专利工作者面临的主要问题。基于本体的专利情报发现能够实现智能化的情报挖掘,有效地支持了专利知识的再发现。文章在Protégé环境下通过构建一个简单领域本体,借助实例分析,讨论了基于本体的专利情报发现体系的实现策略。 相似文献
7.
基于本体的专利摘要知识抽取* 总被引:4,自引:0,他引:4
采用知识工程的方法,对“新能源汽车”中文专利摘要进行研究分析,提出了一个基于本体的中文专利摘要抽取模型。通过构建相应的本体、收集相关的词表、撰写相应的规则,并利用这些规则对专利摘要进行知识抽取结果,抽取结果辅助完成专利知识库的自动构建。即就如何组织非结构化信息以及如何自动构建知识库的进行尝试,验证了基于本体对专利摘要进行知识抽取的可行性。 相似文献
8.
基于概念格的异构资源领域本体构建研究 总被引:1,自引:0,他引:1
在对本体构建研究路径进行分析的基础上,阐述以概念格构建异构资源领域本体的内在机理和技术路线。通过概念格的并叠置运算,获得基于主题词表和文本两大异构资源的概念格。进而以异构资源概念格构建异构资源领域本体,并对异构资源领域本体的构建进行讨论。为数字图书馆构建异构资源领域本体做出探索。 相似文献
9.
10.
针对不同领域本体之间存在的异质性,以及本体之间存在语义分歧、难以协同操作,从而影响本体复用与知识共享的现实问题,以当前成熟的领域本体为研究对象,通过在共同语义基础上对异质领域本体的概念格解析,在不破坏偏序关系的情况下获得本体中相关概念的外延与内涵,进而借助基于对象(外延)与属性(内涵)的概念相似度计算方法建立跨本体的映射,并最终构建多本体协同知识地图,实现跨越异质本体的知识呈现与知识检索. 相似文献
11.
12.
[目的/意义] 实用的大规模地名本体数据库系统在自然语言处理、信息检索和情报分析领域具有重要的应用价值。本研究的目的是在减少人工干预的情况下,实现对地名简称、俗名以及随时间变化的复杂地名文本的自动识别与处理。[方法/过程] 以多种方法获取大规模名址数据为根基,简化地名元素间复杂关系,在开发名址元素切分、属性与关系分析及推理工具包的基础上,利用Neo4j图数据库工具开发实用地名本体数据库系统。[结果/结论] 基于所介绍的技术与方法而构建的系统具有良好的容错性和持续的数据更新能力,其地名分析、地名元素间关系推理达到了期望的精度,并在面向诸如新闻主题追踪、金融征信中的地名匹配等多种自然语言处理任务中取得良好效果。 相似文献
13.
利用叙词表构建本体的方法研究 总被引:11,自引:0,他引:11
本文介绍了本体和叙词表的定义及主要用途,论述了叙词表和本体的相同点和不同点,提出了基于叙词表构建本体的方法及主要步骤,并且利用构建历史本体的实例,阐述了构建一个领域本体的主要过程。 相似文献
14.
分布式数据库是面向跨地区不同组织机构和企业之间进行数据交换的新的数据组织形式。采用分布式数据系统来设计实现分布式本体的方案,既能保证系统数据的分布性,又可以成功实现系统中实时更新和数据的一致性。图1。参考文献1。 相似文献
15.
16.
[目的/意义] 利用社会化标签对电影资源进行标注已成为新网络环境下电影资源组织的新方式,构建电影资源本体对规范电影标签语义、提高电影资源检索效率具有重要现实意义。[方法/过程] 针对目前电影资源本体构建方法及构建过程存在的问题,提出利用社会化标签构建电影资源本体的思路,在深入剖析电影标签与电影资源本体映射关系的基础上,揭示一种基于社会化标签的电影资源本体构建方法,并给出利用该法构建电影资源本体的详细流程。[结果/结论] 利用豆瓣电影中的标签数据集构建一个电影资源本体,并分析基于社会化标签电影资源本体构建方法的科学性和优越性。 相似文献
17.
王红 《中国科技资源导刊 (中国信息导报)》2005,(9):42-45
专利文献是一种集工业产权情报、技术情报、商业与经济情报于一体的情报源,是一个博大精深的应用技术的知识宝库。专利文献是包含已经申请或被确认为发现、发明、实用新型和工业品外观设计的研究、设计、开发和试验成果的有关资料,以及保护发明人、专利所有人及工业品外观设计和实用新型注册证书持有人权利的有关资料的已出版或未出版的文件或其摘要的总称。专利文献中含有大量的专利信息,对这些专利信息进行有效的组织和开发利用可为科研、企业提供重要的情报支持。 相似文献
18.
领域本体的关系抽取研究 总被引:3,自引:0,他引:3
何琳 《现代图书情报技术》2008,3(4):35-38
利用机器学习和自然语言处理技术中的有关方法,研究从语料中抽取概念关系为领域本体构建服务。对等级关系以及领域关系的抽取方法作详细阐述,并通过实验证明该方法是有效的。 相似文献