首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 9 毫秒
1.
为了快速有效地自动处理中文Web文本,提出了一种基于领域本体的主题特征抽取方法.该方法针对Web文本特点,介绍了一种领域词典的半自动化构建方法.基于领域词典切分文本,通过对词条的主题映射,采用领域本体的概念表示文本向量,从而有效地降低文本特征向量的维数,提高主题抽取的质量.考虑文本信息的不同位置与频率,计算主题特征的权值,并且基于领域本体的结构,对主题概念的权值进行调整和排序.实例验证了该方法的有效性.  相似文献   

2.
基于本体信息抽取的竞争情报预处理分析   总被引:1,自引:0,他引:1  
针对以往应用于竞争情报预处理中的信息抽取技术的准确率与覆盖率不高的缺点,提出利用本体来深层次抽取竞争情报,详细说明基于本体的竞争情报信息抽取的全过程,同时利用信息抽取的结果丰富已有的本体,最后提出存在的问题及今后的工作.  相似文献   

3.
周霜菊 《现代情报》2009,29(3):194-196
尽管目前我们拥有Google、百渡等通用搜索引擎,但对于特定领域,人们需要的不仅仅是信息所在地址的指向,还需要获取更小粒度的信息知识集成。本文尝试结合Web网页文档的特点及领域本体知识,以及信息提取、知识挖掘和XML等技术,给出了一种基于领域本体的Web信息集成方法,旨在提高用户利用Web信息的效率。  相似文献   

4.
一种基于XML的Web信息抽取方法   总被引:6,自引:2,他引:4  
目前Web资源含有大量的有用信息,但由于它们欠结构化,不能为传统的数据库型查询系统所利用。针对这一问题,出现了Web信息抽取技术。在论述了半结构化Web信息抽取技术总体解决方案的基础上,研究了Web信息抽取的实现技术,并从应用的角度提出一种新的半结构化信息获取方法。该方法包括网页分析过程、映射的自动生成和信息抽取过程。在Web信息抽取的实现部分,提出了抽取规则执行算法,为进一步满足Web信息检索提供了一种新的高效的检索方法。  相似文献   

5.
为了对软件测试领域的信息进行有效管理,对软件测试领域进行了深入分析;引入本体技术并总结了领域本体的构建方法,探索了测试信息领域本体构建方法;为软件测试建立测试信息领域本体,实现信息的有效表示、存储和共享。  相似文献   

6.
基于Web资源的信息抽取技术   总被引:7,自引:0,他引:7  
郭志红 《情报科学》2002,20(12):1282-1284
Web资源含有大量的有用信息,但由于它们欠结构化,不能为传统的数据库型查询系统所利用。如何将这些信息抽取出来,转化成结构化信息供其它信息集成系统所利用,成为该领域的研究热点。本文介绍了一个简单的Web信息抽取模型,对于基于该模型的wrapper归纳技术进行了探讨,并描述了一个wrapper自动生成系统的原型。  相似文献   

7.
基于Web的信息抽取技术研究综述   总被引:1,自引:0,他引:1  
蒲筱哥 《现代情报》2007,27(10):215-219
本文在讨论Web信息抽取技术的发展历程、概念及其功能,Web信息抽取技术方法的分类及技术特点分析。Web信息抽取系统的构建研究及其性能评价的基础上。分析了当前研究存在的问题以及未来的研究方向。  相似文献   

8.
基于GATE的任务信息抽取研究   总被引:1,自引:1,他引:0  
为了有效地将企业管理实践转变为财富,提出了基于GATE框架和ICTCLAS中文分词的任务信息抽取模型,对任务描述、日期、人员和部门四个命名实体进行识别,并在企业实际中进行了应用,取得了较好的应用效果,为进一步研究任务不确定程度和管理机制之间的动态匹配关系提供研究基础.  相似文献   

9.
本文通过对国内外OBIE理论和OBIE系统的分析,比较了OBIE技术与传统信息抽取技术的主要区别,归纳了4种主要的技术方法,分别是基于实例的OBIE,基于规则的OBIE以及基于机器学习的OBIE和Ontology驱动的OBIE,并用案例对各种技术方法做了阐释,最后总结了OBIE研究和系统开发中存在的难点问题.  相似文献   

10.
阐述了针对中小型企业供需信息自动化Web信息抽取技术的研究。自动化是指不需要人工标注网页抽取规则学习样本,系统能够从不同的求购信息网站的网页里自动获取相应的信息抽取规则,通过引入领域特征来净化抽取到文本字段而获得较高的查准率。  相似文献   

11.
张强 《人天科学研究》2010,(11):139-141
以文献检索为实例,结合本体构建工具(Protege)和本体推理机(Racer),利用OWL本体描述语言表示文献领域本体的语义信息,提出了文献本体结构和语义词典结构,重点分析了文献检索本体推理功能及关键字语义词典本体推理扩展,实现了文献的语义化及智能化检索。  相似文献   

12.
随着互联网的快速发展,Web信息抽取技术的研究及应用已越来越多,本文介绍了Web信息抽取技术的概念及国内外的发展历程,分析了Web抽取信息的原理;对目前主流的Web信息抽取技术进行了归纳分析,阐述了Web信息抽取的评价指标。  相似文献   

13.
基于本体的信息构建模型研究   总被引:1,自引:0,他引:1  
在分析信息组织与利用的多层次性和多维性以及Wurman五规则的基础上,提出应用信息构建来构造信息系统,并用本体解决信息构建构造信息系统中的难题,提出了基于本体信息构建模型,并对模型进行了描述。  相似文献   

14.
王昊  苏新宁 《情报理论与实践》2008,31(2):292-297,291
本文重点阐述了中文通用本体概念实例的机器抽取过程,建立了基于模式匹配的通用本体概念识别模型,以此作为领域本体自动构建的基础.此后探讨了该模型在情报学各研究领域中的应用前景,并通过实验检验模型在实际应用中的识别效果.  相似文献   

15.
时态信息抽取和检索是Web领域中时态信息处理的两个关键问题.本文首先分析了时态信息对于Web应用的意义,然后对Web领域中时态信息抽取和检索的相关现状进行了深入讨论.在此基础上讨论了Web时态信息的本体表示问题.最后,预测了Web时态信息抽取与检索的若干未来发展方向.  相似文献   

16.
本体模块的抽取是解决本体复用问题的关键技术.分析了本体模块抽取的相关研究现状,提出一种基于粒度抽取本体模块的算法.该算法利用WordNet和本体上下文来得到可表示本体结构中粒度特征的一组介于0和1之间的实数值,即本体中概念词和关系词的分面权值,使本体模块的边界得到合理的区分.实验表明,该算法能够有效地抽取出符合指定粒度参数的本体模块.  相似文献   

17.
通过首先对当前信息抽取技术和现有的XML技术进行分析与研究,发现如何有效地确定抽取规则是当前Web信息抽取的主要难点。针对目前存在的问题,给出了一种基于XML的Web信息抽取的解决方案,并对其中相关的技术进行了深入的探讨和研究。  相似文献   

18.
Web抽取技术是众多对网络信息资源挖掘中重要的一项技术。近年来,Web抽取技术发展很快,已渗透至各个领域,应用到很多行业,但真正涉及陶瓷产品应用这一块的不多,本文在分析了Web抽取技术现阶段发展现状的基础上,针对陶瓷产品的特点提出了陶瓷产品信息Web抽取的技术路线,以便获得和整理陶瓷产品信息,规范陶瓷产品的信息资源。  相似文献   

19.
一种基于视觉分块的Web信息抽取方法研究   总被引:1,自引:0,他引:1  
随着浏览器/服务器体系结构和动态网页技术的广泛应用,对网页进行快速、准确地信息抽取的技术研究已成为一个热点.结合动态网页的生成特点和针对已有抽取方法的不足,提出了一种基于视觉分块的Web信息抽取方法.  相似文献   

20.
医学领域本体研究现状   总被引:3,自引:0,他引:3  
陈焱  姜慧敏 《情报科学》2006,24(10):1587-1590
领域本体描述了关于某个学科领域中的概念以及概念之间的关系,或者该学科领域的重要理论和基本原理。基于医疗领域的特殊需要,国内外均开展了医学领域本体的研究。本文介绍分析了国内外医学领域本体的研究现状,并提出未来需要解决的关键问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号