首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
董旻  方曙  杨志萍 《情报杂志》2007,26(6):73-75,78
提出一种利用JTree和XPath技术实现动态网页信息抽取系统的方法,介绍了系统主要组件的功能和实现方法,并进行实际的抽取试验,论述了此设计的优点。  相似文献   

2.
李中言 《现代情报》2005,25(12):67-68
信息抽取的目标是自动从文本信息中抽取出预先想要得到的信息(知识),它提供了一条从浩瀚的信息堆积中抽取出与用户相关信息的一条思路。文章分析了信息抽取的主要概念、主要分析了信息抽取的类型和信息抽取系统的一般结构及功能。  相似文献   

3.
王凯  王辉  渠芳 《现代情报》2006,26(4):86-88
分析高校数字图书馆信息资源分布状况,提出异构资源整合的解决方法——信息抽取技术。本文介绍了一种借助于JTIDY转换和JDOM解析工具的Web信息抽取方法,讨论信息抽取技术的功能、组成、特点、实现和原则问题。  相似文献   

4.
自由文本信息抽取技术   总被引:13,自引:0,他引:13  
李向阳  苗壮 《情报科学》2004,22(7):815-821,829
信息抽取是从自由文本语料库构建数据库,实现情报自动收集的有效途径之一。近十多年来,信息抽取技术逐步走向成熟,已成为与信息检索相平行的技术之一。对信息抽取技术进行系统的归类、总结,已显得较为迫切。在对当前多种主要的信息抽取技术进行分析、比较的基础上,结合信息抽取所面临的挑战,分析了信息抽取的三个趋势。  相似文献   

5.
分析了信息抽取的研究现状,提出了一种基于领域本体的Web信息抽取模型,对模型中的各部分功能进行了简要说明,明确了信息抽取的系统流程,提高了信息抽取效率。  相似文献   

6.
随着Web信息抽取的研究和发展,抽取技术已经逐渐成熟,通过软件来实现从Web页中抽取所需要的信息已成为可能。对基于.NET技术实现的Web信息抽取系统进行了研究,分析并提出了HTML文档下载和清理、HTML到XML格式转换、数据定位及抽取、抽取数据的保存等需要研究解决的关键技术问题,并探讨了相应的解决方案。  相似文献   

7.
一种基于XML的Web信息抽取方法   总被引:4,自引:2,他引:4  
目前Web资源含有大量的有用信息,但由于它们欠结构化,不能为传统的数据库型查询系统所利用。针对这一问题,出现了Web信息抽取技术。在论述了半结构化Web信息抽取技术总体解决方案的基础上,研究了Web信息抽取的实现技术,并从应用的角度提出一种新的半结构化信息获取方法。该方法包括网页分析过程、映射的自动生成和信息抽取过程。在Web信息抽取的实现部分,提出了抽取规则执行算法,为进一步满足Web信息检索提供了一种新的高效的检索方法。  相似文献   

8.
文本中实体关系的确定可以使计算机清楚文本中实体间的联系,进而可以通过其中一个实体和关系得出另一个实体,关系抽取技术用于抽取文本中实体之间的关系.随着互联网技术的发展,文本数据越来越庞大.关系抽取作为信息抽取的子任务,帮助人类从海量数据中获取有用的信息,实现将非结构化、半结构化的自然语言文本转化为结构化数据.在介绍关系抽取发展状况的基础上,将其按照不同的实现方式进行分类分析概括,如有监督关系抽取、半监督关系抽取、无监督关系抽取、联合抽取等.并通过实验数据进行对比,总结各种实现方式存在的不足及优势.最后,针对目前关系抽取的发展状况,指出了关系抽取面临的主要挑战以及未来的发展趋势.  相似文献   

9.
本文介绍了一个基于高校网站群的信息抽取模型的的设计与实现。信息抽取系统分为信息抽取模块、抽取标准分析模块、抽取结果展示模块,采用关键字搜寻方式来提取信息。本系统可以运行在校园网站群之上,自动对各种关键字进行匹配与提取。测试证明,这种方法完全满足高校网站群的需求。  相似文献   

10.
基于Web的信息抽取技术研究综述   总被引:1,自引:0,他引:1  
蒲筱哥 《现代情报》2007,27(10):215-219
本文在讨论Web信息抽取技术的发展历程、概念及其功能,Web信息抽取技术方法的分类及技术特点分析。Web信息抽取系统的构建研究及其性能评价的基础上。分析了当前研究存在的问题以及未来的研究方向。  相似文献   

11.
基于信息抽取的古籍知识检索系统研究   总被引:1,自引:0,他引:1  
通过分析目前古籍数据库信息检索系统存在的不足,提出通过利用信息抽取技术(IE)实现语义智能检索,使古籍数据库具有强大的智能检索功能和知识研究功能.  相似文献   

12.
侯锟  罗海龙 《科技广场》2007,22(3):117-118
本文研究了对于Web页面列表信息的抽取方法。通过对超文本文档特征的分析获取抽取知识,并通过自学习适应页面的变化,实现了对于列表信息的抽取。  相似文献   

13.
马彦 《现代情报》2014,34(11):29-33
通过分析大数据环境下微博舆情的发展特点和舆情自动监测的具体需求,设计了微博舆情热点挖掘系统结构模型,描述了各层的主要功能和实现方法.然后讨论了热点话题发现的方法,首先运用ICTCLAS和AntConc等工具提取热点词,其次描述规范化的数据表示形式,最后通过Chameleon聚类算法实现热点博文的聚类和话题抽取.该方法将对及时发现敏感信息和掌握舆情热点提供信息支持.  相似文献   

14.
【目的/意义】构建一个面向上市公司公告的篇章级信息抽取框架,实现多种类型信息的抽取,并服务于投 资和监管。【方法/过程】以深圳A股市场公告中的635篇并购重组公告为例,从中抽取了交易信息和公司财务指标 等信息,对框架和方法进行验证。【结果/结论】运用本文所提框架和方法实现的字段抽取准确率为87.6%,效果较 好。本文提出的信息抽取框架及方法在上市公司公告信息抽取中是有效的,可以为投资者的投资决策和监管机构 的监管提供数据基础。  相似文献   

15.
通过首先对当前信息抽取技术和现有的XML技术进行分析与研究,发现如何有效地确定抽取规则是当前Web信息抽取的主要难点。针对目前存在的问题,给出了一种基于XML的Web信息抽取的解决方案,并对其中相关的技术进行了深入的探讨和研究。  相似文献   

16.
数据挖掘技术在警务化管理系统中的应用主要有关联规则分析、学生的分类聚类、信息抽取等。通过建立数据挖掘模型、算法描述等阐述了数据挖掘技术在警务化管理系统中的实现。  相似文献   

17.
彭同坠 《科教文汇》2008,(36):278-278
信息抽取技术的研究旨在为人们提供一种更有利的获取信息的方式,针对互联网上web页面的异构性和动态性,本文提出了一种通用的web新闻页面信息抽取的方法。该方法克服了传统的网页信息抽取中针对不同的网站制作不同的包装器的缺点。本方法主要针对新闻页面正文、发布时间、转载情况的信息抽取,为自然语言处理的研究提供语料支持,其准确性能够很好地满足需求。  相似文献   

18.
李斌 《大众科技》2010,(4):48-49
文章阐述了web信息抽取的定义、抽取过程、Web信息抽取方法的分类,并指明了web信息抽取的应用领域和发展方向。  相似文献   

19.
曹进军 《情报杂志》2007,26(7):55-58
信息抽取器在信息抽取领域是一个很重要的部分,而抽取器的研制通常要依靠抽取规则来实现。以前是利用使用者的使用模式或记录,找出相关的抽取规则。而利用PAT Tree可以直接从半结构化的Web的资料中,找出抽取规则。  相似文献   

20.
叶小梁  李东旻 《现代情报》2006,26(11):62-64
本文利用现代的信息抽取、信息检索、信息门户等技术构建了一整套科技信息共享系统。系统地分模块对该系统进行设计和研究,将分散的科技信息资源通过科学的知识组织体系进行有机集成,实现引导用户方便有效地实现知识的发现和获取,实现高效率的信息共享。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号