首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
文章在对国内外相关文献进行归纳和梳理的基础上,从半结构化文本知识抽取的载体类型、内容与技术方法3个方面,对其研究现状与进展进行了综合论述,并展望了未来的研究发展趋势。  相似文献   

2.
马玉春  孙冰 《情报科学》2005,23(9):1376-1380
针对股票的网站越来越多,如何从这些网站的有关页面进行信息抽取,并得到相关知识,为股民提供股票交易的决策参考,是一个值得研究的课题。本文剖析了信息抽取常用的Wrapper方法,以及抽取知识的获取方法。最后,根据可视化信息抽取的原则,设计了一个可视化信息抽取的实验,取得了良好的效果。  相似文献   

3.
自由文本信息抽取技术   总被引:13,自引:0,他引:13  
李向阳  苗壮 《情报科学》2004,22(7):815-821,829
信息抽取是从自由文本语料库构建数据库,实现情报自动收集的有效途径之一。近十多年来,信息抽取技术逐步走向成熟,已成为与信息检索相平行的技术之一。对信息抽取技术进行系统的归类、总结,已显得较为迫切。在对当前多种主要的信息抽取技术进行分析、比较的基础上,结合信息抽取所面临的挑战,分析了信息抽取的三个趋势。  相似文献   

4.
基于信息抽取的文本知识挖掘模型研究   总被引:3,自引:0,他引:3  
从文本知识挖掘的定义入手,分析了文本知识挖掘的关键技术,并在此基础上建立了基于信息抽取的文本知识挖掘模型,最后通过实例(DiscoTEX)说明这个模型是可行的。  相似文献   

5.
一种基于XML的Web信息抽取方法   总被引:6,自引:2,他引:4  
目前Web资源含有大量的有用信息,但由于它们欠结构化,不能为传统的数据库型查询系统所利用。针对这一问题,出现了Web信息抽取技术。在论述了半结构化Web信息抽取技术总体解决方案的基础上,研究了Web信息抽取的实现技术,并从应用的角度提出一种新的半结构化信息获取方法。该方法包括网页分析过程、映射的自动生成和信息抽取过程。在Web信息抽取的实现部分,提出了抽取规则执行算法,为进一步满足Web信息检索提供了一种新的高效的检索方法。  相似文献   

6.
基于文本内容的农业网页信息抽取和分类研究   总被引:1,自引:0,他引:1  
朱学芳  冯曦曦 《情报科学》2012,(7):1012-1015
通过对农业网页的HTML结构和特征研究,叙述基于文本内容的农业网页信息抽取和分类实验研究过程。实验中利用DOM结构对农业网页信息进行信息抽取和预处理,并根据文本的内容自动计算文本类别属性,得到特征词,通过总结样本文档的特征,对遇到的新文档进行自动分类。实验结果表明,本文信息提取的时间复杂度比较小、精确度高,提高了分类的正确率。  相似文献   

7.
[研究目的]为了帮助政府、企业和科研人员从海量的听证公开文本中发现科技相关政策和热点,快速、全面地识别出有价值的信息。[研究方法]梳理听证公开文本的类型与特点,并对其中有价值的信息进行合理的界定与分类;根据文本的内容特征和话语特征提出事件句识别、事件类型检测和事件论元抽取的三阶段式事件抽取方法,以实现有价值信息的抽取;对抽取的有价值信息进行深入分析。[研究结论]与基准模型相比,该研究所提方法在事件句识别召回率上提高33%,F1提高17%,在事件类型检测的精确率上提高1%,在事件论元抽取的精确率上提高18%,召回率提高4%,取得了一定效果,为此类文本进一步分析提供了新研究思路。  相似文献   

8.
李中言 《现代情报》2005,25(12):67-68
信息抽取的目标是自动从文本信息中抽取出预先想要得到的信息(知识),它提供了一条从浩瀚的信息堆积中抽取出与用户相关信息的一条思路。文章分析了信息抽取的主要概念、主要分析了信息抽取的类型和信息抽取系统的一般结构及功能。  相似文献   

9.
基于Web的信息抽取技术研究综述   总被引:1,自引:0,他引:1  
蒲筱哥 《现代情报》2007,27(10):215-219
本文在讨论Web信息抽取技术的发展历程、概念及其功能,Web信息抽取技术方法的分类及技术特点分析。Web信息抽取系统的构建研究及其性能评价的基础上。分析了当前研究存在的问题以及未来的研究方向。  相似文献   

10.
史旗凯  郭菊娥 《情报科学》2008,26(10):1558-1562
为了实现对管理领域中主题的准确识别,在从管理活动描述文本中抽取管理问题特定信息的基础上.通过系统考察从文本表示、特征降维到聚类分析的方法技术特点,并提出类特征概化这一新的概念和实现方法.完成了对所研究问题的解决方案设计.实证分析结果与问卷结果和访谈结论所进行的综合分析和判断结果相比较,初步验证了本研究方法对于主题识别的有效性和可行性.  相似文献   

11.
基于模式聚合和决策树的文本分类规则抽取   总被引:1,自引:0,他引:1  
王煜  王正欧 《情报科学》2006,24(1):96-99,123
本文首先提出一种改进的X^2统计量,以此衡量词条对文本分类的贡献。然后根据模式聚合理论,将对各文本类分类贡献比例相近似的词条聚合为一个特征,建立出文本集的特征向量空间模型。此方法有效地降低了文本特征向量空间的维数。最后使用决策树进行分类,从而既保证了分类精度又获得了决策树易于抽取可理解的分类规则的优势。  相似文献   

12.
基于模式匹配抽取技术的网上产品情报获取   总被引:1,自引:0,他引:1  
产品生命周期的逐渐缩短迫使企业关注从因特网上大量、散乱的信息中及时获取新产品信息,跟踪竞争对手研发动向。本文引入基于模式匹配的自动Web信息抽取技术,叙述抽取产品的关键信息方法,并以家用冰箱性能参数信息的自动抽取为例,分析了冰箱领域知识,进行了样本页面的分析归纳,确认了冰箱产品的多种属性及产品信息抽取的模式特征,最终获得了清晰、结构化的产品数据,形成从Web页面上抽取同类产品关键信息的整个处理流程模型,成为网络环境下情报采集与分析的新情报研究模式的一个有力探索。  相似文献   

13.
首先介绍基于树模型的两种回归算法,通过在Weka平台上实验所得数据,对该模型下的这两种算法的预测性能给予评估。  相似文献   

14.
伊犁新垦区土壤盐碱化遥感信息的提取   总被引:1,自引:1,他引:1  
马瀚青  杨小唤 《资源科学》2009,31(12):2065-2071
土壤盐碱化是土地资源利用的主要障碍因子之一,利用遥感数据快速准确地提取盐碱地信息及其空间分布,可以为土地资源开发利用提供重要的科学依据,有着重要的现实意义。本文以新疆伊犁新垦区为研究区域,利用专家知识建立决策树,使用2008年8月的ETM数据,结合基础地理信息数据,提取不同程度的盐碱地信息。研究表明,利用基于知识的决策树方法,结合多源数据,能够有效提取盐碱地信息,并且分类结果准确,精度达到89.3% 。新垦区盐碱地占全区面积的10%,主要分布在伊犁河南岸大灌区,各级盐碱地比例为:重盐碱地占1%、中盐碱地占17%、轻盐碱地占82%。  相似文献   

15.
目前数据挖掘技术已广泛应用到诸如金融、医学、军事、工业等众多领域中。本文基于数据挖掘技术的理论背景,运用判定树归纳分类方法,同时依据军事训练管理考核成绩,对军事训练管理情况进行预测、管理效果评估,并对其管理方法做出分析指导。  相似文献   

16.
开放领域的问答系统是自然语言处理领域中具有挑战性的研究方向.答案抽取是问答系统的关键,在基于模式匹配的答案抽取方法中,答案是借助于问题的答案模式抽取得到,因此,答案模式的评价对候选答案排序及答案的最终选择起着决定性的作用.参照传统的答案模式评价方法,提出一种改进的模式评价方法,分别在传统和改进两种答案模式评价方法下进行了答案抽取实验.实验结果表明应用改进的答案模式评价方法,答案抽取性能明显提高.  相似文献   

17.
基于分布式科研项目数据的关联模式挖掘框架   总被引:1,自引:0,他引:1  
胡少华 《情报杂志》2012,31(8):156-160
储存于不同组织实施环节的科研项目数据中隐含了大量有用的关联模式信息,针对科研项目数据的分布性特点,提出了基于采集代理和中心节点的采集挖掘体系框架,一方面依据转换规则库、映射规 则库、元数据参照进行集成、转化、清洗和归一化处理,形成语义一致、面向不同主题的科研项目特征数据;另一方面建立特征属性定义表,利用多维关联规则实现对科研项目关联模式的挖掘分析.  相似文献   

18.
将平面连杆机构的二副杆、三副杆、机架等构件定义为机构二叉树的结点集合,通过定义构件的联接规则,将机构表示为二叉树数据结构,其中树的节点和左、右孩子包含了连接副和构件几何参数等信息。通过对二叉树的后序遍历算法建立了平面连杆机构运动分析方法,采用面向对象技术开发了平面连杆机构运动仿真软件,实现了平面连杆机构的运动分析与仿真,仿真算例表明了该方法的有效性。  相似文献   

19.
基于DEM提取坡度信息   总被引:2,自引:0,他引:2  
文章以内蒙古多伦县为实验样区,以1∶5万地形图为数据源,建立研究区三维DEM提取坡度信息。  相似文献   

20.
在基于Bootstrap的信息抽取技术中,为提高实体关系抽取模式的质量,需要对抽取模式的可信度进行评估.本文提出了根据模式的历史匹配记录来对其进行可信度评估的简单方法,并以此为基础对模式进行了优化合并.经过可信度评估的模式在对句子进行实体关系标注时,有效提高了标注的准确率.这说明该方法能够提高抽取模式的质量,对信息抽取系统的性能提高有一定价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号