首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
基于GATE语义标注的Web信息的自动抽取   总被引:1,自引:0,他引:1  
重点研究基于语义标注样本的Web信息自动抽取的实现方法。借助自然语言处理框架GATE,首先引入领域本体对样本网页内容进行语义标注,精确定位出待抽取的语义项,并据此将样本网页解析为S DOM树。从S DOM树中抽取出语义项的特征描述,形成样本实例并采用机器学习算法归纳抽取规则,自动生成包装器。抽取过程中,通过比较网页结构的相似度,系统能够感知网页的变化,主动学习并扩展规则库。试验结果表明,由于精确定位保障了学习样本的质量,小样本学习生成的包装器能够达到较为理想的查全率和查准率。  相似文献   

2.
科技论文英文参考文献的文内标注   总被引:1,自引:0,他引:1  
袁晓萍  王亨君  张翔 《编辑学报》2006,18(4):319-320
分析采用作者-出版年制的英文参考文献文内标注存在的问题,并提出了解决方法.编辑部可以通过征稿简则、审稿单以及日常工作使作者、审稿人和编辑做到正确进行英文文献的文内标注.  相似文献   

3.
关于在论文中标注参考文献顺序码的位置问题   总被引:4,自引:0,他引:4  
金龙林 《编辑学报》1994,6(4):240-241
关于在论文中标注参考文献顺序码的位置问题金龙林目前,我国绝大部分出版物多采用顺序编码制参考文献标引法。因为这种方法以最全面的信息佐证著者的论点,很受读者的欢迎。但是,笔者仔细地翻阅一期刊物时发现,参考文献标注码(以下简称“标码”)在正文中的位置极不统...  相似文献   

4.
浅谈参考文献的标注方法   总被引:2,自引:0,他引:2  
陈文光 《编辑学报》1994,6(4):239-240
浅谈参考文献的标注方法陈文光中华人民共和国国家标准GB7714一87文后参考文献著录规则和国家标准GB3719一92科学技术期刊编排格式都对参考文献的标注作了原则规定。笔者曾对一些科技期刊或科技出版物作过一些调查,发现在一些科技期刊或出版物中没有完全...  相似文献   

5.
甘可建  庄爱华 《编辑学报》2008,20(3):229-230
论文中文献标注格式不规范、甚至标注不当导致表达意思错误的情况仍较普遍。列举一些中华医学会系列杂志刊登的论文文内参考文献标注不当的问题,并对这些问题进行归纳和分析。  相似文献   

6.
虽然GB/T 7714-2005对文后参考文献格式作了明确规定,但是并未对文内参考文献位置详细说明。本文通过对一些科技期刊参考文献文内标注位置的调查,结合编辑实践,分析其标注位置的正确与否,探讨了"带引号"和"无引号"参考文献文内的正确标注位置。  相似文献   

7.
也谈参考文献标注位置问题   总被引:5,自引:1,他引:4  
  相似文献   

8.
参考文献的标注与著录分析   总被引:2,自引:0,他引:2  
参考文献是论著的重要组成部分,不容忽视,其规范化一直是人们不断探讨的问题。文章就目前参考文献标注和著录存在的主要问题进行分析并提出一定的建议。  相似文献   

9.
随着Web网页数量的爆炸式增长和网页噪声不断增多,网上获取重要信息变得越来越困难.本文从一个新的角度,提出了一种基于自然标注的网页信息抽取方法.依据这种方法,首先对网页进行聚类,提取具有相似结构的网页并进行相同的标注,然后采用SVM对抽取项进行训练,最后提取到需要抽取的数据.文章的主要贡献在于对网页中的自然标注进行分析和发现,给出了九大类自然标注的例子,并结合聚类和支持向量机,给出了训练方法.从实验结果上看,本方法优于其他方法.  相似文献   

10.
科技论文参考文献引用不当及文中标注不规范的问题分析   总被引:1,自引:0,他引:1  
许花桃 《编辑学报》2011,23(4):318-319
结合编辑工作实践,对科技论文中参考文献引用不当及文中标注不规范问题进行了分析,期望有助于提高科技期刊参考文献的著录质量。  相似文献   

11.
事件检测与描述(Event Detection and Characterization,EDC)自2005年作为自动内容抽取(Automatic ContentExtraction,ACE)评测的一个重要子任务出现以来,中文事件的标注、检测与描述越来越成为研究热点。本文就自动内容抽取中的中文事件标注进行详细、系统地研究,主要包括:在ACE会议定义中文事件相关概念的基础上,给出事件标注中事件的可标注内容,包括事件范围及事件触发词等;根据生活中的事件分类在人工事件标注中对EDC的事件进行类别划分及其子类的详细区分,以降低事件检测的复杂度;对每个事件类别(包括子类别)中构成事件的元素进行研究,综合事件类别及其元素信息完成中文事件的标注。本文的研究成果在中文文本信息抽取、自动摘要及主题检测与追踪中得到了很好的应用。  相似文献   

12.
列举并分析一些图书馆界普遍认可的核心价值,提出图书馆面临的关键问题之一是如何在实际工作中诠释并实现图书馆核心价值。以一种新型的信息服务模式--信息共享空间(IC)为着眼点,简要介绍IC的概念、特点、结构和功能,详细论述在图书馆IC中如何诠释并实现图书馆的核心价值。   相似文献   

13.
基于本体的军备情报抽取系统主要由两部分构成:知识库和处理程序。该系统基于文本分类技术实现武器类别判定,基于命名实体识别技术实现武器对象判定。依据句法语义约束所形成的信息抽取规则,实现军备情报抽取,并依据本体在一定程度上实现语义层面上的信息整合。  相似文献   

14.
研究了一种能够实现对数据型网页中信息实施实时采集的信息技术。该技术能够智能识别表格结构,自动分离数据项,在对数据项的分析判断过程中,采用从单词上分类(By Words)和从表格排列方式(By Structure)划分相结合的方法,以Ontology思想为支撑,融合支持向量机算法(SVM)和隐马尔可夫模型(HMM)等一系列成熟模型。最后通过测试并将该技术应用于TBT预警信息动态采集子系统中,收到良好效果。  相似文献   

15.
牛玲 《图书馆杂志》2006,25(8):22-25
个人参考文献的集中化管理是科研工作者必须要面临的难题。本文首先比较了目前流行的信息管理软件Reference Manager、Endnote和Pro—Cite,接着以Reference Manager为例,论述了构建个人参考文献图书馆的多种方法:人工录入,联机检索导入和网络检索间接导入;并详细说明了个人参考文献的使用方法,最后对Reference Manager的不足提出自己的建议。  相似文献   

16.
本文研究了通过信息抽取提取用户兴趣和需求来实现信息推送服务的课题.根据信息抽取过程,将基于信息抽取的信息推送系统划分为用户管理、资源管理、信息推送三个模块.  相似文献   

17.
信息抽取系统的研究现状   总被引:16,自引:0,他引:16  
对信息抽取的概念和发展状况做了论述,介绍了国内外信息抽取系统发展状况,指出了存在的问题以及相应的解决方案,最后对中文信息抽取系统的建设提出了几点建议。  相似文献   

18.
揭示数据起源的概念和意义,通过建立W7模式标注数据起源,并比较几种常用的描述模型,包括逆SQL语句、时序图、有向图、XML/RDF,以数据起源在生物信息学上的应用举例阐述。  相似文献   

19.
针对传统TF-IDF在文本过滤时存在的缺点,提出一种基于特征词抽取的文本过滤算法。简要分析文档信息过滤原理和流程,重点讨论文档信息过滤算法设计及技术实现。实验结果表明,所提出的算法可有效对文档信息进行过滤,能够提高信息检索质量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号