首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
邱金鹏 《科技通报》2019,35(10):133-136
传统Web页面语义标注方法需手工处理,或只可将Web页面中有属性的标签赋予数据,针对无属性标签数据不进行标注,不适于大规模Web页面信息标注,且标注结果不可靠。为此,提出一种新的基于集成学习的动态Web页面语义标注方法。给出动态Web页面语义标注流程。将Web页面转换成DOM树,识别待标注文本。选取抽取信息特征与训练Web页面特征,将含有语义信息的内容分配至概念抽象化的本体上,采用多分类器集成学习方法进行分类,区分待标注信息是属性标签还是数据元素,通过不同分类器预测结果的一致性对相应样本被准确标注的置信度进行衡量。通过训练页面中涵盖的属性标注规则集与抽取信息中的属性名称实现语义标注。实验结果表明,所提方法适于大规模动态Web页面语义标注,标注结果可靠。  相似文献   

2.
张志武 《情报科学》2015,(4):121-124,131
针对传统的基于关键字Web图像检索中的语义缺失问题,结合Web图像的视觉特征和描述文本,利用本体描述Web图像的语义特征,构建了基于本体的Web图像语义检索模型。该模型以领域本体描述Web图像的语义特征,通过自动图像标注技术构建Web图像本体库,用户可以通过输入关键词或者提交示例图像进行图像检索。实验表明,该模型具有较高的图像检索准确率。  相似文献   

3.
文章提出两种Web环境下的语义挖掘模型,分别是基于语义标注的Web语义挖掘模型,即在语义标注的基础上实现智能化知识挖掘过程,获取高质量知识模式;基于本体映射的Web语义挖掘模型,即参照领域本体概念体系,运用本体映射技术,对所获取的知识模式进行语义修正.通过对语义分类模式的预测准确率、模型创建速度的实验对比分析,基于本体映射的Web语义挖掘模型所提出的算法略占优势.  相似文献   

4.
选用SAWSDL规范对Web服务描述文档进行了语义标注,并研究了Web服务匹配度的算法,开发了一个Web服务发现和匹配的框架体系,从执行语义、功能、10和服务质量4个方面完成了服务匹配的算法,并实现了服务发现和匹配。实验表明,该语义标注和服务匹配算法快捷简单,能较好地满足用户的服务请求,从而为Web服务自动组合打下了基础。  相似文献   

5.
社会化标注体现了Web2.0时代的集体智慧,隐含了丰富的语义信息。本文分析了社会化标注的认知过程,探讨了社会化标注的浮出语义,提出了一种社会化标注的语义聚类算法。从语义的角度对社会化标注进行分析,有助于理解和挖掘社会化标注的隐含语义,指导平面化的自由分类法进行本体构建,丰富语义网资源。  相似文献   

6.
为了提高用户对网站使用的效率,提高网站本体模型的搜索性能,研究一种高效的网页语义概念树构建方法,进行搜索覆盖度层状拓展。传统方法中,使用搜索引擎的词语相似度算法进行搜索拓展,利用规则、聚类等技术对形式背景进行约简,无法有效简历概念间的上下位关系,性能不好。提出一种基于语义主题树特征匹配的搜索覆盖度层状拓展方法,进行Web语义模型和主题树构建,构建特征空间互信息区域文档词频向量模型,对数据库中记录的属性字段进行归类抽象,形成概念汇聚点,实现语义主题树构建搜索覆盖度拓展设计,构建语义主题树特征匹配算法,优化搜索引擎对文本特征的搜索敏感度,提高搜索覆盖度,实现文本搜索覆盖度层状拓展。实验分析得出,该方法具有较好的文本特征分类结果,语义层次结构清晰,可以有效提高文本数据召回率和查准率,展示了较好的应用价值。  相似文献   

7.
[目的/意义]为提高主题建模结果的可读性,解决主题标注过程中主观性强、可解释性弱的问题,引入本体和关联规则构建频繁语义模式。[方法/过程]以肿瘤靶向治疗专利数据为研究对象,首先构建LDA2vec模型挖掘主题;然后考虑主题词的语义与共现,将UMLS本体与FP-growth关联规则相结合,得到频繁语义模式的主题标注;最后将结果与Canopy方法对比评估。[结果/结论]实证结果显示,基于频繁语义模式的标注能够从统计和语义的角度概括主题含义,在主题标注工作中效果更佳。  相似文献   

8.
在领域本体已知和文本语义标注主要步骤的基础上,本文用数据挖掘技术实现文本语义信息的获取,提出了文本语义分析与标注的基本思想和处理流程,深入探讨了用聚类分析完成实例分析与标注过程,用关联挖掘和分类方法完成实例间关系的分析与标注过程。  相似文献   

9.
[目的/意义]文章的研究目的是探索科学论文的语义标注模式以满足科研人员快速获取细粒度科学知识的需求。[方法/过程]结合已有的概念模型,提出了一个聚焦于描述科学论文论证过程的语义标注框架,并利用该框架对一篇认知心理学科学论文进行了语义标注实验以验证其有效性。[结果/结论]以上述科学论文为例,利用该框架对其物理结构、论证过程、科学结论和实验过程进行了语义标注,以此构建细粒度的语义出版物,并在此基础上实现了对科学论文的细粒度内容的检索。[局限]如何对科学论文中的图片、表格和数据集进行语义标注,需要进一步研究。  相似文献   

10.
路青  崔新春  胡艳波 《情报杂志》2012,31(4):43-47,53
语义角色标注作为语义分析的关键技术已经得到越来越广泛的关注.首先对中国期刊网数据库中语义角色标注研究领域的文献进行了统计分析,描述了国内语义角色标注研究的发展状况.主要通过对文献的论文年载量分析、著者分析、文献来源分析和研究主题分析揭示国内语义角色标注的发展历程和研究内容.然后分析了语义角色标注研究热点及发展趋势.最后,在分析国内语义角色标注发展的基础上,提出了促进语义角色标注研究发展的积极建议.  相似文献   

11.
国外典型语义标注平台的比较研究   总被引:2,自引:0,他引:2  
鞠彦辉  刘闯 《现代情报》2009,29(1):215-217
本文简要介绍了国外典型的语义标注平台,详细比较了它们的特点,分析了这些平台的不足,展望了语义标注的发展趋势。  相似文献   

12.
为了揭示不同物种描述数据源中数据的一致性程度,比较了《安徽植物志》、《河南植物志》和《山东植物志》中的100个物种的描述数据。结果表明,由于描述分类单元模式的选择、使用的术语以及数据表现形式等方面存在差异,造成各种植物志所含描述数据不一致成为广泛存在的现象。其中,部分相同的占62.54%,完全相同的部分仅占18.66%,相互矛盾的占1.47%,而只在一个数据源中出现的描述占17.34%。  相似文献   

13.
牟冬梅  范轶  吴昊 《情报科学》2008,26(12):1865-1868
对现今存在的几个有代表性的语义标引平台进行了简要的介绍,从标引方式、可扩展性,以及标引精度几个关键的方面对它们进行对比分析,并对语义标引平台今后的发展方向进行了展望.  相似文献   

14.
国外知识抽取系统研究   总被引:1,自引:0,他引:1  
对知识抽取的概念和起源进行论述,介绍GATE、KIM、ArtEquAKT等国外典型的知识抽取系统,分析各个系统的整体架构、关键技术、抽取过程及应用领域,挖掘这些系统在知识抽取方面的核心理念和突出特点,并从学习机制、抽取算法等方面进行了比较分析,总结得出知识抽取系统的研究现状及发展趋势,为数字图书馆中的知识抽取工作提供借鉴.  相似文献   

15.
针对文献检索的智能化发展趋势,提出基于领域本体的文献检索模型,对领域本体构建、语义标注计算和概念相似度计算进行研究,并把模型进行了实际应用。通过实验表明,基于领域本体的文献检索系统在检索结果上由于传统的检索方式,检索效率也有一定提高,具有研究的价值和意义。  相似文献   

16.
基于内容与形式交互的图书馆资源组织语义化方法研究   总被引:1,自引:0,他引:1  
本文提出了基于NLP理论与方法,结合传统图书馆资源组织方式(分类法、主题词法)与领域本体构建技术,搭建辅助构建及标注一体化平台,进而实现语义元数据体系构建与资源组织语义化过程同步实施的解决方案,这一思想与方法的提出与实现,可以有效地促进图书馆资源语义化进程,使语义自动标注与知识服务成为可能。
Abstract:
The paper proposes an idea of building a unified platform integrating assisted construction with assisted annotation,which is based on the theory and method of NLP,and integrates the traditional library resources organization mode with the domain ontology construction technology. The idea offers the solution to the synchronized implementation of semantic metadata system construction and resources organization semantization,which will promote the semantization process of library resources effectively and make automatic semantic annotation and knowledge service possible.  相似文献   

17.
李进华  李璐 《情报科学》2012,(6):914-918
科学工作流生命周期由服务组件的发现、解释、组合以及执行等流程组成,其中服务发现是关键。基于本体驱动的服务发现是科学工作流系统的核心功能,包括用于描述服务的本体构建,基于本体的领域/中间服务的语义注释以及基于语义注释的服务查询和组合。本文以生物信息学领域应用为例,阐述了生物信息学本体的功能构成,服务于生物信息学服务发现的领域/服务本体框架结构以及领域/服务本体的语义注释方式和模式。  相似文献   

18.
姜华 《情报科学》2008,28(11):1685-1688,1698
基于本体基础提出相似度和相关度分析,以充分挖掘领域本体所提供的背景知识,通过语义推理将描述的隐含语义显式化,提供计算机被描述资源的可理解语义.设计了实现该方法的Web信息检索模型,实验表明该方法能提高查准率和查全率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号