首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
提出一种基于潜在语义索引和本体论的文本语义处理方法。首先构建一个基于本体论的虚拟标准文本特征向量,然后采用潜在语义索引方法以虚拟标准文本特征向量为参照对文本集进行语义聚类,最后在虚拟标准文本特征向量的导引下利用本体库中的知识对聚类获得的文本集合的类别和语义进行显性标注。实验表明,该方法能较好地在语义层面对文本进行有效的聚类,而且聚类结果能显性地显示类聚所属的类别。  相似文献   

2.
自动图像标注技术是图像检索技术的最新发展,已经成为机器学习、图像语义理解和信息检索研究领域的热点.本文对自动图像标注目前国内外的研究概貌进行了分析,按照自动图像标注中的关键要点--语义学习的不同,将现有文献中的自动图像标注技术分为三个类别,并对这三个类别分别进行描述,同时总结了自动图像标注派生出的两个新的研究方向.最后对目前研究中存在的问题进行了讨论,并探讨了自动图像标注领域的进一步研究方向.  相似文献   

3.
陆泉  陈静  丁恒 《图书情报工作》2014,58(12):118-123
以现存的大量图像社会标签为基础,设计基于社会标签的图像情感自动分类标注模型,提出图像社会标签对情感的贡献度、区分度以及标签在情感维度上的权重3个因子及计算方法,实现图像5种基本情感语义的分类标注。在实际社会网络数据集上进行验证实验,结果表明建立的模型方法在自动标注图像情感语义方面具有较高的准确性和应用性。同时还发现,实际数据集中情感分布差异与复合情感对图像自动标注具有影响。  相似文献   

4.
针对现有语义标注系统通用性差的问题,本研究设计了基于先导词算法的MARTT语义标注系统。MARTT利用有监督的机器学习方法从文本中提取领域规则,以适应不同的数据集。为了检验算法的效率,研究以中国植物志和北美植物志数据为样本,运用十折交叉论证方法与NB、SVM的标注性能进行了比较。结果表明,先导词算法在准确率、召回率及计算成本上均优于其它两种算法。而且,在两个不同的数据集上都获得了理想的结果,证实MARTT所具有的良好适应性。  相似文献   

5.
在现有文献中语义标注描述的基础上,对语义标注的内涵和特征进行阐述,给出了语义标注的定义,论述了语义标注与网络标注的差异,分析了语义标注的主要特点;通过文献计量分析法分别从文献的年代分布、期刊来源分布、关键词分布三个方面的统计结果出发进行语义标注的研究现状分析,进而发现当前语义标注研究的侧重点;最后探讨了语义标注未来研究的发展趋势。  相似文献   

6.
数字图像语义标注模型比较与分析   总被引:1,自引:0,他引:1  
[目的/意义]图像语义标注的基础是图像语义标注模型的构建,对当前主流图像语义标注模型进行梳理和总结,剖析其在图像语义标注中的优缺点,可为后续相关研究提供借鉴和参考。[方法/过程]采用文献调研法,总结出4类主要的图像语义标注模型,即Eakins模型、Jaimes&Chang模型、Kong模型、Panofsky模型。其后采用比较法和归纳法,从语义层次、可扩展性以及应用范围和方式3个方面对前三类模型进行比较分析。[结果/结论]Eakins模型语义层次最全面,语义表达能力最强,应用范围最广;Kong模型的可扩展性最强,适应性最好。  相似文献   

7.
语义网的实现需要为网络上现有的和新的文档进行广泛可用的语义标注,使其内容可被机器所识别和理解。语义标注是清晰、明确、容易理解的,可作为大量应用的服务基础,适用于多种文本,包括网页、普通(非网络)文档、数据库中的文本等。本文根据语义标注的研究历程,介绍了国内外面向文本的语义标注研究现状,对语义标注所使用的技术进行总结;在已有语义标注方法分类的基础上,对现有的标注方法进行分类分析;指出了近年来语义标注方法的不足,并探讨了面向文本文档的语义标注发展趋势。  相似文献   

8.
从《中国植物志》中随机采集1 000个文档作为数据集,采用自主学习规则与先导词相结合的算法实现中文物种描述文本的语义标注。实验数据表明,本研究设计的基于规则的算法整体标注效率(F值)达到0.930,大部分元素的F值在0.724-0.964之间,该算法优于朴素贝叶斯分类算法。同时证明,先导词对优化算法具有积极意义。  相似文献   

9.
科技查新工作是高校图书馆的一项重要服务,为实现查新自动化,需要适当的语义化规则。文章采用改良的语义角色标注法,将描述研究的文本内容视为由主动因素、被动因素、研究对象、变化四类角色组成,并以一种包含文本中的语义角色、关键词词组与同义词的五层树结构表达文本的语义。语义化后的查新点可与未处理的文献直接比较,以获知两者是否相关与何处相关,并生成可直接用于查新报告结论部分的文本。这一方法被用于查新报告生成程序从而辅助并减少人工判断。  相似文献   

10.
基于GATE语义标注的Web信息的自动抽取   总被引:1,自引:0,他引:1  
重点研究基于语义标注样本的Web信息自动抽取的实现方法。借助自然语言处理框架GATE,首先引入领域本体对样本网页内容进行语义标注,精确定位出待抽取的语义项,并据此将样本网页解析为S DOM树。从S DOM树中抽取出语义项的特征描述,形成样本实例并采用机器学习算法归纳抽取规则,自动生成包装器。抽取过程中,通过比较网页结构的相似度,系统能够感知网页的变化,主动学习并扩展规则库。试验结果表明,由于精确定位保障了学习样本的质量,小样本学习生成的包装器能够达到较为理想的查全率和查准率。  相似文献   

11.
社会标签的规范性研究——学术论文标注   总被引:1,自引:0,他引:1  
吴丹  王艳妮 《图书馆》2012,(1):85-88
分析社会标签的特点,比较社会标签与主题词、标引词、关键词的概念,分析学术论文标注的作用与典型的学术论文标注系统,以图书情报领域为例,就用户的学术论文标注与学术论文数据库标引进行对比实验,显示出社会标签与受控的主题词的重合率不高的问题。详细分析实验结果,提出对学术论文标注进行规范控制的建议。  相似文献   

12.
随着Web网页数量的爆炸式增长和网页噪声不断增多,网上获取重要信息变得越来越困难.本文从一个新的角度,提出了一种基于自然标注的网页信息抽取方法.依据这种方法,首先对网页进行聚类,提取具有相似结构的网页并进行相同的标注,然后采用SVM对抽取项进行训练,最后提取到需要抽取的数据.文章的主要贡献在于对网页中的自然标注进行分析和发现,给出了九大类自然标注的例子,并结合聚类和支持向量机,给出了训练方法.从实验结果上看,本方法优于其他方法.  相似文献   

13.
叙事型图像语义标注模型研究   总被引:4,自引:2,他引:2  
由于叙事型图像对时空语义信息表达的特殊性,目前叙事相关的语义模型并不适合直接用于该类型图像的语义标注。针对这一问题,本文设计了一个适用于叙事型图像的深度语义标注本体模型。该模型借助模块化本体设计思想,结合开放标注协同框架(OAC),以情节、实体、活动、情境为核心,解决了叙事型图像时空信息组织表达以及叙事模型和标注信息映射的问题。使用嵌入该标注模型的图像语义标注工具,对敦煌壁画进行语义标注实验,验证了该模型的可靠性和可用性。但是叙事型图像中情节的划分存在不同的见解,给情节提取和标注带来了不确定性,这是图像深度语义标注面临的挑战。图8。表1。参考文献22。  相似文献   

14.
面向医学领域的语义互联模拟系统(MOSISS)是数字资源语义互联研究的实例支撑。语义标注子系统是MOSISS的重点子系统。在基于本体的语义标注思想指导下,阐述该子系统的设计思想、体系结构以及功能,探索多领域本体在语义标注中的应用,为用户提供一种共享数据的方式。  相似文献   

15.
在分析社会化标注系统标签检索研究现状基础上,针对传统方法可计算性不高、完备性不够、无法分辨自然语言的语义模糊性等不足,提出基于潜在语义分析的社会化标注系统标签语义检索模型,改进标签-资源矩阵权重计算算法,完善社会化标注系统的语义标注方法。并以delicious系统为例,抓取数据进行验证分析,通过对比,证明提出的模型和改进的算法能显著提高标签检索效率。  相似文献   

16.
大众标注系统中基于本体的语义检索研究综述   总被引:1,自引:0,他引:1  
针对大众标注系统中由于用户添加标签的多样性和模糊性导致的检索准确性问题,建立基于本体的大众标注系统语义检索模型,分析需要解决的关键问题,如基于社会化标签建立系统专用的本体和利用构建的本体实现语义检索,据此详细分类并阐述当前研究,并对未来研究进行展望。  相似文献   

17.
网络标注的主要方法概述   总被引:1,自引:0,他引:1  
认为标注对于检索至关重要,网络标注在网络资源海量的今天更是如此.介绍网络中标注的方法:元数据标注、聚类标注和分类标注,并对大众标注和语义标注进行详细介绍.最后对这些标法方法进行比较分析及评价.  相似文献   

18.
社会化标注理论研究综述   总被引:7,自引:0,他引:7  
社会化标注,将众多用户与信息资源联系起来,形成用户与资源的关系网络.这种关系网络为信息的组织、检索与推荐提供了新的思路.目前社会化标注网站已成为互联网研究中的一个热门领域.鉴于此,很多研究者进行了相关研究,但目前的研究还停留在理论层面的探讨,处理的方法还较为初步,研究成果往往是试验性的,还难以将其直接应用到产业领域.因此,亟需有更多对社会化标注感兴趣的研究者加入,以推动社会化标注理论的发展与在实践中的应用.  相似文献   

19.
语义维基技术及应用   总被引:8,自引:0,他引:8  
语义维基系统就是将传统的维基系统和语义网技术结合起来,这样使得一方面维基系统可以利用语义网技术提供比目前的维基系统更好的用户界面、更先进的检索和导航工具,另一方面语义网也以借助维基的方便、简单性和共享性使得非技术的普通用户也能够参与到语义网建设中。本文主要介绍了语义维基的特点,及在本体工程、知识管理和教育环境的应用,并介绍了国外5个具有代表性的语义维基原型系统。  相似文献   

20.
利用语义角色标注技术对文献进行标注,以句子为最小单位进行文献的语义相似度检测。提取文献中所有词语的上位词,为每篇文献形成句子-词-语义角色-上位词四部图。语义相似的句子对比参照四部图确定,最终计算出两篇文献相似句子的Jaccard系数作为两篇文献的语义相似度。实验结果表明,所识别出的语义相似度较字粒度Jaccard系数法、词粒度Jaccard系数法、Winnowing Jaccard系数法等高出13%,然而受语料库限制,本方法还有很大的提升空间。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号