首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
对文本概念中国本土化改造中形成的两组对应性范畴——广义文本与狭义文本、语义意义上的文本与符号学意义上的文本——做了简要的评述与讨论。  相似文献   

2.
文本浅识   总被引:7,自引:5,他引:2  
“文本”在本质上是对文献内在的指称,但在一定语用环境中可与“文献”近义使用;“文本”概念界定可分为本体论、传播学、阐释学三个视角;文本阐释的主体不仅仅只是受众。  相似文献   

3.
注疏是对古代典籍注释及再注释而形成的文本,不仅反映注疏者对古籍文本的认知理解,也是后人理解、传承与传播思想与文化的重要基础。利用本体和纳米出版物等语义技术对注疏文本进行知识表示和语义化建模,可以揭示注疏文献中蕴含的知识间的语义关系,并实现注疏文献的语义化出版与再造。为验证注疏知识表示和语义化建模方法的可行性及实用性,本文设计了包含引用关系的阐释本体,并以部分注疏文本为语料,实现了以纳米出版物为独立出版单位的注疏语义化表示与引用关系推断。实验证明,阐释本体可作为单语篇注疏知识单元结构化和跨语篇注疏知识单元关联化的数据模型,助力注疏文献的数据化处理与价值增值。注疏知识的语义化表示路径可以为古籍知识库建设、语义出版和数字化再造提供参考。图6。表5。参考文献41。  相似文献   

4.
超越阅读:文本阐释理论中的阅读范畴   总被引:1,自引:0,他引:1  
文本阐释理论中的阅读范畴已经超越了一般意义上的阅读概念 ;在宏观上 ,阅读不仅仅是一种社会现象或精神现象 ,更是一种人类文化与精神的最基本的“对话”模式、文献传播与文本阐释的核心形式以及人类生命体验的重要形态 ;在微观上 ,文本阐释理论则更多地注意、考察个体阅读行为的本质特征、价值意义与结构  相似文献   

5.
[目的/意义]技术创新服务平台的建设中需要智能搜索引擎技术,智能搜索引擎技术的内涵或者说重点在于自动语义标注.技术创新服务平台上对搜索引擎的要求,与大众的搜索引擎的需求还是不同的,处理的对象主要是专业领域的文本,通过语义标注技术,能快速对企业文档进行语义化和结构化组织,从而为企业提供精准的知识服务.[方法/过程]针对专业领域语义标注的相关问题,在进行深入研究与探讨的基础上,将语义标注理解为是对一组文档资源进行组织语义化的过程,提出利用结构化语义概念资源或集合对数字化文本进行自动标引的方法,并根据概念实体出现频次、位置和关系等因素,自动抽取相关语义概念集合,实现相关文本的语义内容的自动标注.[结果/结论]评价语义标注相关实验的效果,展示语义标注的具体应用场景.同时,体现领域本体与语义标注语料不断更新、进化、形成互动的过程,旨在为专业领域的语义自动标注及智能搜索引擎的构建提供有益的参考.  相似文献   

6.
人文文献观是现代文献学的基本取向。人文文献观视角下的文本概念,一是标志文献内在的范畴,二是蕴含了文献价值本体论意义。  相似文献   

7.
面向科技文献的多模态语义关联特征提取与表达体系研究   总被引:1,自引:0,他引:1  
科技文献资源是一种多模态数据,除文本信息外,还包含丰富的图像、表格、公式、音频、视频等多种模态的信息,有利于用户充分理解科技文献资源中的知识。该文把多模态思想引入科技文献的语义表示方面,对科技文献中的图像、表格和公式信息进行语义分析,与文本信息共同表示文献语义内容,通过科技文献中多种模态信息的语义表示及相互关系完善科技文献内容的语义化表示,发展刻画科技文献对象多态性的表达体系。  相似文献   

8.
在对概念语义相似度方法调研的基础上,本文提出基于概念向量的文本语义相似度测度方法,借助MetaMap工具抽取文本中的概念术语,将概念术语通过词表层级结构转化为概念向量,通过计算两文本中概念向量的语义相似度来测度两文本的语义相似度。为验证基于概念向量文本语义相似度方法的准确性,选取TREC-05 genomics track数据进行实验,实验结果表明,本文提出的方法较常用的余弦方法更优,与专家评估方法更接近,在测度文本语义相似度上具有一定的可行性和有效性。  相似文献   

9.
中文关键词自动标引方法新探   总被引:2,自引:0,他引:2  
提出以词汇对文献网络结构的贡献度作为提取关键词的衡量标准,突破小世界网络理论的物理意义,建立了以文献语义的小世界网络为基础的关键词自动抽取与标引的方法。实验发现,用该方法抽取的关键词更直观地揭示了文献的中心思想与重要概念,深度挖掘了文献潜在的知识内涵,若用它们作为表达文本知识的标识,则在一定程度上可改善集中式搜索引擎的全文检索质量,提高查准率。  相似文献   

10.
基于知识元的科技文本内容描述框架研究   总被引:1,自引:0,他引:1  
[目的/意义] 从细粒度角度深化科技文本的内容语义描述,弥补目前文本知识对象特征描述粒度较粗且缺乏语义的不足,为知识重组与挖掘,提供精细化的用户知识服务给予一种思路。[方法/过程] 以知识元理论为基础,通过对科技文本内部属性的语义分析,尝试构建细粒度的科技文本内容描述框架,给出两个实例并讨论。[结果/结论] 该内容描述框架实现了检索结果从海量的文献单元聚焦到精准化的知识元的转变。  相似文献   

11.
设计并实现一个基于向量空间模型和简单贝叶斯的文本分类系统,系统采用层级多标签的分类策略。详细介绍词语切分统计、终分类器值计算、层级小类校正和兼类判断四个子系统模块。基于向量空间模型分类的第一级大类和层级小类的微平均分别为89.7%和77.8%,简单贝叶斯分别为67.6%和66.5%。  相似文献   

12.
提出一种新的领域本体学习方法,结合形式概念分析(FCA)与关联规则挖掘从非结构化文本中获取情报学本体。该方法从文本集中通过种子-扩展机制的方法获取领域核心概念,构建文档概念格(文档×关键词矩阵),在此基础上通过形式概念分析方法来识别概念之间的等级关系,通过关联规则挖掘概念间的相关关系。最后,采用基于"黄金标准"的方法对本体学习的结果进行评价,结果表明:通过这种方法构建的本体可以达到较高的领域知识覆盖率,而且能够识别概念之间部分隐含的关系,从而验证该方法在领域本体的构建中实用且有效。  相似文献   

13.
蔡巍  王永成  尹中航  李伟 《情报学报》2004,23(4):399-403
本文着重研究了自动分类知识库中因为样本兼类而引起的存在于概念类频中的噪声 ,提出了借助于统计特性来修正概念类频的算法。在进行理论分析的基础上 ,本文讨论了算法的实现步骤 ,并通过对新闻语料的分类实验 ,检验了降噪效果。实验显示 ,本方法可以减少兼类概念在知识库中的冗余次数 ,提高自动分类系统的性能指标  相似文献   

14.
本文界定了任免类公文的定义,明确区分出其使用范围,概括了任免类公文的通用写作模式,总结了任免类公文写作上应注意的问题,并针对任免类公文在使用中经常出现的错用、混用现象提出了区分、选用文种的方法和见解。  相似文献   

15.
In this paper a machine learning approach for classifying Arabic text documents is presented. To handle the high dimensionality of text documents, embeddings are used to map each document (instance) into R (the set of real numbers) representing the tri-gram frequency statistics profiles for a document. Classification is achieved by computing a dissimilarity measure, called the Manhattan distance, between the profile of the instance to be classified and the profiles of all the instances in the training set. The class (category) to which an instance (document) belongs is the one with the least computed Manhattan measure. The Dice similarity measure is used to compare the performance of method. Results show that tri-gram text classification using the Dice measure outperforms classification using the Manhattan measure.  相似文献   

16.
������Դ��������齨���ϵ��   总被引:2,自引:0,他引:2  
本文详细论述了文献资源建设与藏书建设的概念分界,并通过系统分析,指出二者的关系是:后者是前者产生的基础,前者是后者的发展和提高;将来前者势必取代后者。  相似文献   

17.
本文着重对与建筑经济学有关的主题词概念进行分析,并且阐明这些概念与<中图法>有关类目的关系,旨在解决该类文献在实际分类工作中遇到的问题,并对<中图法>相关类目设置的完善提出建议.  相似文献   

18.
本文在公文正文三大要素理论基础上,为引导写作者方便、快速、规范成文,彻底解决公文难学难写的历史性难题,提出以"主旨、依据、分旨"三大要素为固定段名,按照文本结构、词语标志、语言形式、内容评价等系统组合规则,循格撰制的"三段式"表格化《党政机关公文正文写作格式》基本思路框架。  相似文献   

19.
In many applicative contexts in which textual documents are labelled with thematic categories, a distinction is made between the primary categories of a document, which represent the topics that are central to it, and its secondary categories, which represent topics that the document only touches upon. We contend that this distinction, so far neglected in text categorization research, is important and deserves to be explicitly tackled. The contribution of this paper is threefold. First, we propose an evaluation measure for this preferential text categorization task, whereby different kinds of misclassifications involving either primary or secondary categories have a different impact on effectiveness. Second, we establish several baseline results for this task on a well-known benchmark for patent classification in which the distinction between primary and secondary categories is present; these results are obtained by reformulating the preferential text categorization task in terms of well established classification problems, such as single and/or multi-label multiclass classification; state-of-the-art learning technology such as SVMs and kernel-based methods are used. Third, we improve on these results by using a recently proposed class of algorithms explicitly devised for learning from training data expressed in preferential form, i.e., in the form “for document d i , category c′ is preferred to category c′′”; this allows us to distinguish between primary and secondary categories not only in the classification phase but also in the learning phase, thus differentiating their impact on the classifiers to be generated.  相似文献   

20.
本文提出一种面向聚类主题的文本特征表示方法,即以聚类的主题概念来刻画文本的特征向量,将文本描述提升至语义层次.首先,通过聚类,形成一组以向量形式表达的隐含主题概念,再将基于词条空间的文本特征向量投影至这组主题概念,以隐含的主题概念来描述文本.实验分析表明,建立在概念空间之上的文本向量实质上是文本矢量与主题概念的关联度,能够突出表现文本内容的主题特征,更好地反映文本的语义内容,从而有效提高模型在文本检索与分类等领域的应用性能.而基于聚类形成的概念空间的维数由于可主观调整,又能有效地约减概念空间的维数,提高模型的应用实效.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号