首页 | 本学科首页   官方微博 | 高级检索  
     

基于领域本体和概念向量的中文文本相似性测度研究
引用本文:颜端武,成晓,甘利人. 基于领域本体和概念向量的中文文本相似性测度研究[J]. 中国图书馆学报, 2007, 33(6)
作者姓名:颜端武  成晓  甘利人
作者单位:南京理工大学经济管理学院信息管理系,南京,210016
基金项目:总装备部“基于知识本体和数据挖掘的智能推荐关键技术与系统构建研究”项目(项目编号2006QB1066),南京理工大学2005~2006年度青年教师科研基金研究成果。
摘    要:文本相似性测度被广泛用于计算用户提问与文档资源相关程度以及基于内容相似资源推荐。OCVSM是一种基于领域本体和概念向量相似性测度的方法。该方法将军用飞机领域知识本体OntoAvion的概念集作为词汇抽取特征项,根据本体中概念间的关系确定特征项的相似度,最后利用余弦算法计算文本向量相似度。实验证明,该方法与基于语言学词典的相似性测度方法相比,更接近用户对文本相似性的判断。表10。图5。参考文献10。

关 键 词:相似性测度  领域本体  概念向量  文本处理

A Study of Chinese Text Similarity Measurement Based on Domain Ontology and Concept Vectors
Yan Duanwu,Cheng Xiao and Gan Liren. A Study of Chinese Text Similarity Measurement Based on Domain Ontology and Concept Vectors[J]. Journal of Library Science In China, 2007, 33(6)
Authors:Yan Duanwu  Cheng Xiao  Gan Liren
Abstract:Text similarity measurement is widely applied in the computation of relevance between users and textual resources and other activities.In this paper,the authors introduce OCVSM,a similarity measurement method based on domain ontology and concept vectors.The method makes use of OntoAvion,a domain ontology in the field of military aviation.Experiments prove that this method is more close to user's judgment on text similarities,compared with the similarity measurement method based on linguistic dictionaries.10 tabs.5 figs.10 refs.
Keywords:Similarity measurement  Domain ontology  Concept vector  Text processing  CLASS NUMBER  G354
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《中国图书馆学报》浏览原始摘要信息
点击此处可从《中国图书馆学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号