首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 937 毫秒
1.
王梅 《中国索引》2005,3(4):40-43
索引系统主要研究信息的表示、存储、组织和访问。索引主要是标引信息资源外表特征和内容特征,建立相关参见,形成相应索引数据库,基于索引词匹配的查询,通过布尔逻辑模型、模糊逻辑模型、向量空间模型或者概率模型来提高查准率。由于索引词匹配技术很难解决一词多义的现象,相关参照很难解决不确定的相关关系,往往会检索大量的无关信息。近年来,为了提高索引的利用率,索引系统利用语义技术、超链技术、语义网检索技术和知识处理技术,促进索引系统向更高层次发展。本文主要以索引语义为主线,讨论索引语义扩展的方法和技术,结合信息资源管理系统的应用,探讨索引语义功能的实现。  相似文献   

2.
基于向量空间的检索模型研究   总被引:1,自引:0,他引:1  
在设计搜索引擎时,由于Internet的飞速发展,现有的检索模型检索效率不高。为了提高搜索引擎的检索效率,在本文中我们对基于向量空间的检索模型(例如:QR模型,潜语义标引模型)进行了深入地研究。  相似文献   

3.
为提高医学文献检索的效率和检索结果输出的有效性,快速客观地为科研人员提供高信度、低冗余的参考文献,实现检索结果按相关度排序输出,就基于向量空间模型的文献相关度计算方案进行探讨,提出基于相关度的医学文献聚类分析和相关度排序。  相似文献   

4.
经典向量空间模型中关键词相互独立的基本假设,造成了检索性能的限制.针对这一问题,本文介绍并分析了国内外学者对经典向量空间模型提出的改进研究.针对其研究的不足,通过分析经典向量空间模型的特点,构建领域本体以建立向量空间模型中关键词之间的语义联系,通过计算关键词之间的语义相似度,提出语义增量的概念,对关键词之间的语义联系进行量化分析.结合语义增量,对TF-IDF算法进行了改进,提出了STF-IDF算法,据此建立了语义向量空间模型,以期待提高经典向量空间模型在语义检索方面的性能.最后用实例验证了该模型在查全率和查准率方面均要优于原模型.  相似文献   

5.
针对个性化搜索的3个关键问题:用户信息搜集,用户信息库的动态更新与个性化检索算法,探索性地提出基于Ajax用户行为跟踪方案,以会话为单位动态更新用户行为信息库策略与加入用户文档的向量空间检索模型,并在此基础上设计和实现个性化搜索引擎实验系统。  相似文献   

6.
VSM中词权重的信息熵算法   总被引:3,自引:1,他引:2  
刁倩  王永成  张惠惠  何骥 《情报学报》2000,19(4):354-358
本文提出一种基于Shannon信息熵的向量空间模型(VSM)中的词权重算法。同时结合词与文献的相关权重的经典计算方法IDF(InverseDocumentFrequency),进一步总结了向量空间模型(VSM)中两种词权重计算的具体公式。  相似文献   

7.
针对目前信息服务机构只能提供文献的检索服务而不提供表格检索功能这一现状,提出一种基于向量空间模型的表格检索算法,并从表格特征抽取、特征词权值设置、检索结果匹配排序等方面进行讨论,为未来表格检索服务提供一定的理论依据。  相似文献   

8.
丁洁  王曰芬 《图书情报工作》2014,58(15):135-141
在综合国内学术信息检索服务的现状和现有理论方法研究的基础上,以检索词推荐为研究对象,构建基于文献特征项共现网络的学术信息检索词推荐模型。模型包括基础文献存储模块、文献特征项抽取模块、文献特征项共现网络预处理模块、基于特征项的文献检索模块及检索词服务前端5个部分。利用实验验证基于特征项的共现网络用于检索词推荐的可行性,结果表明推荐模型结果与各检索项的检索词更具有相关性,推荐质量较好。  相似文献   

9.
基于向量空间模型的主动推送系统设计与优化   总被引:3,自引:0,他引:3  
主动信息服务是信息检索的发展方向之一,传统向量空间模型用于设计主动推送系统具有一定的优点,但仍不能克服检索结果不相关的问题。本文提出了一系列优化措施,设计了一个基于向量空间模型的主动推送系统原型,更好的满足网上信息检索效率的提高。  相似文献   

10.
传统的图像检索方法利用图像的外部特征进行检索,它不能分析和处理图像的语义内容而使应用受到限制。为了解决这一问题,基于内容的图像检索技术应运而生。要将语义内容结合到检索中,就需要进行语义建模。介绍了潜在语义模型在图像的语义建模中的应用。  相似文献   

11.
基于向量空间模型的文献相关性数据库的研究与实现*   总被引:1,自引:0,他引:1  
探讨“相关性”的概念,简述文献相关性数据库的研究现状,提出基于词表和特征项提取的向量空间模型,并在此基础上设计、构建中国生物医学工程文献相关性数据库及其检索系统。  相似文献   

12.
设计并实现一个基于向量空间模型和简单贝叶斯的文本分类系统,系统采用层级多标签的分类策略。详细介绍词语切分统计、终分类器值计算、层级小类校正和兼类判断四个子系统模块。基于向量空间模型分类的第一级大类和层级小类的微平均分别为89.7%和77.8%,简单贝叶斯分别为67.6%和66.5%。  相似文献   

13.
对当前信息检索系统存在的问题进行分析,明确智能信息检索迫切需要解决的问题;在对现有的智能信息检索模型比较分析的基础上,提出基于知识空间的智能信息检索模型——知识空间模型,并描述基于知识空间的智能信息检索模型的框架、体系结构及其中若干关键问题。  相似文献   

14.
Collaborative filtering is a general technique for exploiting the preference patterns of a group of users to predict the utility of items for a particular user. Three different components need to be modeled in a collaborative filtering problem: users, items, and ratings. Previous research on applying probabilistic models to collaborative filtering has shown promising results. However, there is a lack of systematic studies of different ways to model each of the three components and their interactions. In this paper, we conduct a broad and systematic study on different mixture models for collaborative filtering. We discuss general issues related to using a mixture model for collaborative filtering, and propose three properties that a graphical model is expected to satisfy. Using these properties, we thoroughly examine five different mixture models, including Bayesian Clustering (BC), Aspect Model (AM), Flexible Mixture Model (FMM), Joint Mixture Model (JMM), and the Decoupled Model (DM). We compare these models both analytically and experimentally. Experiments over two datasets of movie ratings under different configurations show that in general, whether a model satisfies the proposed properties tends to be correlated with its performance. In particular, the Decoupled Model, which satisfies all the three desired properties, outperforms the other mixture models as well as many other existing approaches for collaborative filtering. Our study shows that graphical models are powerful tools for modeling collaborative filtering, but careful design is necessary to achieve good performance.  相似文献   

15.
从格式和模型两个角度总结并分析图书馆界在MARC之后对书目记录的探索,指出侧重格式探索与模型探索在元数据方案方面的不足。重点介绍美国国会图书馆提出的新书目框架--Bibframe模型,从模型更新、模型架构及Bibframe与RDA的关系3个方面对其进行研究。认为Bibframe不仅是一种格式,它意在创造一种新的书目环境,在核心类、资源类型两个方面对RDA进行继承与发展。  相似文献   

16.
在归纳企业竞争情报过程模型、用户驱动的竞争情报模型和面向知识管理的竞争情报过程模型的基础上,分别选择三种典型的过程模型,即Herring模型、User Driven模型和Rosenkrans模型,分析这三种典型模型的关键作用机制,即关键情报课题机制、信任机制和决策整合机制。结合竞争情报过程模型的演化,分析总结这三种关键作用机制的特点。  相似文献   

17.
文本分类相似度模型和概率模型的实现与比较*   总被引:1,自引:0,他引:1  
设计并建立一个基于向量空间模型和简单贝叶斯的文本分类系统,系统引入小类校正和兼类判断的算法,完成层级多标签的分类。进行基于向量空间模型和简单贝叶斯分类效果的对比,实验证明,在约3万篇测试集上(共15个大类,244个小类),基于向量空间模型的大类分类高25.2个百分点,层级小类分类高26.3个百分点。  相似文献   

18.
语义网环境下数据溯源表达模型研究综述   总被引:1,自引:0,他引:1  
综述语义网环境下数据溯源在表达模型与技术上的研究进展,重点研究Open Provenance Model、Provenir Ontology与Provenance Vocabulary的描述方法和能力,结合科研环境,讨论这些溯源模型在使用和推广上所面临的挑战。  相似文献   

19.
基于HTML文档结构的向量空间模型的改进   总被引:8,自引:1,他引:8  
胡健  陆一鸣  马范援 《情报学报》2005,24(4):433-437
根据HTML文档不同标签域的分布特征和对文档内容的代表能力不同,我们提出了一种改进的向量模型(PFTF),并通过trec12的查询实验,比较了传统向量模型与PFTF模型对单个标签域以及多个文档表示结果的结合的检索性能。实验结果表明,PFTF模型对于这两个方面都有提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号