共查询到20条相似文献,搜索用时 15 毫秒
1.
本文应用Rough集理论和模糊集知识研究一种新的情报检索系统 ,提出了新的情报检索方法。论文给出了这个系统的体系结构和系统的核心算法 ,进行了算法复杂性分析 ,检索算法的时间复杂性为 0 (log2 M)。它的主要特点是检索算法的时间复杂性不随着文献资料数量的增加而增加 ,只与主要标引词的多少有关。分析结果表明这是一种有效的算法 相似文献
2.
文献信息自动标引研究 总被引:12,自引:0,他引:12
作者认为我国文献自动标引研究的重点应由分词研究向实际标引研究转移。由此, 作者从标引源的确立、标引词权值的定义和使用、标引词库的构造、自动标引算法的实现等方面阐述了他们在自动标引方面的研究成果, 同时介绍了利用标引词库进行的检索改造。 相似文献
3.
一种快速主题标引匹配算法利用计算机实现主题词的自动标引是档案管理现代化的重要课题。目前我国大都采用受控抽词标引的方法,从档案文件的题名或提要中切分抽取词汇,并利用主题词表的控制作用,筛选、规范,从而确定标引词。由于所需检索、组配的词汇量极大,则所用算... 相似文献
4.
介绍模糊理论发展及其在图书馆业务活动中的应用,探讨模糊匹配理论对学术论文检索的影响和作用,对于模糊匹配理论的应用进行设计,将其应用到实践提出有问题有待探讨的看法。 相似文献
5.
基于关键字匹配的搜索引擎排序网页时仅仅考虑评价网页的重要性,而忽视分类;基于分类目录的搜索引擎很难动态分析Web信息。本文在分析它们不足的前提下,提出利用模糊聚类的方法对搜索引擎的检索结果进行动态分类,依据超链分析算法PageRank和Web文档隶属度相结合进行分类排序,并给出具有调节值的结合公式。实验证明,该算法能够更有效地满足用户的需要,提高检索效率。 相似文献
6.
在深入分析NSTL篇级元数据特点的基础上,结合模糊匹配算法,提出一种适合NSTL现有数据的人名消歧规则集,并给出基于该规则集的人名消歧算法。通过对实际数据集的实验,该算法在准确率、召回率等指标方面都有良好的表现,具备较好的消歧效果。 相似文献
7.
基于模糊语义距离的多媒体信息检索方法研究 总被引:4,自引:1,他引:3
与传统的数据库精确查询不同 ,多媒体信息检索的查询条件是不完备的。本文叙述利用模糊语义距离来检索多媒体数据库中信息的原理、算法 ,并将模糊相似测试作为检索结果判断标准 ,最后通过一个示例来说明本方法的使用。 相似文献
8.
在信息检索中,代数理论是构建检索模型的重要手段之一,以代数理论为基础的检索模型克服了布尔模型不能进行部分匹配的缺点而广为采用。本文分析了代数理论的向量空间模型,并对该模型进行了扩展:用最小项标引词以反映词与词之间的关系,用奇异值分解来捕捉文献的语义结构;最后对这三种模型进行了比较。 相似文献
9.
基于模糊属性集的粗糙近似精度数据挖掘策略 总被引:1,自引:0,他引:1
为了提高信息系统的分类质量,探讨了一种在数据仓库中基于模糊属性集的粗糙逼近近似度量的数据挖掘策略.首先在决策表中给出了模糊属性集的原子概念表示及其对象的描述;再根据原子概念的特征构造了模糊属性集的粗糙上下近似表述;然后利用模糊属性重要性度量的概念,提出了利用逼近精度近似度量的数据挖掘方法进行模糊属性约减;最后应用算例说明如何在决策表中发现分类规则.实验结果表明此方法挖掘出的规则简练且合理可靠. 相似文献
10.
本文介绍了模糊集合理论的概念及在非确定情况中推理的应用,还对一种用于实现近似推理的模糊程序设计语言进行了简要的介绍。本文的主要目的是为模糊集合理论在决策支持系统(DSS)及专家系统(ES)中的应用给出一简要的概述。 相似文献
11.
统计分析法自动标引的改进研究 总被引:2,自引:0,他引:2
许剑颖 《现代图书情报技术》2004,20(2):92-95
统计分析法自动标引是自动标引的一种重要方法。本文从标引词应反映文献主题内容这一原则出发,对统计分析法自动标引从标引源的确定、权值的设计、词频的调整及检索后控词表的设计与维护等方面提出了一些改进设想。通过这些方法使标引词更好地反映文献主题的同时提高检索效率。 相似文献
12.
自然语言计算机情报检索的初探——一个自动文本检索原型系统 总被引:1,自引:0,他引:1
本文介绍在SIEMENS7570 机上建立的自动文本检索原型系统,该系统是以改善用户与系统的交互界面为目的,可以用自然语言输入。该系统是从 COMPENDEX数据库中截取1988年有关计算机技术方面文献共18167篇,作为文献集合的数据,使用了自动标引、标引词加权、矢量匹配检索、排序输出等多项技术而实现的 相似文献
13.
数字图书馆读者检索兴趣的智能分析算法 总被引:1,自引:0,他引:1
针对数字图书馆信息检索服务的智能化发展趋势,提出智能化信息检索服务中对读者检索兴趣进行智能分析的模糊匹配算法,主要思路是在系统中构建用户兴趣矩阵,在用户操作过程中动态构建用户行为矩阵,通过两者的模糊运算,获得用户的兴趣从属度,检索系统根据该从属度对检索结果进行动态优化并及时向用户推送,从而提升检索系统的智能化程度。
相似文献
相似文献
14.
分布式入侵检测系统的一个显著缺陷是会产生大量的重复警报。为有效消除警报冗余,改善入侵检测的效果和性能,本文提出了一种基于特征属性模糊相似度的入侵警报聚合算法。该算法基于模糊逻辑,综合分析警报的攻击类型特征、时间特征、空间特征三维属性,通过分别定义具体的隶属函数,按照攻击类型和时空特征属性模糊相似度对入侵警报进行聚合,比传统的精确匹配法和概率统计方法更适合于处理入侵警报信息的相似性。 相似文献
15.
简论标引用词和检索用词的差别 总被引:1,自引:0,他引:1
根据标引词和检索词的不同要求和特点,概要分析了两者在检索系统中的差别,并简要讨论了在标引和检索的不同阶段对词汇使用规律进行研究和探索应包括的基本内容及这一研究的意义 相似文献
16.
统计分析法自动标引的改进 总被引:12,自引:2,他引:10
情报检索的目的是为用户服务,因而标引词的提取应以其与文献主题内容相关程度为标准。文章基于原有的统计分析标引法,对其权值设计予以重新考虑,并与文献词频统计相结合,使分词与标引相统一,标引词更好地反映文献主题概念,提高检索效率。 相似文献
17.
18.
针对现有基于语词的术语相似度典型算法存在的问题,提出了将WordNet和编辑距离计算应用于术语词语匹配过程,并根据术语修饰词的位置赋予特征权重的术语相似度改进算法.和已有算法相比,新的算法在三个方面有所改进.首先,在术语中心词匹配过程中引入WordNet的同义词、近义词检索功能,实现中心词之间的语义匹配;其次,将术语词语的直接匹配改进为基于编辑距离计算的模糊匹配;最后,在计算过程中充分考虑了术语修饰词与中心词之间的距离对修饰词权重分配的影响因素.针对新算法提出了具体的实现步骤,并选取基因工程领域实验数据对改进算法和现有典型算法进行对比评测.实验证明,每种改进方法在单独测试时效果优于或至少不低于Nenadic算法.基于三种改进方法的综合计算方法在计算效果方面具有明显提升. 相似文献
19.
20.
基于在线评论的消费者模糊情感计算与推理 总被引:1,自引:0,他引:1
针对Web 2.0时代大量主观性文本的出现,消费者在线评论描述了消费者关于某一产品或服务的观点或经历。本文基于模糊理论讨论了在线评论中的情感挖掘问题。以消费者心理行为学理论为基础,根据在线评论的自然语言模糊本质属性,建立了消费者心理模糊库群,包括特征、感知、情绪、评价等4个模糊库;结合评论语句的句法分析,给出了消费者态度情感的模糊计算算法(FSCA-OR);并依据消费者的决策过程,进行了推理规则库的构建;最后通过实验验证了所提方法的有效性。 相似文献