共查询到18条相似文献,搜索用时 62 毫秒
1.
为提高医学文献检索的效率和检索结果输出的有效性,快速客观地为科研人员提供高信度、低冗余的参考文献,实现检索结果按相关度排序输出,就基于向量空间模型的文献相关度计算方案进行探讨,提出基于相关度的医学文献聚类分析和相关度排序。 相似文献
2.
3.
4.
文本分类相似度模型和概率模型的实现与比较* 总被引:1,自引:0,他引:1
刘华 《现代图书情报技术》2006,1(4):53-55
设计并建立一个基于向量空间模型和简单贝叶斯的文本分类系统,系统引入小类校正和兼类判断的算法,完成层级多标签的分类。进行基于向量空间模型和简单贝叶斯分类效果的对比,实验证明,在约3万篇测试集上(共15个大类,244个小类),基于向量空间模型的大类分类高25.2个百分点,层级小类分类高26.3个百分点。 相似文献
5.
基于贝叶斯定理的遥感图像检索 总被引:1,自引:0,他引:1
对遥感图像检索中基于贝叶斯定理的一系列处理方法进行研究,阐述如何在底层原始图像特征与高层语义图像特征之间建立映射,并利用贝叶斯网络进行交互学习和概率检索的方法。最后结合基于内容的图像检索技术的研究热点,将Ontology概念引入图像检索领域,以提高图像的高层语义检索的精度。 相似文献
6.
基于概念向量空间的文档语义分类模型研究 总被引:1,自引:0,他引:1
7.
本文针对分布环境的数据挖掘要求,提出了基于贝叶斯网络的分布数据挖掘模型DDMB。论文详细阐述了DDMB中属性多叉树的概念和通过属性多叉树来反映分布环境下各数据集属性总体特征的思想,介绍了基于移动Agent访问分布数据集来构建属性多叉树的方法,详细描述了由属性多叉树生成综合贝叶斯网络的算法,阐述了面向属性多叉树的贝叶斯网络结构学习和参数学习以及属性间依赖系数最小阈值的确定方法。实验结果表明,该模型有效地解决了原有分布环境下贝叶斯网络学习负担重、存储开销大、执行效率低等问题。 相似文献
8.
对文档进行分类并鉴别出垃圾信息是一个非常有实用价值的研究领域,越来越多的网站开始关注这种技术。采用智能算法对垃圾信息进行有效分析,寻找垃圾制作者,并通过网络日志和所发表的内容,判断哪些是广告用户和垃圾信息的发布者,并将其删除。认为对垃圾信息的甄别其实是一种把信息分成有用信息和无用信息的过程,试用贝叶斯分类算法把信息分成不同的类。针对基于规则的分类方法和通过分析广告链接网址来剔除垃圾信息的方法的缺陷,给出贝叶斯分类算法及机器训练方法,从实验结果看,本方法优于基于规则的分类法。 相似文献
9.
刘华 《现代图书情报技术》2007,2(3):43-45
设计并实现一个基于向量空间模型和简单贝叶斯的文本分类系统,系统采用层级多标签的分类策略。详细介绍词语切分统计、终分类器值计算、层级小类校正和兼类判断四个子系统模块。基于向量空间模型分类的第一级大类和层级小类的微平均分别为89.7%和77.8%,简单贝叶斯分别为67.6%和66.5%。 相似文献
10.
介绍一个建立在向量空间模型上的文档分类系统。该系统着重解决向量维数压缩和中文专有词汇获取等问题。在特征项的选取上,我们并不采用文档中出现的全部词汇,而是利用语料库统计信息生成的关键词汇。实验结果表明,较之以采用全体词汇作为特征项进行分类的方法,本方法能有效地进行向量维数压缩,同时也提高了分类准确率。 相似文献
11.
本文分析了传统定标比超方法的思想和缺陷,提出将传统情报分析方法与智能分析技术相结合,构建了融合文本自动分类的竞争情报定标比超分析模型。本文提出构建定标比超内容层次指标体系,将其作为文本自动分类的分类体系。两种方法相辅相成、相互优化,实现竞争情报的良性循环型、科学的智能分析。进而,深入研究了该模型的功能任务和情报分析过程与算法。最后,从科学性、时效性、全面性、准确性和动态性方面对该模型进行了性能评价。 相似文献
12.
13.
基于OCC模型和LSTM模型的财经微博文本情感分类研究 总被引:1,自引:0,他引:1
为了解决财经微博文本中网民情感状态转移的时序数据分析问题,本文提出一个基于认知情感评价模型(Ortony,Clore&Collins,OCC)和长短期记忆模型(long short term memory,LSTM)的财经微博文本情感分类模型(OCC-LSTM)。基于OCC模型从网民认知角度建立情感规则,对财经微博文本进行情感标注,并作为LSTM模型进行深度学习的训练集;基于LSTM模型,使用深度学习中的TensorFlow框架和Keras模块建立相应的实验模型,进行海量微博数据情感分类,并结合13家上市公司3年的微博文本数据进行实证研究和模型验证对比。实证研究结果发现本文提出的模型取得了89.45%的准确率,高于采用传统的机器学习方式的支持向量机方法 (support vector machine,SVM)和基于深度学习的半监督RAE方法 (semi-supervised recursive auto encoder)。 相似文献
14.
基于模糊属性集的粗糙近似精度数据挖掘策略 总被引:1,自引:0,他引:1
为了提高信息系统的分类质量,探讨了一种在数据仓库中基于模糊属性集的粗糙逼近近似度量的数据挖掘策略.首先在决策表中给出了模糊属性集的原子概念表示及其对象的描述;再根据原子概念的特征构造了模糊属性集的粗糙上下近似表述;然后利用模糊属性重要性度量的概念,提出了利用逼近精度近似度量的数据挖掘方法进行模糊属性约减;最后应用算例说明如何在决策表中发现分类规则.实验结果表明此方法挖掘出的规则简练且合理可靠. 相似文献
15.
基于属性测度的Internet搜索引擎评价系统研究 总被引:2,自引:0,他引:2
搜索引擎的使用对Internet网络用户已十分普遍。目前搜索引擎的检索性能还缺乏一个科学、有效的评价方法。本文根据系统工程的基本思想,建立了搜索引擎的评价指标体系,并根据属性测度理论构造了基于属性测度的搜索引擎评价系统,该评价模型可定量地分析搜索引擎的综合性能,并给出了应用实例。 相似文献
16.
基于SUMO和WordNet本体集成的文本分类模型研究 总被引:1,自引:0,他引:1
针对传统文本分类方法和目前语义分类方法中存在的问题,提出基于SUMO和WordNet本体集成的文本分类模型,该模型利用WordNet同义词集与SUMO本体概念之间的映射关系,将文档-词向量空间中的词条映射成本体中相应的概念,形成文档-概念向量空间进行文本自动分类。实验表明,该方法能够极大降低向量空间维度,提高文本分类性能。 相似文献
17.
18.