首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
对垂直搜索引擎的关键技术进行了研究,提出了一种基于Lucene.net垂直搜索引擎解决方案,设计实现了一种集二手转让及房产租售二大类信息分类进行搜索的垂直搜索引擎——SHAH。  相似文献   

2.
对基于中文的Web文本分类技术进行了研究,介绍了web文本分类的基本过程和Web文本预处理及文本特征选取的方法,重点介绍了一种常用的基于内容的分类算法KNN。最后通过实验测试了使用KNN算法的中文Web文本分类技术的效果。  相似文献   

3.
目前,常用的全文搜索引擎都是基于关键词检索的,其查准率和查全率都较低,并且返回记录太多,重复信息过多,使得搜索引擎的查询效率很低。基于此,提出了一种基于本体的搜索引擎模型,通过提取的文档中概念,确定其所属的领域本体,以此归类,并用文档—概念匹配系数建立索引。搜索时,采用基于概念匹配的方式进行检索,对属于不同领域本体的文档,分类输出。提高搜索引擎的查准率和查全率,减少冗余信息,从而提高搜索引擎的查询效率。  相似文献   

4.
提出了一种基于投影寻踪改进KNN中文文本分类方法,与现有的中文文本分类算法相比,该方法具有较高的计算效率。给出了具体实现过程并将其用于文本分类中,实验证明了该算法用于文本分类的有效性及其高效率。  相似文献   

5.
一、搜索引擎的原理与技术搜索引擎的主要功能是信息组织和信息检索。基于层次检索的分类目录检索和基于词语检索的关键词检索是Web搜索引擎的两种基本类型。1、分类目录检索。网络分类目录提供按类浏览查询方式。分类搜索引擎工作原理:由人工发现、抓取、辨别网上信息、依靠编  相似文献   

6.
在介绍SVM和KNN分类算法的基础上,提出了一种新的、较简单的,但更为合理的基于表模型的文档表示方法,阐述了一种基于表模型的分类算法——TableKNN算法。通过实验比较TableKNN算法与传统KNN算法应用于文本分类的效果,证实了TableKNN算法在处理文本分类问题上的优越性。  相似文献   

7.
自动分类技术是一种基于知识管理的文本分类技术,它能依据文本的语义将大量的文本自动分门别类,从而更好地帮助人们把握文本信息。本文首先介绍了自动分类技术的背景和历史发展,然后着重介绍了目前应用最广泛的几种自动分类方法;其后,结合实际研究课题介绍了基于仿人思想的自动分类方法,并对自动分类技术未来发展的方向作了展望。  相似文献   

8.
搜索引擎能够帮助人们方便、快捷地从网上获取相应的信息,其逐渐地由传统搜索引擎向智能搜索引擎转变.本文提出一种基于HTML标签扩展方式的智能搜索引擎设计,通过扩展HTML标签,使搜索引擎能够与数据的发布者协作,利用扩展标签中的语义信息,提高分类的效率和实时性,并增强用户体验.  相似文献   

9.
改进了传统的信噪比文本分类方法。提出了一种改进的基于信噪比的文本分类方法。它考虑了禁用词的排除、近义词和同义词的合并以及特征项在文本中不同位置对文章分类的贡献不同。  相似文献   

10.
通过对文本分类的相关技术进行深入研究 ,提出了一种基于VSM的中文网页自动分类模型的构造方法  相似文献   

11.
朴素贝叶斯文本分类模型是一种简单而高效的文本分类模型,但是它的独立性假设属性使其无法表示现实世界属性之间的依赖关系,从而影响它的分类性能。这里提出一种改进的基于贝叶斯定理的文本分类模型——“树桩网络(Stump Network)”,并将该方法与朴素贝叶斯文本分类器和TAN(Tree Augmented Naive Bayes)文本分类器进行实验比较,结果表明,在大多数数据集上该文本分类方法具有较高的分类正确率。  相似文献   

12.
有别于RNN和CNN,动态路由与注意力机制为捕捉文本序列的长程和局部依赖关系提供了新思路。为更好地进行文本编码,尽可能多地保留文本特征、增加特征多样性,基于动态路由与注意力机制的思想,整合胶囊网络和自注意力网络的语言信息特征抽取能力,构建一种深度网络模型CapSA,并通过3种不同领域的文本分类实验验证模型效果。实验结果显示,相较于几种基于RNN或CNN的模型,基于CapSA模型的文本分类模型取得了更高的F1值,表明该模型具有更好的文本建模能力。  相似文献   

13.
郭丽  刘磊 《教育技术导刊》2013,12(4):130-131
实体关系抽取和实体关系分类是信息抽取中重要的研究领域,不仅要识别文本中的实体,还要确定这些实体之间的关系,能够辅助机器对文本语义的理解。提出了一种基于关系相似度计算的实体关系分类模型,并针对7种常见实体关系进行了分类实验。  相似文献   

14.
通过对文本分类的相关技术进行深入研究,提出了一种基于VSM的中文网页自动分类模型的构造方法。  相似文献   

15.
分析了基于支持向量机(SVM)的文本分类方法,在此基础上,提出一种由SVM和概率统计方法相结合的文本分类方法。详细介绍该方法的实现原理、算法描述和工作流程,并进行实验测试。  相似文献   

16.
分析了当前网上搜索引擎的现状及存在的问题,提出了一种结合本体的垂直搜索引擎构建思想,构建了基于本体的垂直搜索引擎模型。  相似文献   

17.
分析了当前网上搜索引擎的现状及存在的问题,提出了一种结合本体的垂直搜索引擎构建思想,构建了基于本体的垂直搜索引擎模型。  相似文献   

18.
互联网的迅速发展,搜索引擎也引起了更多人的关注,但主题搜索引擎发展还不够成熟,在国内,它的研究正处于发展阶段,发展缓慢、数量少,用户还不满意.本文提出了一种基于主题预分类的PageRank算法,与传统PageRank算法比较,经验证,该方法在一定的主题下可以提高系统的查准率.  相似文献   

19.
基于机器学习的情感分类方法已经取得了较大进展,但在大量情感分类方法中,往往都是结合词嵌入和传统的机器学习方法,缺乏对文本主题以及时序关系等因素的有效利用。针对上述问题,提出了一种基于主题流与深度学习的情感分类算法,通过分析文本的主题分布,并引入时序关系,在此基础上利用适合的长短记忆神经网络的深度学习方法进行情感分类。实验证明,基于主题流与深度学习的情感分类算法性能较好。  相似文献   

20.
随着网络的飞速发展,网页数量急剧膨胀,近几年来更是以指数级进行增长,搜索引擎面临的挑战越来越严峻,很难从海量的网页中准确快捷地找到符合用户需求的网页。网页分类是解决这个问题的有效手段之一,基于网页主题分类和基于网页体裁分类是网页分类的两大主流,二者有效地提高了搜索引擎的检索效率。网页体裁分类是指按照网页的表现形式及其用途对网页进行分类。介绍了网页体裁的定义,网页体裁分类研究常用的分类特征,并且介绍了几种常用特征筛选方法、分类模型以及分类器的评估方法,为研究者提供了对网页体裁分类的概要性了解。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号