首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 57 毫秒
1.
朴素贝叶斯分类方法是数据库分类知识挖掘领域的一项基本技术,并具有广泛的应用。使用贝叶斯分类算法实现了对经典数据集Iris的分类。实践表明,朴素贝叶斯分类是一种有效的数据挖掘分类算法。  相似文献   

2.
文章以豆瓣网站书籍评论为分析对象,采用中文情感词汇本体库进行情感要素的识别与加权,结合朴素贝叶斯算法实现了用户评论文本的情感自动分类,并探讨了该算法的分类效果,研究发现:朴素贝叶斯算法能够实现评论文本的情感分类,分类效果较好,但仍需结合规则匹配和人工校对的方式,提升分类效果。  相似文献   

3.
贝叶斯分类器可以归结为求词条的先验概率,目前分类器中普遍使用词条的文档出现次数和词频来计算先验概率.本文提出了一种基于权重的朴素贝叶斯分类器,不仅改进了文本中词条的先验概率计算方式,并增加了词条的权重对计算的影响.该分类器使用TFIDF模型及其改进算法实现了分类器的设计.实验结果表明,该分类器的效果比传统算法有较大的改进.  相似文献   

4.
采用向量空间模型(VSM)描述文本,利用隐性语义索引(LSI)R术进行特征重构与降维,构造了BP神经网络文本分类器。将朴素贝叶斯分类技术与前者结合构造了一种混合文本分类器。实验结果表明混合分类器分类准确度和分类速度得到提高。  相似文献   

5.
基于朴素贝叶斯分类的可疑金融交易识别研究   总被引:3,自引:0,他引:3  
张成虎  高薇 《情报杂志》2006,25(11):46-47,51
随着我国反洗钱活动中大额与可疑交易报告制度的不断完善,面对不断增长的交易报告数据,如何有效地从中检测出可疑交易是当前我国反洗钱工作中面临的核心问题之一。朴素贝叶斯分类是数据挖掘方法的一种,通过对案例数据的训练学习达到对未知类标识的样本分类。基于朴素贝叶斯分类的思想设计了适用于反洗钱中可疑交易识别的贝叶斯分类算法及模型,用数据对该算法进行了实验验证,并提出了与聚类算法相结合的综合运用设想。  相似文献   

6.
及时准确地对舆情信息进行主题分类,不仅能实时了解舆情动态变化,还能为预判舆情发展趋势、舆论引导建立基础。本文提出一种基于本体和加权朴素贝叶斯的网络舆情主题分类方法,通过使用本体将领域知识和领域文本特征融入分类过程中。将该方法应用到动物卫生领域舆情主题分类中,分类结果精确度为0.9402,Marco_F1达到0.9339。通过与朴素贝叶斯(NB)和THUCTC两种方法的对比实验,证明本文提出的基于本体和加权朴素贝叶斯的分类方法有效且具有可行性,但是领域本体的概念、关系的完备程度会影响分类的效率。  相似文献   

7.
王洋  刘忠 《大众科技》2011,(2):18-20
文本自动分类系统是信息处理的重要研究方向,它是指在给定的分类体系下,根据文本的内容自动判别文本类别的过程.文章将对基于贝叶斯算法的文本分类技术进行论述.  相似文献   

8.
张文婷  王海军  陈莹莹  戴兰 《资源科学》2013,35(9):1871-1876
本文以潮州市建成区和近期规划区为研究区,采用训练样本获取先验概率建立朴素贝叶斯分类器,以栅格点为单位,将各栅格点的土地定级因素作用分值作为输入变量,利用朴素贝叶斯分类器进行土地定级。在作用分值确定方法上,采用障碍距离代替传统直线距离,以达到客观反映点、线等要素对城镇土地使用价值作用的程度。最后,对顾及障碍物的朴素贝叶斯定级结果分别与空间聚类结果及未顾及障碍物的定级结果进行比较,结果表明本文所提出的方法在土地定级研究中具有一定的优势,能更加真实地反映城镇土地使用价值的空间分布特征。  相似文献   

9.
文本分类是文本数据挖掘领域的重要技术之一。从分类算法对文本语义信息的利用程度这一角度出发,将文本分类划分为基于词形的算法和基于语义的算法两类,对每类算法进行了描述,并对当今文本数据的多样性及文本分类算法改进的可选方向进行了研究。  相似文献   

10.
提出了一种基于机器学习的Web文本自动分类的架构,提出了中文Web文档自动分类的主要技术问题。介绍了中文Web文档自动分类工具的总体设计,它主要包括网络蜘蛛、中文分词、特征选取和贝叶斯分类器等功能模块。最后对中文Web文档自动分类器进行了实验。  相似文献   

11.
卞福荃 《情报科学》1999,17(1):56-58
科技情报文献种类繁杂、载体多异,在情报文献归类方面,许多种类文献处于模棱两可的情况。目前我国广为使用的分类法只有体系分类法为唯一的依据。本文就该法在实际工作中运用的利弊提出实用的改进观点,其使用价值在近年来得到充分的体现。  相似文献   

12.
王新 《情报科学》2000,18(9):790-791
本文论述了中医文献分类发展情况,随着科学技术的迅猛发展,使得中医文献分类内容不断扩大,笔者近年来对国内外分类法的观察和思考,提出了自己的看法。  相似文献   

13.
模糊集合论在文献分类中的应用   总被引:1,自引:0,他引:1  
本文首先分析了文献分类中的模糊性,并比较分析现存运用模糊集合论进行文献分类的特点及不完善处。在此基础上,提出一种实用和较完善的模糊文献分类法——特征权重文献分类法,并给出算法。  相似文献   

14.
基于HTMLParser对网页进行解析,可抽取标签间的Link、image、meta和title等信息。使用HTMLParser来提取Web文献中的题名、关键字、摘要、作者、来源等信息,清洗后存入MySql数据库当中,以备后续数据挖掘使用。对此进行了论述。  相似文献   

15.
本文在加权平方损失下导出了平衡的双向分类随机效应模型中方差分量的Bayes估计,并利用 非参数方法构造了方差分量的经验Bayes (EB)估计。在适当的条件下证明 了EB估计的收敛速度。最后,给出一个满足主要结果的例子。  相似文献   

16.
陈久庚 《情报科学》2004,22(7):822-825
要文中论述了“情报工作”及其学科的基本性质以及一般遵循的分类法则,指出《中国图书资料分类法》(第四版)对“情报学、情报工作”的分类有诸多不科学和欠妥之处,组织修订是非常必要的。  相似文献   

17.
本文在介绍和分析贝叶斯理论的基础上,提出了贝叶斯算法和朴素贝叶斯分类器.并阐述了贝叶斯算法及朴素贝叶斯分类器在反垃圾邮件中的应用.  相似文献   

18.
动态网站开发中常需要设计文件上传功能,基于ASP技术的动态网站开发中常用的文件上传方法有组件上传和基于数据库的无组件上传,分析了采用的技术、适用性、使用方法和优缺点,并给出应用实例。  相似文献   

19.
李文  王炜立  洪胜华 《科技广场》2006,18(11):94-95
本文主要论述了一种改进的基于互信息的特征提取方法及其在中文法律案情文本分类中的应用,文中给出了具体实现过程及实验数据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号