首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
KNN算法是文本分类技术中比较常用的算法。但是,当训练集容量较大时,KNN算法分类的效率大大降低。在对中文短信文本的分类时,结合中文短信文本的特点,给出了先由LAS算法进行降维,然后利用KNN算法进行分类的算法。实验结果表明,该算法提高了中文短信文本的分类质量和分类速度。  相似文献   

2.
分类问题的覆盖算法为处理海量数据提供了一个十分有效的方法,已被广泛应用于文本分类问题中.主要通过覆盖算法、核覆盖算法和基于概率的覆盖算法等三种不同方法进行训练和学习,并根据给出的实验结果进行比较研究.实验结果表明了经优化后的概率模型在文本分类中提高了识别率和精确度.  相似文献   

3.
提出了一种基于投影寻踪改进KNN中文文本分类方法,与现有的中文文本分类算法相比,该方法具有较高的计算效率。给出了具体实现过程并将其用于文本分类中,实验证明了该算法用于文本分类的有效性及其高效率。  相似文献   

4.
本文借助中文维基百科知识库,提出基于ESA算法的文本分类算法.并选取2015年3月5日在中文维基百科网站下载的主题文章,对其进行适当处理,将处理结果作为该算法使用的语义概念知识库.在复旦大学中文文本分类语料上显示的实验结果表明,该方法比纯粹的词袋模型方法效果要好.  相似文献   

5.
《宜宾学院学报》2019,(6):47-51
基于云计算技术的神经网络方法研究为大规模数据的分析处理提供了廉价的、高效的解决方案,交叉覆盖算法可以较好地解决多层前向网络分类器的设计问题,弥补BP神经网络的不足.结合MP神经元的几何概念,基于交叉覆盖算法设计神经网络,以Iris数据集为例,基于云计算环境实现了数据分类,为多层前向神经网络在云环境下进行数据分析提供了一种有意义的研究和实践.  相似文献   

6.
针对文本分类算法的选择问题,使用二十新闻组数据集在开源的数据挖掘软件Weka上进行了仿真实验。通过实验结果综合评价了朴素贝叶斯算法、IB1算法和ZeroR算法的性能。实验结果表明在三种算法中朴素贝叶斯算法的准确率最高,ZeroR算法的运算速度最快。研究表明文本分类的效率受所选算法的影响较大,合适的算法可以显著地提高文本分类的准确率。  相似文献   

7.
SVM算法只使用已归类的数据训练分类器,而EM算法用少量已归类数据,结合大量的未归类数据来训练分类器,在减少已归类数据的同时保证了分类器的精度。本文基于EM算法的思想,根据SVM文本分类模型,提出一种新的迭代SVM文本分类算法。实验结果表明,迭代SVM算法分类精度高于传统的SVM文本分类算法,具有较好的性能。  相似文献   

8.
将前期工作进行了改进并将训练集各簇中语义相似度大的文档进行合并,减少了训练集容量,实验表明该算法大大提高了KNN算法的效率。  相似文献   

9.
通过介绍文本分类的过程及其关键技术,讨论了文本表示、分类算法、分类器性能评价原理和方法;最后,指出了当前文本分类过程中存在的问题,并对今后的发展进行了展望.  相似文献   

10.
结合蚁群算法在解决分类问题方面的优势,以及中文网页内容特征值的离散性特点,提出一种改进的基于蚁群算法的网页分类方法。该算法通过携带类别信息的种群蚂蚁的爬行,在迭代过程中寻找一条最佳路径与之匹配,实现了Web页面的分类。最佳路径通过计算测试文档与每一类别的覆盖集合,进而比较最优覆盖集合得到。其中类别权重计算中引入了文字链接比和标签权值,进一步提高了分类精度。实验证明,引入类别覆盖集的蚁群分类算法能够取得更好的分类效果。  相似文献   

11.
传统的LMS算法的精度不高,收敛速度慢,并且跟踪性能不好.本论文主要研究了一种改进型的变步长的LMS自适应算法NLMS,并基于MATLAB仿真软件设计完成了一种改进型的NLMS自适应滤波器,对该算法进行仿真验证.结果表明:该改进型的自适应算法NLMS平均误差更小,精度更高.  相似文献   

12.
13.
基于项目反应理论(IRT),采用离差加权值最小和测验项目信息函数值最高两个目标规划相结合的办法,设计了一个新的自动组卷数学模型。该模型克服了经典测量理论(CTT)的种种局限,有效解决了计量指标——信息量与非计量指标——题型分布、知识点分布等约束条件计算量纲不同的问题,很好地体现了测试项目信息函数值最高的组卷目标。  相似文献   

14.
2003年“计算机科学与技术方法论”专题研讨会在桂林召开以后,“方法论”的思想被许多院校确立为《导论》课的主讲内容。该思想的科学性、先进性、完备性正在被许多人接受,同时也有部分同志加入到它的研究行列中来。文章运用这一思想对算法的确立过程进行了研究,发现它仍然符合“方法论”的核心思想。由此提示我们在计算机科学与技术的教学和科研中,应深刻领会“方法论”的内涵及外延,把这一思想渗透到教学科研中去。  相似文献   

15.
针对数字串在信息管理中的安全问题,提出了一种实用的数字串加密算法.将此算法应用于磁卡加密,由此证明该算法具有一定的实用价值.  相似文献   

16.
关联规则挖掘是一种最有影响的数据挖掘技术。它在交易数据库或其他数据仓库项目集之中提取有意义的关联,频繁模式和关联。大多数现有的算法发现频繁模式都需要多次遍历数据库,导致大量的磁盘读取,造成了巨大的I/O负载。为了减少重复读盘,本文提出了一种新的自上而下的方法,即Apriori算法的改进版本,此算法大大降低了数据库的扫描次数,避免生成不必要的模式而减少了数据库的扫描,节省了大量的时间和空间。  相似文献   

17.
针对OFDN技术对定时、频偏和相位噪声敏感,较小的同步偏差即会导致系统的误码性能恶化,甚至通信失效的缺点,主要研究了OFDM符号同步的一种改进算法,即在传统的SCA(最大相关)估计算法的基础上采用多符号同步的方法。仿真表明该方法减少了符号偏差的均方误差,改善了系统的性能。  相似文献   

18.
数字水印技术从诞生至今得到了飞速发展,但如何公正、客观、统一地对各种算法进行有效的评价至今仍是一个悬而未决的问题。为此,提出了数字图像处理中的定量及主观的评价方式,并给出了针对水印算法所进行的数字水印隐蔽性测试结果。  相似文献   

19.
Sobel算法在图像处理时能对边界线进行提取,突出图像的边缘。该算法不仅能够提取目标和背景的边界线,还能把两者分开,突出图像的边缘,把有用信息提取出来。把Sobel算法应用于图像处理中,并与其他算法进行对比,进行软件仿真,通过在DSP芯片上实现,可以得出Sobel算法在边缘检测方面的优势。  相似文献   

20.
聚类算法是数据挖掘的核心技术,基于密度的聚类是一类已经被证明非常有效的聚类方法.与DBSCAN算法作比较,文章提出了一种基于密度的聚类算法(Clustering Using Centers and Density,CUCD).该算法是基于中心点以及密度实现的,其核心对象是根据数据分布计算出来的虚拟的点,并且核心对象的代表性随程序的执行次数而提高;经实验验证,该算法具有较好的时间效率和聚类质量.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号