首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
网络应用识别是网络管理、研究、规划、安全等一系列事务的基本前提,基于分组端口号和分组载荷的应用识别技术逐渐不能满足需求.根据不同应用具有各不相同的流量特性这一原理,可利用机器学习技术挖掘各种应用的流量模式,从而进行有效识别.本文使用简单的流量特征作为观测值进行有监督应用识别.通过比较多种通用的机器学习算法,找出最适用于应用识别问题的有监督学习方案,同时应用特征选择算法找出关键的流量特征.  相似文献   

2.
SVM算法只使用已归类的数据训练分类器,而EM算法用少量已归类数据,结合大量的未归类数据来训练分类器,在减少已归类数据的同时保证了分类器的精度。本文基于EM算法的思想,根据SVM文本分类模型,提出一种新的迭代SVM文本分类算法。实验结果表明,迭代SVM算法分类精度高于传统的SVM文本分类算法,具有较好的性能。  相似文献   

3.
通过介绍文本分类的过程及其关键技术,讨论了文本表示、分类算法、分类器性能评价原理和方法;最后,指出了当前文本分类过程中存在的问题,并对今后的发展进行了展望.  相似文献   

4.
网络流量管理控制技术在校园网的应用研究   总被引:1,自引:0,他引:1  
以P2P为代表的网络应用已经给当前校园网络出口带宽带来了前所未有的拥塞和安全海题.而这些弱题产生的内在原因在于当前的网络流量管理缺乏应用识别控制能力。因此,有必要在网络流量管理中引入流量应用识别控制技术。本文介绍了两种网络流量应用识别技术DPI和DFI,并对两者进行了比较;然后对网络流量管理控制技术在校园网中进行了实施和初步的研究;最后提出了在实际应用中需要思考的问题。  相似文献   

5.
针对目前国内外学者对微博情感只作二分类研究,仅仅从正面和负面研究微博情感不足的问题,选取NLPCC2013-2014年多情感的微博数据集,重点研究常用的3种机器学习算法、3种特征选择以及特征权重方法对中文微博情感多分类的影响。实验表明:不管选择哪种特征权重,使用SVM的微博文本分类准确率都最高,KNN的准确率最低;不同特征权重下,信息增益作为特征选择的方法时,3个算法各自准确率都是最高的;当信息增益为特征选择,TF-IDF为特征权重时,支持向量机的文本分类准确率最高。由于微博简短、口语化,词袋模型忽视了词与词间的联系,导致微博情感分类准确率不高。  相似文献   

6.
贝叶斯文本分类方法研究   总被引:1,自引:0,他引:1  
朴素贝叶斯分类器是当前流行的一种文本分类算法 ,它的简易性使其适合于处理属性个数较多的分类问题 ;TAN (TreeAugmentedNaiveBayes)综合了朴素贝叶斯的简易性以及贝叶斯网表示依赖关系的能力 ,使其能容纳属性间存在的某种依赖关系。通过实验比较朴素贝叶斯和TAN ,可以发现TAN方法具有较好的分类性能。  相似文献   

7.
提出基于图的半监督学习算法,即类别传播算,结合K均值算法改进,用于网页分类。该K均值类别传播方法使用欧式距离的建立带权∈NN图。在这个图中,图节点表示已标记或未标记的网页,边上的权重表示节点的相似度,已标记节点的类别沿着边向邻居节点传播,从而将网页分类问题形式化为类别在图上的传播。结合K均值方法,提高了计算速度以及图方法的归纳能力,经UCI数据集测试,结果表明,此算法比类别传播算法有更好的性能,能够有效地用于半监督网页分类。  相似文献   

8.
网络流量是局域网和广域网的重要特征之一,本文首先利用SPSS软件对校园网出口处IP分组进行了统计分析,进而使用ARIMA模型对网络的流量进行预测,并和实测流量数据进行比较,结果表明该模型对短期流量预测能够达到比较好的效果,  相似文献   

9.
大学分类的前提基础就是要有一个多样化的复杂的大学系统。然而我国大学趋同化明显,大学之间的差异性很小,在这样的环境下去设计大学分类的路径,无异于是在画饼充饥,难以取得实际效果,因此当前急需要做的事情是要形成复杂多样化的大学系统,让大学分类有类可分,才是当下正确的路径选择。  相似文献   

10.
传统的文本分类算法存在:忽视训练集的相对固定特征与新文献主题不断交化之间的矛盾,类间没有层次关系从而导致分类不太准确、效率低等问题,对此设计并实现了一种增量式的半监督文本分类算法-IC-Rocchio算法,实验结果表明,该算法能有效地改进这两方面的问题.  相似文献   

11.
3月,CERNET新开通了北京至保定2条155M线路。 3月份,网络运行情况一切正常。主干网及各地区网络流量都有大幅升高,主要是由于假期已经结束,各地用户使用情况均恢复到正常状态。  相似文献   

12.
Mrtg (Multi Router Traffic Grapher,MRTG)是一个监控网络流量负载的工具软件,它可以从所有运行SNMP协议的设备上(包括服务器、路由器、交换机等)抓取到信息,自动生成包含PNG格式的图形,并以HTML文档方式显示给用户.  相似文献   

13.
陈诚 《广西教育》2014,(27):187-189
高校管理者应从制度着手,合理进行网络使用引导,对各种网络流量控制策略进行合理微调与修正,从技术角度提升网络应用水平,为教学及应用体验提供良好的网络环境。  相似文献   

14.
针对信息增益特征选择方法没有很好考虑多标记的分布,在多标记文本分类中表现不佳的问题,用标记矩阵的协方差改善特征选择时标记之间的关联产生的影响,提高分类效果。最后通过实验证明,改进的信息增益特征选择方法具有可行性和有效性。  相似文献   

15.
针对文本分类领域的有监督学习往往需要大量精准标注样本但大量人工标注困难的问题,提出一种新型的半监督学习方式,通过协同训练合理使用大量未标记训练样本,通过添加不同分类的文本特征噪声解决传统协同半监督学习方法中模型参数趋于统一的问题,同时提高分类模型的分类能力。针对传统深度学习方法中文本特征权重一致导致的分类特异性特征不突出问题,在训练模型中加入 self-attention 机制对文本句子特征权重进行提取,并通过句子加权方式突出特异性分类特征。实验结果表明,通过半监督学习方式同时使用少量已标注数据进行训练,模型能够达到 91.4%的准确率,召回率达到 84.3%,与有监督训练方式的分类准确能力相近,从而解决大量人工标注问题,具有一定的使用价值。  相似文献   

16.
随着我国与柬埔寨的交流合作日益频繁,柬埔寨语的自然语言处理工作变得更为重要,针对柬埔寨语语料库资源有限、柬埔寨语组织机构名标注语料稀缺的问题,提出了一种基于半监督Tri-training的柬埔寨语组织机构名识别方法。该方法利用改进的Tri-training算法,结合柬埔寨语的语言特点进行实验。实验结果显示,准确率和召回率分别达到了65.68%、67.83%,表明该方法能有效利用大量未标注语料得到准确率较高的标注语料。  相似文献   

17.
对中西方学习及分类含义进行了描述;根据不同的分类形式,详细讨论了现代教学中经常运用的学习方式及其之间的相互联系;最后对适合当前教学的学习方式进行了探讨,指出每种学习方式在现今教学中仍然存在着不足,需要教学实践与理论相结合.  相似文献   

18.
机器学习的应用中,通常存在大量的未标记示例,对这些数据进行标记是昂贵和耗时的。与传统的监督学习不同,基于无标记数据的学习能同时在少量的已标记数据和大量的未标记数据上进行学习,从而提高学习的性能,已成为目前机器学习领域中的一个研究热点。分析了基于无标记数据的学习适用基于内容的图像检索的原因,并阐述了相关研究的进展情况。  相似文献   

19.
结合现有校园网网络流量监测所存在的问题,提出了基于Cacti的网络流量监测系统,实现校园网络流量的可视化管理和监控工作。利用Cacti的SNM P信息轮询机制及网络气象图插件,实时获取网络流量信息,直观的显示网络链路的带宽和负载状况。实践表明,该系统的运行提高了校园网络管理的效率,也为网络的优化及调整提供了有力的依据。  相似文献   

20.
孙炜 《现代企业教育》2011,(12):128-129
Mrtg(Multi Router Traffic Grapher,MRTG)是一个监控网络流量负栽的工具软件,它可以从所有运行SNMP协议的设备上(包括服务器、路由器、交换机等)抓取到信息,自动生成包含PNG格式的图形,并以HTML文档方式显示给用户。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号