首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
肖弋 《科技通报》2019,35(5):127-131
大数据时代数据安全性检查至关重要,提出一种新的特征变换算法检测异常数据用以保证数据安全。数据是否异常可以归类为二分类问题,逻辑回归算法作为常用分类算法具有很强的抗噪能力,采用卷积神经网络预产生高阶特征,高阶特征通过提取卷积神经网络各网络层神经元输出获得,高阶特征用以提升逻辑回归算法的表达能力。试验结果表明,逻辑回归算法在高阶特征上能够获得较高的分类准确率。  相似文献   

2.
根据软件工程的基本原理在Ubuntu操作系统环境下使用Eclipse开发工具,设计并实现了基于Hadoop系统架构的NaiveBayes算法文本分类系统。系统将大量中文文本数据集存储在分布式文件系统HDFS上,通过MapReduce并行计算模型和Ansj中文分词库对中文数据集进行分词,采用TF-IDF算法进行文本特征抽取,最后基于Spark并行计算框架和NaiveBayes算法对特征数据集进行模型训练,得到文本分类模型,将文本分类服务集成到Web页面。系统基本实现了文本的正确分类。  相似文献   

3.
对Web连续攻击信号进行单模式匹配抓取进而提高对攻击信号的检测能力,提出一种基于NET架构的Web连续攻击单模式匹配抓取算法,采用盲源分离算法高斯随机分布下对连续攻击信号进行自相关成分分析,通过时频伸缩信号在不同时间下的能量密度,对Web连续攻击信号进行正常和异常数据分离,对不同频段进行频率变尺度压缩,实现对高频特征和低频特征的分段处理。采用包络线进行平均值标记的方法,得到信号的状态空间固有模态函数差值分量,实现算法改进。实验结果表明,该算法能准确实现对NET构架下的Web连续攻击特征点的单模式匹配抓取,提高对Web连续攻击信号的检测能力,对NET构架下的Web连续攻击特征信号的准确抓取概率较高,在网络安全构架等领域具有较好的应用价值。  相似文献   

4.
为了解决传统网络攻击检测算法存在的检测准确率低等问题,提出了一种基于SVM和DS证据理论的网络攻击检测算法。该算法首先利用样本主特征进行检测,当数据出现模糊分类时,利用辅助特征和DS证据理论对数据的隶属度进行重新划分,有效改善了经典SVM算法的模糊分类问题。仿真结果表明,带有修正机制的SVM算法对于网络攻击检测,尤其是攻击类型未知的数据,检测准确率明显提高,平均到了95%以上,算法的整体性能表现优良。  相似文献   

5.
分析DDoS攻击的形成及特征,对各种拒绝服务攻击的实现算法进行对比分析。重点研究可用于检测和防御基于HTTP协议的DDoS攻击的方法,消除或者减少HTTP-Flood攻击对Web服务器的影响,从而达到保护Web服务器的目的。最后,将这种检测防御方法移植到Web应用防火墙(WAF)的DDoS模块中,实现Web服务器防范DDoS攻击的最终解决方案。  相似文献   

6.
周源  刘怀兰  杜朋朋  廖岭 《情报科学》2017,35(5):111-118
【目的/意义】特征提取会很大程度地影响分类效果,而传统TF-IDF特征提取方法缺乏对特征词上下文环 境和对特征词在类之间分布状况的考虑。【方法/过程】本文提出一种改进TF-IDF特征提取的方法:①基于文本网 络和改进PageRank算法计算节点重要程度值,解决传统TF-IDF忽略文本结构信息的问题;②增加特征值IDF值 的方差来衡量特征词w在不同类别文本集中程度的分布情况,解决传统TF-IDF忽略特征词在类之间分布状况的 不足。【结果/结论】基于该改进方法构建了文本分类模型,对3D打印数据进行分类实验。对比算法改进前后的分 类效果,验证了该方法能够有效提高文本特征词提取的准确度。  相似文献   

7.
集成学习算法是机器学习领域中用来提高分类器泛化性能的流行算法。本文利用平安人寿保险股份有限公司的实际业务数据,采用数据挖掘算法中的集成算法,建立公司少儿险产品的多个推荐模型。该系列模型对比常见的分类方法如逻辑回归构建的模型,在深度较小时,预测精度有所提升,能够更加准确地挖掘出购买客户,实现精准营销。  相似文献   

8.
提出基于半监督混合模型的海量入侵数据检测方法。利用蚁群算法进行入侵数据的特征选择,在结合半监督的混合模型分类方法进行入侵数据的分类,利用混合模型对数据样本空间的聚类分布进行描述,利用数据函数将聚类的信息与分类算法相结合,进行数据分类时对没有标示的数据样本进行考虑,对入侵数据进行检测。克服传统方法存在的弊端,提高了分类器的泛化能力,保证数据分类的效果,提高了入侵数据检测的准确性,完成对大数据环境下网络主动入侵海量数据检测的研究。实验的结果表明,利用本文方法能有效地提高入侵数据检测的准确性。  相似文献   

9.
在分布式社交网络中,产生Biclique攻击信号,需要对其进行攻击延迟容忍设计,提高对病毒攻击的检测和容忍性能。传统方法中采用基于攻击信号方向性聚类延迟容忍算法,当传播路径具有发散性时,检测性能不好。提出一种基于Biclique攻击信号方向性空间搜索属性特征分解的攻击延迟容忍算法。把数据主特征建模和特征提取分类与缺省副本创建处理同步进行,得到更小的响应时间,实现攻击延迟容忍,得到基于Biclique攻击信号方向性空间搜索属性特征分解结果,进行Biclique攻击信号检测,提高对攻击信号延迟容忍性能和检测性能,仿真结果表明,采用该算进行分布式社交网络中Bi-clique攻击检测,检测性能提高34.5%,算法能有效保证分布式社交网络的安全性和对病毒攻击信号的容忍性。  相似文献   

10.
通过对网络病毒感染下振荡攻击数据混淆分离,实现对网络病毒攻击数据的特征定位和提取,有效检测网络病毒数据。传统方法中对网络病毒感染下的振荡攻击数据的检测和分离方法使用行为特征分析和卡尔曼滤波方法,算法受到数据振荡和线性特征干扰的影响,检测性能不好。提出一种基于双线性本征波匹配的振荡攻击数据混淆分离算法,构建网络病毒感染振动攻击模型,提取攻击数据的信号模型特征,根据调解病毒样本序列的线性化程度,确定双线性本征陷波器频率参数和带宽参数,实现对信号的滤波,进而实现混淆分离算法的改进。仿真结果表明,该算法设计的滤波器进行振荡攻击数据的混淆分离,具有较好的抗噪能力和干扰抑制能力,对网络病毒攻击数据的混淆分离均方根误差较小,对病毒感染下的振荡攻击信号的检测性能较高,展示了其优越性能。  相似文献   

11.
高欢  那日萨  杨凡 《情报科学》2019,37(11):48-52
【目的/意义】准确挖掘消费者在线评论情感倾向,对于改善商家服务具有重要意义,而情感倾向预测的准 确性仍需提高。【方法/过程】文中设计基于集成学习的在线评论情感分类算法,即以N-gram算法分析在线评论词 语特征,结合情感词典构造文本特征,利用逻辑回归、Light GBM等机器学习方法为基础的集成学习进行训练,实现 在线评论情感分类。【结果/结论】实现了评论的情感倾向预测,在电脑评论数据集,较之于经典的SVM算法和无监 督类算法,该模型的分类衡量指标F1值分别提高了10%到30%不等。同时,在酒店、图书等不同领域的数据集上显 示,该方法的分类准确性仍具有上述效果,证明了该方法具有领域移植性。  相似文献   

12.
大数据环境下的网络主动入侵检测方法研究   总被引:2,自引:0,他引:2  
由于传统网络入侵检测方法检测率低及不能进行在线检测,无法有效实现网络主动入侵检测,提出一种基于马氏距离K均值的大数据环境下网络主动入侵检测方法,分析了马氏距离的评价准则,依据新样本与原样本之间的马氏距离确定是否需开展新的聚类,输出与全部数据样本相应的攻击类别。通过一个由一定数量的支持向量决定的超平对数据进行分类,当SVM分离方法受到约束时,利用核函数将输入数据映射至高维特征空间,采用高斯径向基函数对最小二乘支持向量机分类模型进行建立。通过粒子群优化算法对最小二乘支持向量机参数进行选择。利用种群中个体之间的协作以及信息交换获取最佳方案。仿真实验结果表明,所提方法有很高的的检测效率及精度。  相似文献   

13.
提出一种基于变维Kalman滤波的Web海量数据流抗干扰挖掘算法。构建Web环境下的海量数据挖掘数据流信息模型和噪声干扰模型,结合现代信号处理方法,设计变维Kalman滤波算法进行海量数据流信号滤波预处理,把Web海量数据流映射为一组非线性宽带调频信号模型,采用信号检测算法实现Web海量数据的抗干扰挖掘。仿真结果表明,采用该算法进行Web海量数据信息的抗干扰挖掘,具有较高的数据检测精度和准确挖掘性能,具有较高的抗干扰性和鲁棒性。  相似文献   

14.
对差异设备中的底层IPv6网络安全检测模块的研究中,传统网络安全检测方法在应用层对攻击进行识别和拦截,无法保证用户的数据安全,并且识别新攻击速度慢,拦截概率低。为此提出一种基于数据挖掘融合IPSec的安全检测模块,面向用户数据安全,采用K-means数据融合算法提取入侵数据特征,建立模型库,实施拦截。通过模拟多种攻击模式对提出的算法和传统算法进行性能比较,结果显示,所提算法能够在更短的时间内,提取攻击特征,建立模型库,并且在相同次数的攻击下,模块对攻击具有更高的检测概率,平均高于传统方法15%,显示了优越的检测性能。  相似文献   

15.
[目的/意义]探究社交网络中影响群体情感行为的影响因素,旨在为舆情引导提供参考。[方法/过程]首先,获取微博数据集,进行预处理后,使用结合AP算法及TF-IDF算法的LDA主题模型对用户文本进行聚类,挖掘用户兴趣主题;然后,人工识别结合接口调用对用户文本进行情感标注;最后,利用二元逻辑回归模型对假设的群体情感影响因素进行验证。[结果/结论]性别、主题及活跃度对于群体情感倾向有显著影响;男性群体普遍比女性群体消极;不同主题的情感主旋律不同。该结果对于网络舆情的控制以及个性化新闻推荐具有很好的借鉴作用。  相似文献   

16.
为研究使用混沌分析的方法检测大型Web数据库的异常入侵特征新型问题,提出使用递归图分析的混沌特征分析方法检测Web数据库异常入侵。使用平均互信息算法和虚假最近邻点算法求取Web数据库信息流相空间重构的关键参数,使用递归图分析方法分析了各类异常入侵信号下真实Web数据库的检测。仿真结果表明平均互信息算法和虚假最近邻点算法能有效应用于对Web数据库信息流异常信号入侵检测的相空间重构中。递归图混沌分析的方法能有效检测出各类异常入侵特征,递归图中有规则图案,表明入侵信号和Web数据库信息流具有确定性成分存在,能对之实现有效检测和防御,研究结果证明检测算法能有效应用于网络数据安全检测实践。  相似文献   

17.
针对图书、期刊论文等数字文献文本特征较少而导致特征向量语义表达不够准确、分类效果差的问题,本文提出一种基于特征语义扩展的数字文献分类方法。该方法首先利用TF-IDF方法获取对数字文献文本表示能力较强、具有较高TF-IDF值的核心特征词;其次分别借助知网(Hownet)语义词典以及开放知识库维基百科(Wikipedia)对核心特征词集进行语义概念的扩展,以构建维度较低、语义丰富的概念向量空间;最后采用MaxEnt、SVM等多种算法构造分类器实现对数字文献的自动分类。实验结果表明:相比传统基于特征选择的短文本分类方法,该方法能有效地实现对短文本特征的语义扩展,提高数字文献分类的分类性能。  相似文献   

18.
采用网络协议爬虫方法对Web网页跨站脚本的动态污点Bug进行检测和数据补齐,根本上保证Web安全。传统方法采用主成分分析和驱动爬虫方法进行Bug数据补齐,当用户提交的数据没有经过严格的过滤和验证的时,Bug漏洞不能得到有效检测。提出一种基于向量空间动态污点传播模型的Web协议爬虫算法,实现对动态污点Bug检测与数据补齐,构建向量空间模型,计算Bug数据和漏洞检测中的模糊关系的隶属度,提取动态污点Bug数据模态特征进行网络爬虫,优化对动态污点数据的检测性能。仿真实验结果表明,该算法能提高数据补齐的准确性,聚类性好,收敛性提高,保证了系统安全防御的实时性,在Web程序安全设计中应用前景广阔。  相似文献   

19.
Web数据的访问一直是当前研究的热门话题。随着网络规模的扩大,海量Web数据访问受到了很大限制,高纬度的数据会大幅的打乱数据知识模式规则,数据可视化结构不能满足算法知识发展的要求,导致海量Web数据访问耗时。为此提出一种基于模糊核递归计算的海量Web数据访问优化算法。计算数据模糊核特征,利用隶属度函数表示模糊特征的归属,利用模糊核递归判别从这些海量数据中发现有用知识包括模式规则、可视化结构。实验表明,该方法能够较好地完成海量Web数据的优化方法,时间复杂度大幅降低。  相似文献   

20.
网络撞库攻击是一种从数据库中导出数据的攻击方式,通过网站入侵,非法实现对用户信息的窃取和修改,如何更好提高网络安全,提出一种改进的网络撞库攻击信息特征潜在博弈欺骗鉴别算法。首先构建信号模型,采用博弈论方法,对攻击行为的欺骗性进行鉴别,得到网络区分服务等级的服务质量量化函数,从而实现对撞库攻击信号的欺骗性鉴别,利用非单调性决策博弈方法,给出网络威胁离散度状态方程,得到骗性判别的鉴别函数,统计撞库攻击行为的参与者,构建接入网络的优服务质量函数,提取出有用的规则性异常数据特征,并结合后置分类处理和数据处理,实现对攻击信号的准确检测和欺骗信号的鉴别。仿真实验表明,采用该方法,能有效鉴别出网络撞库攻击信号的实质信息特征和欺骗信息特征,对攻击信号的检测性能优越,提高了鉴别准确率,提高了网络服务的质量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号