首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 250 毫秒
1.
潘磊 《教育技术导刊》2009,19(10):152-155
为了提高电力系统中故障预测效率及便捷性,提出一种基于FP-Growth算法的电力系统故障预测方法,无需先验知识及人工标注,便可从海量历史日志数据中快速提取出故障信息模式,并基于实时日志数据对未来可能发送的系统故障进行预测。该方法首先根据电力系统不同类型的日志特征对原始数据进行预处理,然后基于FP-Growth算法挖掘日志中与故障事件相关的关联规则,并使用关联规则进行故障匹配,从而达到预测效果。算法经过真实电力系统日志数据集测试,结果表明该故障预测方法平均准确率为89.5%,平均召回率为79.8%,且执行效率较高,节省了业务人员50%以上的时间。  相似文献   

2.
为了提高C4.5决策树算法的有效性,提出一种改进的C4.5决策树算法。结合粗糙集理论的属性约简算法和Fayyad边界点判定定理,对C4.5算法进行了改进,利用UCI数据集进行了实验。结果表明,改进的C4.5算法不仅提高了准确率,而且缩小了决策树规模,减少了分类时间。  相似文献   

3.
以大数据智能化为切入视角,基于K-means和C4.5决策树算法,构建了融合RPA的财务共享中心运营管理优化模型。结果显示,在绩效评价优化层面,聚类-1下绩效评价频率高且在90%以上,而聚类-2下频率相对较低且在70%~90%之间;在风险管控优化层面,训练数据集的预测准确率高达91.24%,而测试数据集的预测准确率达到74.16%;而在税务管理层面,优化后模型的AUC、CA以及Recall等性能指标均得到显著提高。结合K-means和C4.5决策树大数据智能算法构建的融合RPA的财务共享中心运营管理优化模型,既降低了财务共享中心运营管理成本,又充实了财务运营管理技术体系,继而全面提高了企业财务运营管理质量与水平。  相似文献   

4.
介绍了一种一般情况下的C4.5数据挖掘算法的优化方法。原来的C4.5算法在计算属性信息增益率时需要大量用到对数运算,而优化后的C4.5算法计算属性信息增益率时只需用到加减乘除运算,在实现时不用频繁调用对数函数,优化后的算法不会改变属性信息增益率的排序,不改变生成的决策树。改进后的算法能做到在不改变准确率和不增加空间复杂度的情况下,减少时间复杂度,提高了决策树生成效率。  相似文献   

5.
对海量数据的处理能力是数据挖掘最关注的问题。决策树作为一种分类器,是数据挖掘中用到的一种基本方法之一。基于C4.5的决策树改进算法,是在一些典型的决策树分类算法的基础上提出的,基本思想是在建树过程中,用属性依赖度替代信息增益率来确定划分条件属性的顺序。该算法借鉴MedGen算法的阈值设定方法,在简化决策树剪枝和优化过程的同时,可优化C4.5算法中使用信息熵率的时间复杂度,避免了使用信息熵带来的不当划分。简述了该改进算法的执行过程,证明了算法的正确性。  相似文献   

6.
一种代价敏感学习方法在电信业流失预测中的应用   总被引:1,自引:0,他引:1  
根据已有的流失预测方法,提出新的流失预测方法解决数据挖掘中的非对称错分代价问题.该方法以传统C4.5决策树算法为基准分类器,融合代价调整方法实现代价敏感学习.相比之下,C4.5决策树算法仅是基于样本错分代价相同假定,建立了一种错分率最低而非总错分代价最低的预测模型.基于某电信企业的客户数据,及流失客户和非流失客户代价非对称的实际,实证研究结果表明,CS-C4.5通过调整流失类和非流失类样本的比例,大大降低了传统分类算法的样本错分总代价.该方法对于提高电信企业的核心竞争力具有重要的现实意义.  相似文献   

7.
谢秋华 《三明学院学报》2012,29(4):34-39,100
介绍了一种C4.5算法的改进方法,即在计算属性信息增益率时只用到加减乘除运算,而不是像C4.5那样的大量用到对数运算。实验表明,改进的C4.5算法在不改变模型预测准确率的同时,减少了计算时间,提高了决策树的生成效率,而后将改进的C4.5算法作用于《大学计算机基础》课程的成绩分析,得到的分析结果用于辅助指导教师对《大学计算机基础》课程的教学工作,能够更好地促进教学,提高学生对此门课程的掌握程度和为普及计算机做出帮助。  相似文献   

8.
运用开源系统WEKA,选取C4.5算法构建贫困生决策树模型,利用30%的数据来测试模型分类效果,实验结果显示,模型预测的准确率和精确度都较高,模型分类效果较好。从模型构建中发现了影响贫困生分类的重要标准和评价规则,从而为完善贫困生评价体系并改进评价工作提供有效建议。  相似文献   

9.
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。对网络课程知识点个性化设计中的大量数据,运用数据挖掘算法中的决策树C4.5算法对所给数据进行处理,选取决策属性,构造决策树,提取分类规则,获取每一个知识点与不同类型的学生之间的关系。通过实验仿真发现,C4.5决策树算法取得了较为理想的分类预测效果。  相似文献   

10.
车辆加速性能是衡量驾驶员对车辆驾驶舒适性的一个标准。传统的车辆加速性能是通过判断加速踏板开度衡量的,加速踏板出厂时设置为不能自动调整。采用改进的C4.5算法对车辆加速性能分类,实现自动调整加速踏板开度。首先通过泰勒中值定理对C4.5算法进行简化,然后对车联网数据进行特征提取,生成判断加速性能的决策树分类规则,测试特征提取的并行化运行效率。通过特征提取后的数据集验证了改进的C4.5算法效率和准确率。测试结果表明,改进算法在不降低分类准确率的前提下,有效提高了分类效率。  相似文献   

11.
Using log data of 823 university students collected in two settings: their online learning setting and daily life setting (using campus ID cards for consumption purposes and book-borrowing in the university library), this study created indicators for online learning behavior, early-rising behavior, book-borrowing behavior and learning performance prediction. Five machine learning models were employed to analyze learning performance prediction, with the additional use of Boosting and Bagging to improve the accuracy of the prediction model. The predictability of the proposed model was also compared with that of both the Artificial Neural Network model and the Deep Neural Network model. At the same time, a classification rule set was established by combining decision tree and rule model, and a learning behavior diagnosis model combining decision tree and deep neural network was constructed. Findings showed that multi-scenario behavior performance indicators had strong predictive capabilities while the Deep Neural Network model had the highest prediction accuracy (82%) but was most time-consuming. The model based on the rule set is highly accurate, readable and operable and may be conducive to making accurate teaching interventions and resource recommendations.  相似文献   

12.
增强突发事件研判、预警与快速响应能力,对加强网络舆情监管与引导,维护社会安全和稳定具有重要意义。首先基于网络舆情演化机制与特征建立科学、合理的指标体系;然后选取重要程度与分类性能均比较优异的末级指标作为特征属性,构造 C4.5 决策树风险预警模型;最后将突发事件网络舆情相关数据带入风险预警模型,得到预警风险等级。实验结果表明,该方法能够对突发事件网络舆情进行风险预警,预警准确率高达94.7%。  相似文献   

13.
This article reports a study on using data mining to predict K–12 students' competence levels on test items related to energy. Data sources are the 1995 Third International Mathematics and Science Study (TIMSS), 1999 TIMSS‐Repeat, 2003 Trend in International Mathematics and Science Study (TIMSS), and the National Assessment of Educational Progress (NAEP). Student population performances, that is, percentages correct, are the object of prediction. Two data mining algorithms, C4.5 and M5, are used to construct a decision tree and a linear function to predict students' performance levels. A combination of factors related to content, context, and cognitive demand of items and to students' grade levels are found to predict student population performances on test items. Cognitive demands have the most significant contribution to the prediction. The decision tree and linear function agree with each other on predictions. We end the article by discussing implications of findings for future science content standard development and energy concept teaching. © 2007 Wiley Periodicals, Inc. J Res Sci Teach 45: 554–573, 2008  相似文献   

14.
针对客户端朋艮务器(C/S)模式软件更新不太方便的实际问题,阐述C/S模式软件自动更新系统的设计与实现,并且实现了各模块有选择的更新。系统在.NET环境下开发完成。利用FTP协议实现了更新文件的传输,利用ini文件储存更新文件的配置信息。  相似文献   

15.
Attribute reduction is necessary in decision making system. Selecting right attribute reduction method is more important. This paper studies the reduction effects of principal components analysis (PCA) and system reconstruction analysis , SRA) on coronary heart disease data. The data set contains 1723 records, and 71 attributes in each record. PCA and SRA are used to reduce attributes number (less than 71 ) in the data set. And then decision tree algorithms. C4.5, classification and regression tree ( CART), and chi-square automatic interaction detector ( CHAID ), are adopted to analyze the raw data and attribute reduced data. The parameters of decision tree algorithms, including internal node number, maximum tree depth, leaves number, and correction rate are analyzed. The result indicates that. PCA and SRA data can complete attribute reduction work. and the decision-making rate on the reduced data is quicker than that on the raw data: the reduction effect of PCA is better than that of SRA. while the attribute assertion of SRA is better than that of PCA. PCA and SRA methods exhibit good performance in selecting and reducing attributes.  相似文献   

16.
王琴竹 《运城学院学报》2011,29(2):53-54,57
决策树算法广泛应用于模式识别和机器学习等领域,用来解决与分类相关的问题。决策树算法中的过度拟合会在很大程度上影响到最终的分类结果。针对过度拟合产生的原因,采用悲观错误剪枝方法,对学生成绩决策数据进行分析,得出影响学生成绩的重要因素。实验表明,该方法可以得到尽可能短的分类规则,有效地提高了决策树的性能。  相似文献   

17.
为解决集中式服务发现结构存在的性能瓶颈问题,基于领域本体语义信息,提出一种能自适应地调整领域划分、分配系统资源的分布式web服务发现体系结构,并分析了该结构的可扩展性、自组织性和自适应性.具体描述了该结构下的语义web服务发现算法的2个阶段:语义注册中心定位和基于输入输出的服务匹配.在注册中心组成的平衡树拓扑结构中,注册代理能够快速将请求转发至目标注册中心,避免产生性能瓶颈.然后,通过引入一种新的基于语义距离的服务匹配算法来进行服务查询效果优化.模拟实验结果表明:提出的服务发现方法具有高可扩展性的优点;与其他服务查询算法相比,服务匹配算法具有更高的查全率和查准率.  相似文献   

18.
利用傅立叶级数对散点小行星光变数据进行曲线拟合,以获得小行星表示参数,选取傅立叶级数为6的拟合方式对单体或双体小行星光变曲线进行分类,并用机器学习算法中的SVM和决策树建立预测模型。检验结果表明,SVM模型对单体和双体小行星的预测正确率达到95%,相较于决策树正确率提高了10%,为从小行星实际观测数据直接推测双体小行星潜在相关应用提供了参考。  相似文献   

19.
为了提高小型服务器文件下载服务的质量,缓解并发下载请求时I/O瓶颈导致的下载速度问题,提出了一种改进型缓存替换策略,并设计了基于该策略的文件下载服务机制。实验结果表明该机制具有较高的字节命中率和请求命中率,在处理并发下载请求时,有效地降低了I/O随机读取频率,改善了服务质量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号