首页 | 本学科首页   官方微博 | 高级检索  
     

增量式关键资源页面判定树
引用本文:黄天强,胡斌,李峰,卓月明,蔡国民,颜一鸣. 增量式关键资源页面判定树[J]. 情报学报, 2009, 28(3). DOI: 10.3772/j.issn.1000-0135.2009.03.019
作者姓名:黄天强  胡斌  李峰  卓月明  蔡国民  颜一鸣
作者单位:1. 吉首大学信息管理与工程学院,张家界,427000
2. 吉首大学信息管理与工程学院,张家界,427000;中南大学信息科学与工程学院,长沙,410008
基金项目:湖南省教育厅科学研究项目,湖南省教育科学规划课题,湖南省大学生研究性学习与创新性实验项目 
摘    要:本文针对互联网上信息的日益海量增长的情况,在评述前期算法的基础上,提出了一种关键资源页面判定树的增量式更新算法.新算法使用Web页面的链接分析方法,选择合适的Web页面属性,并基于反例的统计信息来构造判定树的测试属性值,采用ID5R算法来处理训练样本不断增长的关键资源页面判定的机器学习任务.同时设计了适合于该算法的剪枝策略,它通过引入并实时更新反例样本比率并在其值低于抑制因子时停止分裂的办法,避免了树的过度增长与抗嗓能力差、泛化情况糟糕的情况.实验表明增量式更新算法能更高效地生成关键资源页面判定树.最后讨论了该算法的应用领域.

关 键 词:关键资源页面  判定树  增量式更新

Incremental Decision Tree of Web Key Resource Pages
Huang Tianqiang,Hu Bin,Li Feng,Zhuo Yueming,Cai Guomin,Yan Yiming. Incremental Decision Tree of Web Key Resource Pages[J]. Journal of the China Society for Scientific andTechnical Information, 2009, 28(3). DOI: 10.3772/j.issn.1000-0135.2009.03.019
Authors:Huang Tianqiang  Hu Bin  Li Feng  Zhuo Yueming  Cai Guomin  Yan Yiming
Affiliation:1;2;1.Information Institute;Jishou University;Zhangjiajie 427000;2.Information Institute;Central South University;Changsha 410008
Abstract:To cope increasingly growing Web information,this paper presents an incremental updating algorithm for inducing Web Key Resource Pages based on analysis of previous algorithm.The new algorithm applies Link Analysis Method and choose appropriate Web page attribute value,constructs test attribute value based on statistical analysis of"negative instance",applies the ID5R induction process to learning tasks in which training instances are presented continuously.Meanwhile we present a new truing method to optimi...
Keywords:key resource pages  decision tree  incremental updating  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号