首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
基于结构挖掘和使用挖掘的Web挖掘算法研究   总被引:1,自引:0,他引:1  
Web挖掘是指使用数据挖掘技术从Web文档和服务中发现和提取信息和知识的技术。本文概述了Web数据挖掘的基本情况以及Web结构挖掘和Web使用挖掘的基本概念。结合对Web结构挖掘中的PageRank算法和Web使用挖掘的主要步骤和算法的研究后,本文提出了一种融合这两种Web挖掘算法的一种新的、综合的Web挖掘算法。  相似文献   

2.
数据挖掘技术的重点已经从传统的基于数据库的应用转移到了基于Web的应用。本文分析了Web挖掘的过程模型。对基于数据挖掘的Web挖掘系统的框架进行了设计研究。  相似文献   

3.
Web挖掘研究   总被引:3,自引:0,他引:3  
介绍了Web挖掘的任务和分类;讨论了Web的内容挖掘、结构挖掘和使用记录挖掘。  相似文献   

4.
在分析网络有向图的总体结构以及导航页面、目标页面和网络功能的基础上,研究了结构挖掘算法。针对Hub页面的多主题性、无关页面和无关链接等对HITS算法有较大影响的问题,引入了结构改进,提出了HITS算法的改进算法。  相似文献   

5.
Web数据挖掘研究   总被引:2,自引:0,他引:2  
针对当前Web数据量急剧膨胀的状况,本文主要介绍了一种解决Web信息过载问题的新技术--Web数据挖掘.本文首先简述了Web挖掘的定义和分类,之后详细论述了各类Web挖掘中所用到的关键技术,最后对Web挖掘的发展趋势作了展望.  相似文献   

6.
Web挖掘能从大量非结构化、异构的Web信息资源中发现有用的知识或者模式,它已经被广泛地应用于许多不同的领域。目前,Web挖掘在教育领域中的应用也逐渐被人们关注。本文首先分别对Web挖掘的分类和方法做了详细的论述,最后对Web挖掘在教育中的应用做了比较全面的探讨。  相似文献   

7.
Web挖掘是数据挖掘技术与数据库技术、Web相结合的产物;介绍了Web挖掘的概念、分类、内容挖掘、Web挖掘的不足,论述XML在Web中的应用;利用XML存储数据的模型,在Web挖掘中提出了基于Web内容挖掘的系统模型.  相似文献   

8.
Web挖掘是数据挖掘技术与数据库技术、Web相结合的产物;介绍了Web挖掘的概念、分类、内容挖掘、Web挖掘的不足,论述XML在Web中的应用;利用XML存储数据的模型,在Web挖掘中提出了基于Web内容挖掘的系统模型。  相似文献   

9.
介绍了Web日志挖掘的模型,分析了使用关联规则挖掘Web日志时遇到的规则数量大且存在冗余等问题,提出了基于频繁闭项集的挖掘办法来减少规则数量.同时引入最小关联规则的概念,从而避免了冗余规则的产生.最后用实验验证了算法的有效性,并以周口师范学院校园网为例,对该网站日志数据进行分析,得到了有价值的规则,并对该网站提出了相应的建议和意见.  相似文献   

10.
Internet的迅速发展,使WorldWideWeb(WWW)成为一个巨大的、蕴涵着具有潜在价值知识的分布式信息空间。数据挖掘是从大量的数据中发现隐含的规律性内容,解决数据的应用质量问题,并充分利用有用的数据,帮助决策者调整策略,减少风险,做出正确的决策,是最具有前瞻性的一项技术。数据挖掘技术应用在Web环境下,通过对服务器日志信息采集,创建Web日志挖掘模型,分析经常访问的信息串,以利于网站管理者和经营者对网站管理进行决策参考。  相似文献   

11.
Web文本挖掘是数据挖掘技术在网络信息处理中的一个重要应用,如何将web文档转换成数据挖掘所要求的格式,即web文档预处理是一项很重要的研究课题.本文的方法是:从Internet网上下载了大量的网页文件,将网页文件转换成文本文件,然后通过算法对这些文本文件中的数据进行词频统计,删除非用词,去掉高频词,对单词进行词根处理,建立用词词表,从而抽取用词,按字母排序生成词频索引,和字典文件进行对照,获取单词的ID,最后生成Reuters-21578的Database数据格式.这样就将web文档数据转换成标准的数据集,以便为数据挖掘中分类、聚类作好准备.  相似文献   

12.
单纯形法是解决线性规划问题的重要方法之一,表格直接求解法则是单纯形法中最直接有效的方法。本文主要研究了线性规划中的单纯形算法的表格直接求解法,并且通过所给算例验证了表格求解法的可行性与有效性。  相似文献   

13.
分析了K均值聚类算法(K-means)存在的不足和改进遗传算法的全局优化能力,提出一种基于改进遗传算法的文本聚类方法,该方法将原始文档转化成用向量空间模型来描述的文本向量,首先随机产生若干个文档向量作为初始聚类中心形成遗传算法的染色体种群,经过改进遗传算法的选择、交叉、变异进化运算,得到较为优化的K均值聚类算法的初始聚类中心。实验表明该算法文本聚类提高了查准率和查全率,算法的高效性也得到了验证。  相似文献   

14.
针对精品课程网络资源在分布式环境中的共享问题,提出运用Web Services技术来整合跨平台精品课程网络资源,利用Web Services来设计整合和搜寻机制,通过标准的接口实现应用系统的互操作,进而整合并共享各精品课程管理系统之间的优质资源.  相似文献   

15.
当前,部分高校对大学毕业生的素质评估仍局限于文化课成绩,没有考虑学生其它方面的能力.为了完善这种片面评估,现利用一种改进的FP-Tree算法对学生的基本情况(包括:专业素质、思想道德素质、文学素质、身体素质、科研素质、社会实践素质、组织管理素质、创新等方面[1])进行规则挖掘,为家庭、学校更好地、有目的有方向地培养学生的各方面能力提供决策.本方法经校教务部门实践证明,切实可行,对教学管理具有指导作用.  相似文献   

16.
随着计算机应用开发的快速发展,基于B/S模式开发的应用软件非常普遍。在编写代码过程中,若未对系统界面中的输入进行逻辑上合法性判断,则应用程序存在安全隐患,如留言本、BBS之类的程序,大部分管理后台都是要登录以后才能留言管理的。一般情况下,用户输入密码,单击"登录"后,登录页面将密码提交给WEB页面服务器,系统到数据库中查看密码是否匹配,若匹配则登录成功,否则就会提示输入错误。  相似文献   

17.
Internet/Intranet技术的日益发展 ,使得人们对Web要求越来越高 ,不再满足于HTML所提供的简单的静态网页 ,而是需要灵活的动态页面。在用传统的公共网关接口CGI来实现动态页面比较困难的时候 ,ActiveServerPages提供了直观、简易的方法来制作强大的动态交互式Web应用程序的环境  相似文献   

18.
提出了基于Web Services的校园信息系统整合方案。该方案能够让原有的应用程序、传统的组件模型、关系数据库等,通过Web Services结合形成完整而且稳固的Internet/In-tranet系统。以学生信息数据库为案例,利用SQL Server2000、C++Builder 6和UDDI SDK,完成了校园信息系统集成架构中主要模块的编程实现和测试。  相似文献   

19.
首先对Web数据搜索引擎技术进行了概述,在此基础上进一步阐述数据采集过程、Robot的搜索策略、HTML解析器基本算法及数据检索模型,最后指出目前搜索引擎存在的问题,提出未来搜索引擎的发展方向。  相似文献   

20.
介绍数据挖掘中关联规则概念及发现频繁模式基FP-growth算法,及通过对模型的灵活运用,完成了对学生成绩关联规则分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号