首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
在已有的基于Dom—Tree的网页信息提取算法基础上,通过对Html标签进行分类,逐个分析各Html标签所包含的结构信息,设计了一种自底向上的网页分块方法,并在此基础上,实现了文本相似度比较的网页主题内容信息块识别算法,提高了主题内容信息块的识别精确度。  相似文献   

2.
运用XML这一成熟的技术,提出了一个基于Web的挖掘模型和抽取方法,并对该模型和数据抽取方法进行了分析与测试。  相似文献   

3.
Web挖掘研究综述   总被引:9,自引:0,他引:9  
介绍了Web挖掘的概念及其相关的研究主题 ,Web挖掘的分类、相关技术、方法和一些Web挖掘工具 ,以及Web挖掘的应用。指出当前Web挖掘所面临的问题 ,并对Web挖掘的未来发展方向进行了描述。  相似文献   

4.
潘有能 《情报杂志》2005,24(2):10-12
对XML和字符集作了简要介绍 ,阐述了利用XML来解决Web挖掘中的多文种问题的必要性及可行性 ,构建了一个基于XML的多文种Web挖掘模型并详细解释了各个功能模块的具体实现方法。  相似文献   

5.
张春明 《今日科苑》2007,(22):167-167
随着Internet的迅猛发展,web挖掘逐渐成为数据挖掘的热点,但是因为Web自身的特点:多数据源,数据结构的半结构化,及动态性等种种,Web挖掘又是一个难点。本文从web挖掘的内涵入手简要介绍了web挖掘的目标、  相似文献   

6.
网站成为互联网信息的主要来源。由站点主体提出需求,设计者规划实现,站点结构和网页布局按照需求设计为固定模式,用户必须按照这种模式对网站进行浏览。提出了对用户访问站点的行为进行挖掘来改进站点设计和布局,达到方便用户访问站点和实现客户个性化服务的目的。  相似文献   

7.
基于Web挖掘的数字图书馆个性化技术研究   总被引:2,自引:0,他引:2  
王艳  张帆  杨炳儒 《情报杂志》2007,26(1):37-38,42
提出一种基于Web挖掘技术的个性化实现策略,针对数字图书馆资源的文献,改进了经典的算法,分别从Web内容挖掘、结构挖掘和日志挖掘出发,建立用户动态的兴趣特征模型,使之更具有实用性和针对性。  相似文献   

8.
本文介绍了Web挖掘的概念及其分类,探讨了电子商务中Web挖掘的过程和方法,并进一步阐述了Web挖掘在电子商务中的具体应用。  相似文献   

9.
聚类分析在Web文本挖掘中的应用   总被引:2,自引:0,他引:2  
徐海霞 《情报杂志》2004,23(12):99-101
在区分Web挖掘与数据挖掘的基础上,较详细地分析了Web文本挖掘的过程,并给出了一个具体的Web文本挖掘模型。重点在介绍聚类分析的基础上,以PCCS为算法原型分析了聚类分析在Web文本挖掘中的具体应用。  相似文献   

10.
基于XML的Web挖掘模型研究   总被引:1,自引:0,他引:1  
在介绍XML语言基本特点的基础上,提出了一种基于XML的Web挖掘模型,以期解决当前Web挖掘中存在的一些问题.  相似文献   

11.
Web数据挖掘技术在电子商务中的应用越来越广泛,已成为现代电子商务企业获取市场信息极为重要的工具。本文简要介绍了Web数据挖掘的定义等相关内容,并对Web数据挖掘技术在电子商务领域中的应用进行了阐述。  相似文献   

12.
Web用户访问日志数据挖掘研究   总被引:6,自引:2,他引:6  
简要介绍了Web用户访问日志数据挖掘研究内容,综述了Web用户访问日志数据挖掘研究的基础,包括常用术语含义、用户访问Web的几种习惯和用户访问日志的分布情况。论述了如何识别用户访问的web服务器的会话期间,指出了Web用户访问日志数据挖掘研究的难点所在。  相似文献   

13.
基于Web的市场营销数据挖掘   总被引:5,自引:2,他引:5  
根据知识获取的标准探讨数据挖掘方法在市场营销知识获取中具有的特点,分析了Web上的数据挖掘系统的结构和实现方法、数据挖掘的经济性,并构造了信息收集的成本模型。  相似文献   

14.
Web数据的访问一直是当前研究的热门话题。随着网络规模的扩大,海量Web数据访问受到了很大限制,高纬度的数据会大幅的打乱数据知识模式规则,数据可视化结构不能满足算法知识发展的要求,导致海量Web数据访问耗时。为此提出一种基于模糊核递归计算的海量Web数据访问优化算法。计算数据模糊核特征,利用隶属度函数表示模糊特征的归属,利用模糊核递归判别从这些海量数据中发现有用知识包括模式规则、可视化结构。实验表明,该方法能够较好地完成海量Web数据的优化方法,时间复杂度大幅降低。  相似文献   

15.
汪全莉 《情报杂志》2008,27(5):92-94
分析了Web数据挖掘所面临的问题,并就XML对Web数据挖掘的适应性进行了分析,最后就XML语言在Web数据挖掘中的应用进行了探讨.  相似文献   

16.
基于XML的Web数据挖掘模型的研究   总被引:1,自引:1,他引:0  
陈景霞  张鹏伟 《情报杂志》2006,25(11):100-102
在分析XML技术的基础上,提出了基于XML的Web数据挖掘模型,并结合实例说明了具体的实现方法,同时针对模型系统的不足提出了一些改进。  相似文献   

17.
Web信息复杂程度不断加深,多维度、高复杂度的信息越来越多,信息中的错误信息特征在海量复杂数据属性中表述越来越困难,造成信息挖掘耗时过长,挖掘效果不好的问题。为了解决这一问题,提出了一种距离信息模糊信息权值分类的Web错误数据挖掘算法。在Web特征表述过程中,运用距离描述Web数据的错误数据特征,运用模糊信息熵,对错误数据特征进行距离分类,保证数据分类的准确性,最大程度的完成错误数据高效挖掘。实验结果表明,该算法能有效减少错误数据信息在海量信息中的挖掘时间,提高了挖掘的准确性,取得了满意的效果。  相似文献   

18.
随着Internet的迅速发展及Web的全球普及,数据挖掘技术已经在各个领域、各个行业展现了它的巨大作用。通过分析Web及数据挖掘的特点,列举出数据挖掘在Web基础上的具体应用。  相似文献   

19.
王冰 《情报杂志》2007,26(3):58-60
Web搜索引擎是主要基于关键词匹配的检索技术,面对WWW新的应用模式,已不能很好地满足用户的需求。而Web数据挖掘系统是对Web文档集合和用户需求集合的匹配与选择,它通过Web内容挖掘、Web结构挖掘、Web用户使用记录挖掘等数据挖掘方法,从与WWW相关的资源和检索行为中抽取用户感兴趣的、有用的模式和隐含的信息,以满足情报检索的相关性和准确性的要求。因此,可运用相关搜索引擎和相关网站的设计方法,建立军事情报Web挖掘应用系统。  相似文献   

20.
基于Web数据挖掘的个性化信息智能Agent挖掘系统模型   总被引:1,自引:0,他引:1  
张莉 《科技广场》2006,31(8):53-55
个性化智能挖掘是近几年出现的一个崭新的研究方向,它是人工智能与数据挖掘技术在Web或Internet环境下相互融合的产物。大部分个性化信息挖掘都只是建立在纯粹的Web数据挖掘之上,然而面对大部分的智能化技术的出现,面对用户能够快速准确地检索自己最想要的信息的需求,Web数据挖掘要进行相应的扩展,通过将Web数据挖掘技术和智能Agent技术相结合,从而满足用户的需求。本文主要提出两个模型:典型的个性化Web挖掘模型和个性化Agent智能挖掘模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号