首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
2.
如何在数量巨大的Internet中快速准确的搜索到符合要求的Web页是一个值得探讨的重要课题.构造了一种能够准确区分Web文本之间亲和力的挖掘模型,运用人工免疫算法使该模型具有较高的聚类精度和自发现能力.实验结果表明,该模型不仅能够有效的进行文本内容挖掘,保持较低的错误肯定率和错误否定率,还具有很强的自适应性和更新能力,进行适当的参数设置后检测周期也随之大幅缩短,提高了挖掘模型的效率.该模型的提出为Web挖掘领域提供了一种新的研究思路.  相似文献   

3.
文本挖掘是从非结构化或半结构化文本材料中获取有效、新颖、潜在有用的、可理解的知识模式的过程。本文首先对文本挖掘的定义、过程和实现途径作了论述,然后试图从信息检索、游览检索结果的效率、垃玻邮件的过滤、个人化主页服务、文档的管理和BBS文档的鉴别和过滤六个方面,对文本挖掘在教育中的应用作了探讨。最后,还对文本挖掘的一些应用系统作了简要介绍。  相似文献   

4.
在网络环境中文本挖掘的过程主要包括特征提取、特征选择、挖掘方法选择、结果评价和知识模块等几个部分;最新的发展方向是基于EM算法对文本进行挖掘,基于该算法的的比较挖掘模型为:首先对已知数据集任意分为几个类,然后根据各个类集和背景集对文档集的各个词进行似然,再通过求和可以得到整个数据集的似然,该过程反复进行,直到收敛,从而可以根据各类和背景集结果中的较大的概率值得出文本的共同主题和各个类的主题。  相似文献   

5.
Web挖掘能从大量非结构化、异构的Web信息资源中发现有用的知识或者模式,它已经被广泛地应用于许多不同的领域。目前,Web挖掘在教育领域中的应用也逐渐被人们关注。本文首先分别对Web挖掘的分类和方法做了详细的论述,最后对Web挖掘在教育中的应用做了比较全面的探讨。  相似文献   

6.
Web文本挖掘中的特征表示与特征提取技术   总被引:2,自引:0,他引:2  
Web文本挖掘是人工智能一个崭新的研究领域。分词、特征表示和特征子集提取技术是文本挖掘过程中前期的基础性工作。介绍了文本挖掘中分词、特征表示及特征子集提取的常用技术及发展趋势。  相似文献   

7.
基于结构挖掘和使用挖掘的Web挖掘算法研究   总被引:1,自引:0,他引:1  
Web挖掘是指使用数据挖掘技术从Web文档和服务中发现和提取信息和知识的技术。本文概述了Web数据挖掘的基本情况以及Web结构挖掘和Web使用挖掘的基本概念。结合对Web结构挖掘中的PageRank算法和Web使用挖掘的主要步骤和算法的研究后,本文提出了一种融合这两种Web挖掘算法的一种新的、综合的Web挖掘算法。  相似文献   

8.
Web文本挖掘是人工智能一个崭新的研究领域。分词、特征表示和特征子集提取技术是文本挖掘过程中前期的基础性工作。介绍了文本挖掘中分词、特征表示及特征子集提取的常用技术及发展趋势。  相似文献   

9.
Web挖掘研究   总被引:3,自引:0,他引:3  
介绍了Web挖掘的任务和分类;讨论了Web的内容挖掘、结构挖掘和使用记录挖掘。  相似文献   

10.
Web中存在着大量的、丰富的超链接.挖掘链接结构可以有助于提高Web信息检索的精度、发现潜在的Web社区.全面分析了基于Web链接结构的挖掘算法及其优缺点.并对挖掘算法在Web潜在社区发现中的应用作了探讨.  相似文献   

11.
Web数据挖掘技术及其应用   总被引:1,自引:0,他引:1  
Web数据挖掘是应用数据挖掘技术在Web数据中发现和获取有用信息的过程。介绍了Web数据挖掘的原理、应用与实现。  相似文献   

12.
改进后的Fp-Growth挖掘算法适用于对大型数据库的数据关联规则的挖掘,基于一种新的数据库分隔方法来分隔数据库,并对分隔得到的各数据库子集用算法进行约束频繁项集挖掘。改进的数据库划分策略克服了占用内存大的缺陷,提高了挖掘速度,实时性更强。  相似文献   

13.
聚类算法是数据挖掘中用来发现数据分布和隐含模式的一项重要技术。通过分析研究数据仓库及数据挖掘中聚类算法的现状,对数据挖掘中常见的几种聚类算法的性能进行相互比较,并分析它们各自的优缺点,对数据挖掘中聚类算法的发展趋势作出展望。  相似文献   

14.
分析了神经网络数据挖掘算法的适用范围,对算法模型和算法实现进行深入的探讨,并利用基于时间序列的多层前馈神经网络挖掘算法实现了对企业材料成本数据的预测,可为企业成本管理提供决策支持.  相似文献   

15.
Web数据挖掘及其在电子商务中的应用   总被引:1,自引:0,他引:1  
随着Web上信息资源的沙漠化,使得数据挖掘技术在电子商务领域的应用越来越广泛。本文着重阐述了WEB数据挖掘技术及其在电子商务领域中的应用。  相似文献   

16.
数据挖掘涉及多学科技术的集成,包括数据库技术、神经网络、模式识别、信息检索、图像与信号处理和空间数据分析等.神经网络在数据挖掘中的应用也越来越广泛,尽管神经网络具有结构复杂、网络训练时间长、结果表示不容易理解等缺陷,但其对噪声数据的高承受能力和低错误率的优点是其他方法所不及的,并在数据挖掘所采用的方法中具有优势.本文对基于BP神经网络的数据挖掘算法进行了详细的讨论,并提出了算法改进方法.  相似文献   

17.
关联规则挖掘是一种最有影响的数据挖掘技术。它在交易数据库或其他数据仓库项目集之中提取有意义的关联,频繁模式和关联。大多数现有的算法发现频繁模式都需要多次遍历数据库,导致大量的磁盘读取,造成了巨大的I/O负载。为了减少重复读盘,本文提出了一种新的自上而下的方法,即Apriori算法的改进版本,此算法大大降低了数据库的扫描次数,避免生成不必要的模式而减少了数据库的扫描,节省了大量的时间和空间。  相似文献   

18.
开源的R语言集成了多种数据分析与可视化算法,具备良好的可扩展性,适用于数据挖掘。本文通过描述R语言中Kmeans、Weka、IGRAPH、Holt-Winters 4种主要技术与算法,以及网站挖掘的应用实例介绍,突出R语言在海量数据的采集处理、分类、统计分析、预测、可视化等方面的优势。  相似文献   

19.
本文对入侵技术和聚类算法进行分析,明确相关技术在实践中存在的问题,在此基础上对变异因子进行分析,通过相关程序的计算,保证计算结果的准确性。然后把蚁群算法相关问题作为研究点,对蚁群算法的改进技术进行系统的探究。  相似文献   

20.
本文系统地论述了数据挖掘概念的内涵与其外延的发展、以及数据挖掘的基本技术和最新进展。全面而深入地介绍数据挖掘的应用,特别是在CRM中的应用,以及数据挖掘和CRM的发展前景。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号