共查询到20条相似文献,搜索用时 167 毫秒
1.
基于Web的数据挖掘技术 总被引:1,自引:0,他引:1
Web数据挖掘有很多研究热点,其中关联规则挖掘是Web数据挖掘领域研究的一个重要方面.本文首先对数据挖掘、Web数据挖掘和Web数据预处理等相关知识进行了阐述;然后研究了关联规则基本理论及关联规则经典算法;最后为了解决现实数据库中每个项目的分配不均匀性和重要性差异,重点研究了加权关联规则挖掘算法. 相似文献
2.
数据挖掘定义为是从存放在数据库、数据仓库或其他信息库中的大量数据中挖掘有趣知识的过程。对数据挖掘的基本特点与流程和电子商务中Web数据挖掘与数据源进行了分析,并对数据挖掘技术在电子商务领域的应用进行了研究探讨。 相似文献
3.
随着大数据信息技术的发展,数据在线监测和数据挖掘成为计算机信息领域研究的热点。通过对Web热点数据分割挖掘,提高信息热点追踪和Web数据分类能力。传统算法采用非结构化数据挖掘算法,无法有效对Web热点数据进行准确定位和分层挖掘。提出一种基于半结构化分割的Web热点数据挖掘算法。采用半结构化数据进行特征分割,基于优秀基因位进行差分进化,使寻优曲线不断趋于平缓,在多个节点上并行的运行比较脚本,采用半结构化分割,使得Web热点特征挖掘实现自适应寻优,得到Web热点数据的分配因子,提高了挖掘性能。仿真结果表明,该算法获得了良好的效率和精度,提高了Web热点数据挖掘的自适应寻优能力。 相似文献
4.
数据挖掘的隐私保护研究 总被引:1,自引:0,他引:1
随着数据量的增大,数据挖掘技术应用不断扩大,如何在挖掘过程中不泄露私有信息或敏感知识,同时能得到比较准确的挖掘效果,已经成为数据挖掘研究中的一个热点课题。文章从数据分布的角度结合挖掘算法对目前几种关键的隐私保护方法进行了介绍、分析,给出算法的评估,最后分析总结了数据挖掘隐私保护未来的研究方向。 相似文献
5.
为全面了解国际图书情报学数据挖掘领域的研究热点和前沿趋势,以Web of Science数据库收录的2007-2016年数据领域的文献数据为研究对象,通过CiteSpace软件,结合文献计量学和可视化方法,从年度分布、期刊分布、研究力量分布、重要文献、研究热点以及前沿等方面进行分析。研究发现,国际数据挖掘研究出现了网络与计算机技术、数据挖掘方法、数据挖掘与管理、数据挖掘与应用四大聚类。研究前沿探测出3个发展时期,每个时期的热点都有特色。根据上述研究绘制该领域知识图谱,对国际数据挖掘的研究现状和发展趋势进行分析和总结,为我国数据挖掘研究提供参考。 相似文献
6.
在Internet浪潮的冲击下,人们面临着数据爆炸的挑战;随着数据挖掘(Data Mining,DM)技术的迅速发展及数据库管理技术的广泛应用,人们积累的数据越来越多,如何从浩如烟海的数据中找到内在的规律,如何更方便地传递、交流、获取有用的信息,挖掘这些激增数据背后隐藏的重要信息已成为当前高科技领域研究的热点。Web挖掘(Web Mining),是将传统的数据挖掘同Web结合起来的技术,从广义上解释就是通过数据挖掘技术来分析与网站相关的资料。就WEB数据挖掘的一些特点、过程以及方法进行探讨。 相似文献
7.
8.
在Intemet浪潮的冲击下,人们面临着数据爆炸的挑战;随着数据挖掘(Data Mining,DM)技术的迅速发展及数据库管理技术的广泛应用.人们积累的数据越来越多,如何从浩如烟海的数据中找到内在的规律,如何更方便地传递、交流、获取有用的信息,挖掘这些激增数据背后隐藏的重要信息已成为当前高科技领域研究的热点。Web挖掘(Web Mining),是将传统的数据挖掘同Web结合起来的技术,从广义上解释就是通过数据挖掘技术来分析与网站相关的资料。就WEB数据挖掘的一些特点、过程以及方法进行探讨。 相似文献
9.
10.
浅谈数据挖掘技术及其研究现状 总被引:1,自引:0,他引:1
本文首先介绍了数据挖掘的概念、过程与系统构成,其次从数据挖掘的研究方法和应用角度论述了数据挖掘的研究现状,其中着重论述了目前的热点研究方向——Web挖掘的流程与分类。 相似文献
11.
在文本自动分类中,目前有词频和文档频率统计这两种概率估算方法,采用的估算方法恰当与否会直接影响特征抽取的质量与分类的准确度。本文采用K最近邻算法实现中文文本分类器,在中文平衡与非平衡两种训练语料下进行了训练与分类实验,实验数据表明使用非平衡语料语料时,可以采用基于词频的概率估算方法,使用平衡语料语料时,采用基于文档频率的概率估算方法,能够有效地提取高质量的文本特征,从而提高分类的准确度。 相似文献
12.
13.
组织记忆外部知识搜寻与新产品创新性 《科学学研究》2022,40(8):1462-1471
基于知识基础观,分别研究了陈述性记忆、程序性记忆与新产品创新性之间的关系,以及互补型搜寻和辅助型搜寻的中介作用。利用276家企业调研数据进行实证研究,结果表明:陈述性记忆和程序性记忆均正向影响新产品创新性,也均对互补型搜寻和辅助型搜寻产生正向影响。同时,陈述性记忆对互补型搜寻的正向作用强于辅助型搜寻,程序性记忆对辅助型搜寻的正向作用强于互补型搜寻。进一步地,互补型搜寻在陈述性记忆和新产品创新性间起中介作用,辅助型搜寻在程序性记忆和新产品创新性间起中介作用。 相似文献
14.
15.
《Information processing & management》2023,60(3):103271
Because of the rapid increase of data in the cloud of Amazon Web Service (AWS), the traditional methods for analyzing this data are not good and inappropriate, so unconventional methods of analysis have been proposed by many data scientists such as concurrent/ parallel techniques to meeting the requirements of performance and scalability entailed in such big data analyses. In this paper we are used Hadoop Map Reduce system that contains Hadoop Distributed File System (HDFS) and Hadoop cluster. We optimized it by combining it with five efficient Data Mining (DM) algorithms such as Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF), Correlative Naïve Bayes classifier (CNB), and Fuzzy CNB (FCNB) for strong analytics of cloud big data. The proposed system applied on product review data that taken form the cloud of AWS. The Evaluation of Hadoop Map Reduce done with important benchmarks as Mean Absolute Percentage Error (MPAE), Root Mean Square Error (RMSE), and runtime for word count, sort, inverted index. Also, the evaluation of DM models with Hadoop Map Reduce system done by using accuracy, sensitivity, specificity, memory, and running time. Experiments have shown that FCNB is effective in addressing the problem of big data. 相似文献
16.
17.
[目的/意义]关键词是反映期刊研究主题、研究方法和数据源等信息的重要途径。本文尝试通过论文关键词来研究学术期刊的相似度,为期刊分类等学术研究和实际工作提供参考。[方法/过程]首先,在相关文献梳理的基础上,提出了基于论文关键词的两种期刊相似度计算方法。然后,以《中国图书馆学报》和《情报学报》为实证对象,从CSSCI采集了两种期刊1998-2017年的关键词数据。最后,计算了两种期刊的相似度,并分析了两种期刊论文的共现关键词。[结论]研究发现,两种期刊的相似度有一定波动,但整体上呈现为一个下降趋势。这反映出两种期刊上发表的论文的相似性在不断下降,而差异性在不断增加。 相似文献
18.
该文以烟台大学核工程与核技术专业为例,针对目前就读该专业的调剂学生对专业认知存在偏差的问题,在专业认知教育前移、创新教育方式、丰富教育载体、加强保障等领域探索了加强偏冷门专业的专业认知教育途径,涵盖了大学生志愿服务、社会实践、互联网、全员育人等多个方面的内容。 相似文献
19.
20.
以文献研究为基础,对技术标准联盟以及另外两类极易与其混淆的联盟形式——RD联盟和专利联盟——进行了比较分析,旨在揭示技术标准联盟的本质、根本特征、典型问题以及适合的研究模式。研究提出,技术标准联盟的本质是一种联盟组合,是往往同时涵盖技术研制与技术产业化两项功能的多组织联合体,一定程度上可以理解为是以RD联盟和专利联盟为基础的联盟组合,因此,技术标准联盟与传统的RD联盟和专利联盟既具有关联,但同时也存在差异。在进一步识别以上三种联盟的共性问题以及可以共享的研究模式之后,论文提出还需要从联盟组合/联盟网络角度来探索契合于技术标准联盟的专有研究模式。 相似文献