首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
对Web日志挖掘数据预处理阶段的会话识别方法进行了探索,考虑了站点页面内容和结构的差异性以及访问者的个体差异性等因素,提出了一种采用以站点首页结合动态时间阀值的新会话识别方法。该方法以站点首页作为用户新会话开始标识,并引入了动态时间阀值的方法来确定用户会话的边界。实验结果表明,该方法能够识别出更多的真实用户会话,有效地提高了会话识别的准确率。  相似文献   

2.
对电子商务网站的用户访问模式挖掘中数据预处理阶段所采用的技术做了全面的研究,主要包括源数据的采集方法以及数据清理、用户识别、会话识别、事务识别、会话子序列生成等所采用的技术。并给出了框架网页过滤、识别搜索引擎Robot产生的访问记录,以及生成用户会话语义序列的方法。  相似文献   

3.
协作学习过程即会话的过程,会话中蕴含着丰富的信息。随着人工智能在教育中的融合应用,会话价值得以挖掘和体现,协作学习智能会话分析研究也日益受到关注,但目前研究尚未形成科学体系。基于此,文章首先对国内外协作学习智能会话分析文献及工具进行调研,梳理其相关研究;然后文章总结了智能会话分析的工具指向,包括会话文本的描述性统计分析、会话关系的社会网络分析、会话内容的主题及认知分析,并凝练了解决智能会话分析问题的三大关键技术——基于主题识别技术的学习质量监测、基于机器学习算法的会话机制探索、基于可视化技术的多维数据转换;最后文章提出了关注会话过程多模态数据、优化智能会话分析技术、建立人机协同会话分析模型、开发即时性分析工具四大发展路径,以期为协作学习智能会话分析研究提供参考。  相似文献   

4.
本文研究了如何从列表页面中抽取数据记录.系统分为两个阶段:第一步采用三种启发式方法相结合的方法,识别主数据区域的根节点;第二步将数据记录分离,提出了一种新的基于树编辑距离的聚类算法,来减少候选分割方案的数量,然后根据公式计算相似度,找出最佳分割方案.本文通过对大量不同领域的网页进行测试,结果表明本文方法具有较高的准确率.  相似文献   

5.
W eb日志的数据挖掘,可以发现用户访问页面的行为模式,改进W eb站点的性能和结构,提高查找信息的质量和效率.对W eb日志挖掘预处理的数据清洗、识别用户、识别用户会话和识别片断四个主要阶段所要完成的任务进行分析,论述了现有W eb日志预处理方法中的用户识别技术,提出了一种基于Cook ie技术和扩充日志属性的用户识别方法.  相似文献   

6.
为了解决大数据时代用户阅读时遇到的“信息过载”与“信息迷失”问题,提出了基于Hadoop平台的用户准确识别与新闻推荐算法。首先基于MAC地址识别用户,通过对用户浏览轨迹的离线和在线挖掘,建立用户兴趣模型。然后对新闻关键词进行聚类,结合协同过滤和启发式方法,基于关键词对用户进行新闻的智能推荐。实验结果表明,基于MAC地址的算法比基于IP地址的算法用户识别率提高了30%。  相似文献   

7.
学习者的协作会话数据是深入了解其学习过程和认知状态的一类重要数据。但由于自然语言的灵活性和学习情境的复杂性,协作会话数据分析的自动化程度一直不高,难以大规模应用。文章从人工智能视域出发,构建了基于人工智能技术的在线协作会话分析概念模型,对在线协作会话分析的理论基础、基本特征、分析流程和常用方法进行了论述,并进一步详细分析了“基于信息论的知识贡献测量”和“基于语义的协作会话学习投入自动分析”两个在线协作会话分析典型案例。案例证明了该模型能够将人工智能技术的“可计算”与教育研究的“可理解”相结合,为人工智能技术与协作会话分析融合搭建了桥梁,对在线协作会话分析实践具有重要的指导和参考价值。  相似文献   

8.
Web挖掘的预处理是生成用户模式和进行信息推荐的基础。文章研究了Web挖掘预处理的三个主要步骤:数据清洗、用户识别和会话识别,给出了各个步骤的关键算法,并提出了一种基于注册用户和Cookies技术、用户IP等综合因素来改进用户识别的算法。  相似文献   

9.
随着垃圾邮件传播手段的不断变化,传统基于内容的反垃圾邮件技术正面临着严峻挑战,本文提出了一种基于smtp会话控制的主动式垃圾邮件过滤技术.该技术通过分析垃圾邮件的通信会话过程中的特征信息,在MTA会话连接的不同阶段实现垃圾邮件的识别与拦截,并设计了一个垃圾邮件过滤网关并进行过滤实验.实验结果表明,提出的技术具有良好的识别效率和准确率.  相似文献   

10.
基于会话的推荐(SBR)是一项具有挑战性的任务,其目的是根据匿名行为序列推荐项目。本文提出了一种新的方法,称为联合对比学习的图神经网络会话推荐(CLGNN),在图注意力机制的基础上,用对比学习辅助训练,以获得更好的推荐结果。具体来说,CLGNN首先在会话图上采用注意力机制学习项目嵌入,然后聚合会话内的项目生成会话嵌入,最后使用会话嵌入和候选项目嵌入计算分数生成推荐,同时使用对比学习优化项目嵌入空间。以几种常见的评价指标为依据,在真实的两个数据集上进行实验,结果表明本文模型推荐性能良好。  相似文献   

11.
XML是基于Internet上一种新的数据管理手段,以其为基础的新一代WWW环境直接面对Web数据。XML在基于Web的数据挖掘中扮演着重要的角色,本文探讨了XML在Web的数据挖掘研究中进行数据抽取与转换所起作用。  相似文献   

12.
数据安全问题越来越受到重视,笔记本电脑、随身U盘以及使用越来越广泛的智能手机所带的存储卡,都存储了大量的个人隐私信息。一旦这些物品丢失,或者这些信息被窃取、篡改、破坏,后果将不堪设想。针对个人计算机数据安全的隐患,提出了一系列的防护措施,能够有效地保证个人重要数据的不丢失,个人敏感数据的不外泄。  相似文献   

13.
在不影响各个既有信息系统正常运行的情况下,实现各系统之间的数据同步,这已成为现实中解决多个业务系统之间的数据共享和协作的关键问题之一。文章在分析了国内外主要的数据同步方法之后,提出了利用数据缓存实现异构数据单向同步的设计方案,并在两个正在运行的业务系统中的ORACLE和SQL Server数据上实施了一个异构数据毫秒级的实时同步系统。  相似文献   

14.
支持数据抽取、转换、清晰、装载的工具集ETL对任何数据仓库工程都是一个必不可少的关键部件。结合应用重点探讨了ETL技术中的数据转换技术及数据质量问题。  相似文献   

15.
浅谈套录编目   总被引:2,自引:0,他引:2  
林丽娟 《南平师专学报》2005,24(2):81-82,93
本文论述了套录编目的优点,外来数据所存在的问题及其解决方法。  相似文献   

16.
阐述了在集成管理系统中数据库安全技术,从数据库安全整体规划到建立安全机制提出了实施技术方案,并着重解决了数据加密和解密的关键技术.  相似文献   

17.
在分析主流数据集成方法的基础上,结合我校数字化校园建设过程中的具体实践,提出了一种基于T-ETL的复合式数据集成方案,从而解决了各部门业务系统之间的数据互通问题。研究表明,该方案能保证数据的实时性,降低数据传输开销,消除数据交换中的性能瓶颈和安全隐患,提高了系统的整体性能。  相似文献   

18.
网络环境下文献资源的共知共建共享是未来的发展方向,要实现我国信息资源的交流与共享,书目数据的质量控制是关键。针对当前书目数据库建设的现状,提出在书目数据规范化建设的同时,制定统一的编目规则,培养高素质的专业人才,都是完善书目质量控制的有效措施。  相似文献   

19.
Product data management (PDM) is a unique technique that integrates and manages all applications, information and processes defining a product from design to manufacture, and to end-user support. However, exploration of valuable information and knowledge from the PDM system has become a key in improvement of efficiency and implementation of knowledge management in an enterprise. This paper introduces a data mining prototype system model based on PDM, and emphasizes some important techniques such as design of the prototype system framework, methods of data selection and integration of data mining prototype system and PDM. The model basically solves the problem of functional losses in mining and analyzing data in PDM. Application of data mining to PDM is meaningful to the ideas and techniques of PDM, and to the rapid development of data mining application itself. Also, it is useful in improving development and usage of enterprise databases.  相似文献   

20.
北京大学数据综合服务管理平台为学校电子校务建设数据整合提供了解决方案。随着电子校务建设的深入,数据综合服务管理平台显现出一些新的问题和挑战需要解决。该文对其中2个较为突出的问题进行描述,并且讨论解决方案。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号