首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
文本挖掘探析   总被引:2,自引:0,他引:2  
文本挖掘是信息挖掘的一个研究分支,用于基于文本信息的知识发现,文本挖掘主要处理半结构化、无结构化和字符型数据,首先介绍了文本挖掘的概念,然后分析了文本挖掘的处理过程和关键技术,最后对文本挖掘进行了展望。  相似文献   

2.
乔良 《教育技术导刊》2009,8(4):160-161
文本挖掘是一个对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过程,已经成为数据挖掘中一个日益流行而重要的研究领域。给出了文本挖掘的定义和框架,对文本挖掘中预处理、文本摘要、文本分类、聚类、关联分析及可视化技术进行了详尽的分析,并归纳了最新的研究进展,指出了文本挖掘在信息检索中的作用。  相似文献   

3.
在多点数据监测系统中,为了将各区域服务器的数据有效整合,对海量数据的有效采集和处理成为必须解决的关键问题。文章通过引入Web文本挖掘原理和数据抽取方法,将网页列表页的抽取算法应用到多点数据采集,并构建了相应的多监测点数据采集体系。通过对多监测点海洋数据的处理实例表明,基于网页列表页的抽取算法有效地抽取到了准确数据项,解决了嵌套数据记录、自动抽取和多台计算机协同工作问题,提高了数据采集效率。  相似文献   

4.
在网络环境中文本挖掘的过程主要包括特征提取、特征选择、挖掘方法选择、结果评价和知识模块等几个部分;最新的发展方向是基于EM算法对文本进行挖掘,基于该算法的的比较挖掘模型为:首先对已知数据集任意分为几个类,然后根据各个类集和背景集对文档集的各个词进行似然,再通过求和可以得到整个数据集的似然,该过程反复进行,直到收敛,从而可以根据各类和背景集结果中的较大的概率值得出文本的共同主题和各个类的主题。  相似文献   

5.
6.
随着远程教育研究的不断开展,对远程教育领域学术论文的研究,即远程教育元研究,也日渐显示出其必要性和可行性,一些学者如张伟远、殷丙山等人于不同时期开展了远程教育元研究。然而,由张伟远和殷丙山所开展的两项研究中均未对得出各项统计数据的方法做出详细的描述。为了改善远程教育元研究中数据统计的效率,本研究将引入面向文本的智能处理技术,如信息提取、新词识别、文本分类等,设计并开发对文献文本进行元数据信息提取、新术语识别、文献分类等处理的一套方案,让计算机程序帮助研究者自动完成一些任务。经检验,本研究所提出的文献文本处理方案是有效的,术语识别查全率在70%左右,文献分类准确率也在85%左右,能够满足快速获得一些统计数据的要求。  相似文献   

7.
文本分类是文本数据挖掘领域的重要技术之一。从分类算法对文本语义信息的利用程度这一角度出发,将文本分类划分为基于词形的算法和基于语义的算法两类,对每类算法进行了描述,并对当今文本数据的多样性及文本分类算法改进的可选方向进行了研究。  相似文献   

8.
讨论电子商务环境中数据挖掘技术在网站管理分析中的应用。将网络挖掘技术和电子商务进行融合,用一个顾客行为类型的应用挖掘案例为背景,诠释了在数据处理和整合的过程中,不同的数据挖掘算法都要有选择地针对不同的应用而采纳。  相似文献   

9.
小学语文教材中蕴含了许多可以激发想象的素材,如何进行充分挖掘,培养学生的想象能力,是当前教学研究的内容之一。本文在这方面作了有益的尝试与探索。  相似文献   

10.
总结了数据挖掘的基本方法、文本数据挖掘的关键技术,讨论了文本挖掘的定义和文本分类的一些形式,并对文本数据的数据挖掘算法进行了研究。  相似文献   

11.
阅读是语言输入的重要途径,写作则是语言输出 的一种方式。针对目前初中英语教学中读后续写无法进一步 深度拓展的现象,以一节公开课为例,阐述了在初中英语教学 中对读后续写的实践和思考。教师在教学中应将内容、思维、语言三者融合在一起,最终提升学生的续写能力。  相似文献   

12.
介绍web挖掘的技术基础,阐述了Web挖掘的含义,从Web数据中发现潜在的有用信息和先前不知道的知识。描述了web挖掘的现状、分类以及web挖掘技术的流程,并对web挖掘的前景加以展望。  相似文献   

13.
介绍web挖掘的技术基础,阐述了web挖掘的含义,从web数据中发现潜在的有用信息和先前不知道的知识.描述了web挖掘的现状、分类以及web挖掘技术的流程,并对web挖掘的前景加以展望.  相似文献   

14.
如何在数量巨大的Internet中快速准确的搜索到符合要求的Web页是一个值得探讨的重要课题.构造了一种能够准确区分Web文本之间亲和力的挖掘模型,运用人工免疫算法使该模型具有较高的聚类精度和自发现能力.实验结果表明,该模型不仅能够有效的进行文本内容挖掘,保持较低的错误肯定率和错误否定率,还具有很强的自适应性和更新能力,进行适当的参数设置后检测周期也随之大幅缩短,提高了挖掘模型的效率.该模型的提出为Web挖掘领域提供了一种新的研究思路.  相似文献   

15.
陈凯  夏晶  陈悦 《中学教育》2019,16(3):25-38
STEM教育政策的研究有助于一线教学工作者反思当前现状,有助于教育研究者发现STEM的发展问题。为探寻《中国STEM教育白皮书》的关注热点以及不同国家对STEM教育关注重点的异同,本研究采用文本挖掘技术,利用NLPIR工具对《中国STEM教育白皮书》进行文本挖掘。研究发现:STEM教育需要中小学和高校、企业及科研单位的合作;应着眼于多学科整合的思维培养;但面临着专业师资匮乏等问题。  相似文献   

16.
“文本”一词来源于英文text,后来通常用来指由书写所固定下来的任何话语。文本是有“文眼”的,是文本中的密码。教师在教学时,要善于解读并挖掘出文本深处的内涵,破译“文本密码”,让孩子们在英语课堂的学习中也能时刻感受到情感的熏陶与教育。《义务教育英语课程标准(2011年版)》中更是把情感目标放在了首位,  相似文献   

17.
语文学习要经历一个枯燥而又艰难的过程,对于一个初中生而言,虽有优美的语言却有些许不懂,虽有独到的见解却又有许多不解。这时,就需要老师的正确指引,通过挖掘文本,采用兴趣教学,引领学生走进文学的殿堂,领会文字所带来的奥秘。  相似文献   

18.
正高效的语文课堂教学的立足点在于构建一个师生互动合作交流的平台,当师生通过这个平台进行交往互动而实现有效探究时,语文教学将会达到以文本解读为基础、以问题探究为向导、以提高能力为抓手的教学目标。在这样的语文教学活动中,教师能够深入研读文本,引领学生品味语言文字,开拓学生的思维,提升语文素养。笔者认为,在高效的语文课堂  相似文献   

19.
为了应对信息社会数据急剧增长,获得用户感兴趣或有益的数据,必须对数据进行处理,数据挖掘技术就是应这种需要而发展的.数据挖掘要取得有用数据,必须对数据进行种分类、聚类和关联三种不同的任务处理.对于文本信息的分类是数据挖掘的一个主要应用,而决策树算法利用自身优势和分类效率,在文本处理中有巨大的应用前景,尤其是J48算法应用与文本信息的分类有广泛的应用价值.  相似文献   

20.
为了应对信息社会数据急剧增长,获得用户感兴趣或有益的数据,必须对数据进行处理,数据挖掘技术就是应这种需要而发展的.数据挖掘要取得有用数据,必须对数据进行种分类、聚类和关联三种不同的任务处理.对于文本信息的分类是数据挖掘的一个主要应用,而决策树算法利用自身优势和分类效率,在文本处理中有巨大的应用前景,尤其是J48算法应用与文本信息的分类有广泛的应用价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号