共查询到20条相似文献,搜索用时 31 毫秒
1.
文本挖掘与中文文本挖掘模型研究 总被引:5,自引:0,他引:5
文本挖掘,又称为文本数据挖掘或文本知识发现,是指在大规模的文本中发现隐含的、以前未知的、潜在有用的模式的过程。本文首先对文本挖掘进行了概述,给出了文本挖掘的定义、特点和研究现状。然后对国内中文文本挖掘的研究现状进行了分析,指出了当前中文文本挖掘研究中存在的主要问题和主要研究方向。最后提出了一个统一的中文文本挖掘模型——UCTMF。该模型具有层次性、开放性和可扩展性,为中文文本挖掘系统提供了基本体系框架。 相似文献
2.
本文从阅读教学的本体意义出发,结合新课程背景下对阅读教学的基本要求,论及教师、学生与文本三者之间如何确立一种合理的认识论框架。并从现今阅读教育中所存在的问题出发,探讨师生文本互读模式。 相似文献
3.
由于以因特网为主体的信息高速公路的不断普及和发展,一方面,因特网上蕴涵的海量信息远远超过人们的想象;另一方面,面对信息的汪洋大海,于是一个极富挑战性的课题:如何帮助人们有效地选择和利用所感兴趣的信息,尽量剔除不好的信息,同时保证人们在信息选择方面的个人隐私权利,成为学术界和企业界所关注的焦点。 相似文献
4.
通过对英语语言中文学文本和法律文本比较分析,归纳总结出文学文本和非文学文本之间存在的差异,从而对英语语言的学习和使用提供指导。 相似文献
5.
在课堂教学中,教师如何深化文本,合理拓展教材,提高课堂实效,是一个值得探讨的话题。本文以《"西亚病夫"的崛起》一课为例,谈谈如何才能创造性地使用教材,挖掘教材留出的空间。 相似文献
6.
阅读理解能力是英语学习者的一项重要技能,对于如何提高学习者的阅读能力,学者们研究的也比较多。文章就针对英语文本特征如何提高学生的阅读理解能力这一课题进行研究,希望能对英语阅读教学起到一定的作用。 相似文献
7.
8.
9.
研究了中文文本分类中的文本表示方法,提出了对中文文本表示因素的分析框架,并通过对3个数据集实验结果的分析,确定了各种文本表示因素对分类效果的影响.直接使用汉字进行划分也可以获得较好的分类效果;简单的不使用很大词库的分词和使用大词库的分词,以及复杂的分词对分类效果影响不大;仅使用01表示特征是否出现也可以获得比较好的分类效果;采用综合了合理的向量取值(如使用合适的归一化算法)可以较大幅度地提高分类准确率等.这些结论为后续的应用提供了指导原则. 相似文献
10.
在语文教学中,有些文本解读方式不恰当,影响了教学目标达成。作为文章解读的“首席”,语文教师要深入分析问题,正确解读文本,不断提高阅读教学水平和教学效率。文章通过案例,论述了机械运用“通用规则”、主观化的演绎发挥、脱离本位的非语文教学这三种不恰当的初中语文文本解读方式。 相似文献
11.
吴琳 《科学技术与辩证法》2007,24(3):29-31
当我们把解释学中的文本概念纳入到自然科学领域中,文本的内涵与外延就相应发生了变化:一切科学实践活动都直接以科学文本为对象。科学文本一方面内在地蕴涵着科学的语境,另一方面外在地承载着丰富的科学思想,从而表现出自身的三个本质特征:系统性、确定性和历史性。既然我们打开了科学文本向我们呈现的世界,在此基础上,文章进一步探讨居于书面语言另一边的私人世界是如何解读科学文本的意义的。 相似文献
12.
13.
文本内容新颖性探测研究综述 总被引:2,自引:0,他引:2
如何为用户提供及时有用的新颖信息是一个亟待解决的研究内容。试图对文本内容新颖性探测的研究方法做一个梳理,从文本内容新颖性探测的研究起源、应用于这一研究的文本表示方法、相似性对比的方法以及内容新颖性探测过程等方面进行分析,以期对文本内容新颖性探测的研究有一个较全面的把握。 相似文献
14.
基于模糊向量空间的文本分类方法 总被引:1,自引:0,他引:1
本文针对文本自动分类问题,提出了一种基于模糊向量空间模型和径向基函数网络的分类方法。网络由输入层、隐层和输出层组成。输入层完成分类样本的输入,隐层提取输入样本所隐含的模式特征,将分类结果在输出层表现出来。该方法在特征提取时充分考虑了特征项在文档中的位置信息,构造出模糊特征向量,使自动分类更接近手工分类方法。以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性。 相似文献
15.
阅读教学是学生、教师、文本三方对话的过程,并且,学生与文本的对话是基础。为了保证学生是阅读的主体,教师必须激发学生的阅读兴趣、保证学生充分的阅读时间和思考空间、培养学生的问题意识、提供质疑的契机。 相似文献
16.
17.
文章基于语料库检索软件AntConc,自建小型教材课文文本语料库和四级阅读文本语料库,详细论述如何利用语料库软件和自建语料库,创新英语教学方法,使大学英语课堂教学内容能更好地提高学生的英语学习效率和四级通过率。 相似文献
18.
[研究目的]随着国内智库的不断发展和建设,智库成果越来越多,涉及领域也纷繁复杂。为了方便决策者对所关注问题的查找,以及对问题类型的判断,需要对智库研究成果资源进行有效的数字化管理,本研究旨在研究如何对智库文本成果资源进行有效分类,从而实现智库成果高效系统的数据化管理。[研究方法]针对智库文本成果多为长文本的特点,利用基于Self-Attention的层次结构文本分类模型SHTC(Hierarchical structure model based on self-attention)依次从词、句两个层面对文本语义进行学习,并使用多尺寸卷积层提取关键特征信息获得最终的文档表示,再通过Softmax层进行分类。[研究结论]结果表明,基于Self-Attention的层次结构模型SHTC在智库文本分类任务中准确率达到82.43%,在智库文本分类任务上具有更优的分类效果。 相似文献
19.
20.
由于部分教师对课程理念理解的偏差,致使课堂上出现了不少误读文本的现象。本文对一些文本误读现象进行了分析,尝试从抓文眼、抓情节、抓细节、抓背景等方面探求文本解读的方法,以提高师生文本解读的实效性。 相似文献