共查询到10条相似文献,搜索用时 15 毫秒
1.
2.
走进文本 走出文本——陈善“读书出入法”新解 总被引:1,自引:0,他引:1
一、知入知出——文本阅读的大法
(一)文本——“有字书”的统称
何谓“文本”?汉文指文字作品,英文指text,国外有“文本学”。从传播媒体看,“文本”包括纸本文和电子文;从言语结构看,“文本”包括“文篇”和“书本”;从作品体裁看,“文本”可大别为“文章”和“文学”。 相似文献
3.
4.
5.
文本挖掘及其在信息检索中的应用 总被引:3,自引:0,他引:3
文本挖掘是指利用数据挖掘技术,从大量的文本数据中提取感兴趣的、潜在的有 用模式和隐藏的信息。文章详细阐述了文本挖掘系统的组成、过程及相关技术,并介绍了文本 挖掘在信息检索中的应用。 相似文献
6.
7.
社会化媒体时代的媒介文本(或类媒介文本)大体有两种,一种是由专业性的传媒机构生产出的文本;另一种是由以微博为代表的自媒体平台生产的文本。前者可称为"完成文本",后者可称为"未完成文本"。社会化媒体时代,事实链条不完整、不清晰,或仅涉及问题表象的"未完成文本"易使人们的心理和认知过程产生偏差的影响是显而易见的。因此,将"未完成文本"转换为"完成文本"就成为当今时代的重要命题。 相似文献
8.
文本分类是文本挖掘的基础和核心。构建一个分类准确而且稳定的文本分类器是文本分类的关键,很多学者提出了不同的文本分类器模型和算法。在现有的分类器评估方法中,关心的只是分类准确率,而对稳定性这个重要的评价标准却没有涉及。本文提出使用开放测试和封闭测试的准确性指标的比值作为衡量文本分类器稳定性的评估标准。通过文献数据验证以及在所建构的贝叶斯分类器实验平台MBNC上进行的检验表明,用这种标准评价文本分类器具有其合理性。 相似文献
9.
基于图结构的中文文本表示方法研究 总被引:2,自引:0,他引:2
为解决基于统计的文本表示模型的信息缺失问题,本文提出了一种考虑词间语义和语序信息的基于图结构的中文文本表示方法,其思想是将文本的特征项表示成图结构中的节点,特征项间的关系表示成节点间的有向边,据此可将文本表示成由节点和有向边组成的图结构,并且将边赋予权重信息,该模型较大程度地保留了原文本的结构信息及语义信息.中文语料测试结果表明,基于图结构的文本表示方法对复杂文本语料的分类问题十分有效.对于简短文本语料,本文提出扩展特征项共现单元的修正方法,提高了图结构中文文本表示方法的普遍适用性. 相似文献
10.
本文依据KNN分类算法和反馈学习的思想,在分析中文文本分类过程的基础上,给出了基于反馈学习的中文文本分类模型和基于KNN的中文文本分类反馈学习过程。通过实验研究了反馈学习对中文文本分类模型性能的影响。结果表明,反馈学习是实时变化信息的一种有效的学习方法,它对训练不充分的文本分类器具有很大的改善作用。 相似文献