共查询到20条相似文献,搜索用时 0 毫秒
1.
2.
基于词频的中文文本分类研究 总被引:3,自引:0,他引:3
本文对中文文本分类系统的设计和实现进行了阐述,对分类系统的系统结构、特征提取、训练算法、分类算法等进行了详细的介绍。将基于词频统计的方法应用于文本分类。并提出了一种基于汉语中单字词及二字词统计特性的中文文本分类方法,在无词表的情况下,通过统计构造单字和二字词表,对文本进行分类,并取得不错的效果。 相似文献
3.
基于词频统计的情报学研究泛化分析 总被引:2,自引:0,他引:2
以中国知网(CNKI)以及万方数据所提供的题录信息为统计数据源,运用文献计量学的词频分析方法,利用题录当中的关键词信息,分析近年来情报学研究的主要学科领域,进而分析情报学研究泛化问题.从统计的结果得出,情报学研究与信息科学、计算机科学以及网络研究的关系并不十分清晰明了,情报学研究向这些学科泛化的趋势依然不容忽视,对情报学体系的改进的研究依然是情报学学者的一项十分重要的工作. 相似文献
4.
5.
魏方 《大科技.科学之谜》2003,(4):46-47
在自然界中,昆虫不计其数,小动物随处可见,而大型动物特别是凶猛的肉食动物却数量稀少。这是为什么呢?原来,在漫长的自然选择的进化过程中,各种生物之间构成了一种金字塔型的食物链,金字塔底层的生物量极为丰富,而处于顶层的大型哺乳动物则数量极为稀少。食物金字塔 迄今为止,科学家们已经编制了150万种不同的生物目录,但是我们不知道的生物种类还有很多,据估计,现有的生物多达3000多万种,某些估计甚至高达1亿种。所有的生物都从其他生物那儿摄取能量,生物与生物之间构成了一张彼此交错、极为复杂的食物网。 在生物… 相似文献
6.
基于正态分布的词频分析法高频词阈值研究 总被引:3,自引:0,他引:3
词频分析法高频关键词或主题词的界定是开展信息分析的重要基础。首先,在文献统计分析的基础上,总结了目前词频分析法高频词确定的四种方法:TOPN方法、WF>=M方法、%WF=P方法以及T计算方法,这些方法存在着经验性、随意性、理论基础和适用性上的问题。接着,通过实证方法,验证了关键词和主题词在文献库中的分布符合正态分布,并根据正态分布的特性,提出了词频分析法高频词阈值的F计算方法。最后,在多个数据样本基础上,将F方法与T方法进行了对比分析,认为基于正态分布的高频词阈值F计算方法在理论基础和适用性上都能达到较好的效果。 相似文献
7.
本文介绍了对虾种群动态规律研究课题的立题、实施过程以及取得的效益,为探讨基础研究的规律提供了一个较好的案例。 相似文献
8.
9.
10.
11.
《内蒙古科技与经济》2016,(11)
在现有的《医学主题词表(MeSH)》中译本、《中国中医药学主题词表》中缺乏蒙医药科学方面的主题词,不利于蒙医药学文献的检索与利用。通过对已发表的蒙医药学文献中的关键词进行词频统计,按统计的结果筛选可用作修订主题词表时的蒙医药学相关主题词或入口词的备选词,结果共检索到1962年~2015年的蒙医药学文献7 299篇,获得关键词12 169个,经整理后蒙医药相关关键词1 303个,其中≥10次的蒙医药学相关关键词75个,可用作主题词或入口词的备选词55个。 相似文献
12.
13.
14.
基于词频分析法的国内教育技术学研究热点的研究 总被引:6,自引:0,他引:6
选取《电化教育研究》和《中国电化教育》为研究样本,摘取《电化教育研究》在2003-2007年间刊登的学术论文的关键词,以及《中国电化教育》在2007年刊登的学术论文的关键词,采用词频分析法,通过纵向与横向进行比较分析。结果表明:教育技术、信息技术、教育信息化、教学模式、教学设计、远程教育、网络教育、网络环境、网络教学、信息素养、整合、多媒体等关键词所表征的研究主题为近年来国内教育技术学研究的热点。 相似文献
15.
16.
17.
18.
《内蒙古科技与经济》2015,(8)
利用词频分析法对2005年~2014年我国高校网络舆情研究领域论文的关键词进行了统计,分析了近十年高校网络舆情研究的热点及阶段性成果,并对研究中存在的问题进行了探讨。 相似文献
19.
本文在已有研究基础上,以知识管理为视角,采用词频分析法对某大学团队十年间的科研发文进行统计分析,并通过聚类分析和战略坐标图对该团队研究所形成的主题领域及热点进行战略情报分析,旨在厘清该团队的研究领域及各研究主题领域的发展趋势,从而为团队知识库的构建及团队建设与发展提供决策帮助。 相似文献