首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
毛雪岷  丁友明 《情报杂志》2007,26(11):56-58
文本分类是中文信息处理的热点研究内容,而语义是文本类别归属的依据。提出一种基于语义引导的特征选择方法,在特征选择的同时,对典型类别区分词进行加权,提高该类词在分类中的作用;采用支持向量机技术进行试验,实验表明建立语义知识库的特征选择改善了文本的分类性能。  相似文献   

2.
针对科研论文往往具有统一的结构,将词项的位置信息考虑在内,给出一种新的词项特征加权方法.利用AdaBoosting分类算法进行实验,结果表明该方法在准确率、查全率和F-Measure方面都具有更好的文本分类性能.  相似文献   

3.
随着网络技术的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.常采用向量空间模型来表示文本,将文本看作特征空间的一个向量,使用TF·IDF方法对特征加权.但是这种加权方法简单地认为文本频数少的单词就重要,文本频数多的单词就不重要,使它不可能很好地反映单词的有用程度,从而导致分类准确率下降.针对TF·IDF方法存在的问题,提出了一种基于特征基尼指数的特征加权方法TF·GINI.实验结果显示,这种加权方法具有很好的分类性能.  相似文献   

4.
提出了一种特征选择和特征抽取相结合的特征降维方法.首先使用改进的k-means聚类算法对特征进行选择,然后使用SVD方法在基于语义层面上对特征空间进行压缩,试验结果表明,这种特征降维模式在文本分类的准确性方面效果较好.  相似文献   

5.
巫桂梅 《科技通报》2012,28(7):148-151
研究文本快速准确分类的问题。同一词语在不同的语言环境下或者由不同的人使用可能代表不同的含义,这些词语在文本分类中的描述特征却极为相似。传统的文本分类方法是将文本表示成向量空间模型,向量空间模型只是从词语的出现频率角度构造,当文中出现一些多义词和同义词时就会出现分类延时明显准确性不高等特点。为此提出一种基于语义索引的文本主题匹配方法。将文本进行关键词的抽取后构造文档-词语矩阵,SVD分解后通过优化平衡的方法进行矩阵降维与相似度的计算,克服传统方法的弊端。实践证明,这种方法能大幅度降低同义词与多义词对文本分类时的影响,使文本按主题匹配分类时准确高效,实验效果明显提高。  相似文献   

6.
马思丹  刘东苏 《情报科学》2019,37(11):38-42
【目的/意义】利用词向量的优点,提出一种加权Word2vec的文本分类方法,以期在文本分类时获得较高的 分类效果。【方法/过程】首先对文本进行词向量训练,通过设置词语相似度阈值,将文本关键词划分为重叠部分和非 重叠部分,随后分别计算两部分加权相似度值,再采用参数化线性加权方式计算文本相似度,最后采用KNN进行 分类。【结果/结论】实验结果表明文中提出的加权Word2vec方法比TF-IDF传统文本分类模型和均值Word2vec模 型的分类效果有所提升,是一种有效的文本分类方法。  相似文献   

7.
张小艳  宋丽平 《现代情报》2009,29(3):131-133
文本分类技术在信息过滤和信息检索中有着重要应用。文本表示技术是文本分类中的首要任务,特征选择技术又是文本表示中的杖心技术.对分类效果起着至关重要的作用。本文介绍了文本表示和特征选择技术的发展,并在详细分析目前各种文本表示和特征选择的方法和技术特点基础上,比较了各种方法的适用性和优缺点.最后总结出了文本表示和特征选择技术研究的方向和目标。  相似文献   

8.
文章利用文本挖掘技术抽取技术主题和规范化主题,为技术主题分析提供基础工作.根据技术主题在专利标题中的分布特点和技术主题分析时主题词的统计长度特征,提出一种主题度计算方法,将主题度较大的词作为主题词;通过计算相似度获得主题词的同义词对,借助统计特征对主题词规范化表示.实验结果表明,文章提出的主题词抽取方法是有效的,实验准确率为95.5%,召回率为95.5%;同时文章提出的主题规范化方法具有较大的意义.  相似文献   

9.
董健 《科技通报》2014,(4):71-73
传统的文本信息处理方法无法表征文本内特征,所以不适用于模糊特征的提取分类提出一种高特征参差性下强收敛性文本的信息处理技术,对文本间和文本内的特征同时进行提取,采用迭代控制的TFIDF对特征进行加权值的计算,最后采用22类文本进行性能测试,结果显示,迭代控制的TFIDF算法能够更加细致地对文本进行分类,对特征进行提取,并且算法收敛速度快,稳定性好,具有很好的应用价值。  相似文献   

10.
李建军  宋志章 《科技通报》2012,28(6):152-154
网页文本特征数常高达上万个,无用和冗余特征相当多,为提高网页文本分类精度,提出一种混合智能算法的网页文本分类方法。首先采用遗传算法对网页文本特征初步选择,然后采用蚁群算法对初步选择特征进行精细选择,最后采用K近邻算法建立文本分类器。结果表明,混合智能算法很好消除无用和冗余特征,提高了网页文本分类的精度,加快分类速度。  相似文献   

11.
基于土拱效应的筒仓土压力研究   总被引:1,自引:0,他引:1  
蒋波  应宏伟  谢康和 《科技通报》2005,21(5):624-627,632
对筒仓小主应力拱形状进行了理论分析,发现墙土摩擦角部分发挥时的小主应力拱形状较充分发挥时平缓。根据土拱形状的理论分析计算平均竖向应力,由此得到了对应不同内摩擦角和墙土摩擦角的侧土压力系数,以及筒仓侧土压力的理论公式。  相似文献   

12.
薛捷 《科学学研究》2016,(7):1111-1120
设计作为技术和市场之外的第三种创新驱动力已开始得到越来越多的研究重视,但从顾客感知的视角来探讨产品设计如何对渐进性创新和根本性创新产生影响的经验研究尚不多见。基于"产品设计→顾客感知质量→顾客购买意愿和口碑传播"的理论模型,通过针对渐进性创新和根本性创新分别展开调查研究,实证分析结果显示设计驱动力的美学维度和功能维度对于渐进性创新和根本性创新的顾客感知与行为的影响并不一致,对渐进性创新来说,设计的美学维度和功能维度除了对于顾客购买意愿和口碑传播具有直接的正向影响,还通过顾客感知质量对其产生间接作用;对于根本性创新来说,设计的美学维度和功能维度均要完全通过顾客感知质量来间接作用于顾客购买意愿和口碑传播。此外,设计驱动力的象征意义维度对于渐进性创新和根本性创新的顾客感知与行为的影响具有一致性,即设计的象征意义维度对于两种创新类型的顾客购买意愿和口碑传播均有着直接的正向影响,但对于顾客感知质量的影响都不显著。  相似文献   

13.
14.
对文献计量学研究的一些看法   总被引:7,自引:0,他引:7  
1文献计量学目前的状态 文献计量学存在着定义多、模型多、争论多的问题,总的说来,对文献计量学是什么,研究什么,还存在分歧,突出表现在以下3个方面.  相似文献   

15.
尹春华  周西平 《情报科学》2005,23(4):568-572
复杂科学的研究是当代科学研究的重要领域,尤其是复杂适应系统的研究更为人们所关注。本文首先论述了复杂系统的几个重要特征:开放性、复杂性、层次性及复杂适应系统的七个基本点,然后从其中的几个方面探讨了internet所呈现出的复杂适应系统特征;从而说明了internet是一个复杂适应系统。该系统所呈现的特征将为进一步研究其他复杂适应系统提供理论依据。  相似文献   

16.
本文利用网民和网站作为互联网发展的衡量指标,通过面板数据分析了影响互联网发展的因素,认为居民文化程度、电脑拥有量、信息化水平是影响互联网发展的主要因素。经济发展水平、居民收入对互联网没有影响,我国互联网正处于高速成长期。  相似文献   

17.
教学资源共享、信息交流、网上教学和远程教育是21世纪教育所呈现的新特点。网络教育不断发展的今天,在课程教学中如何利用网络这一媒体手段来促进教师教学和学生学习的双赢显得尤为重要。主要从为什么要建设课程资源管理平台,课程资源管理平台的研究内容、系统功能设计与分析,以及研究课程资源管理平台的意义等几个方面对艺术设计专业课程资源管理平台的设计与开发进行了研究。  相似文献   

18.
基于领域工程的人力资源管理系统研究   总被引:1,自引:0,他引:1  
针对目前企业人力资源管理系统可重构性差、与企业资源计划软件集成的灵活性差等不足,在领域工程理论指导下,通过分析人力资源管理系统开发过程,建立了基于领域工程的开发模式。结合统一建模语言与领域构件的优点,提出了基于统一建模语言的领域构件的建模方法。  相似文献   

19.
评析历年来创新联盟记分牌(IUS)及其指标体系的演化,对IUS2015中欧盟与全球主要竞争对手的创新绩效及其差距进行研究,发现我国公共部门的研发投入亟须加强,而专利创造和运用、创新合作及劳动者受教育程度虽然严重薄弱,但其增长潜力很大。最后,探索IUS对"新常态"下我国创新能力指标体系的构建及创新型国家建设方向的启示。  相似文献   

20.
基于XML的数据交换探讨   总被引:1,自引:0,他引:1  
作为数据表示和交换的工业标准,XML的应用日益广泛。本文论述了XML及XML的相关标准,对基于XML的数据交换实现原理进行了重点分析,并采用Java编程技术提供了简单的实例加以说明。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号