首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 67 毫秒
1.
基于机器学习的自动文本分类模型研究   总被引:2,自引:0,他引:2  
基于机器学习的方法是自动文本分类中非常重要的一大类方法。本文先给出了形式化的定义,提出了自动文本分类的流程模型,然后选取了支持向量机(Support Vector Machine,SVM)算法作为一个典型例子进行分析,最后作者通过一个中文文本分类实验评价了该算法的效果。  相似文献   

2.
一种混合文本分类方法研究   总被引:1,自引:0,他引:1  
文本自动分类是信息检索领域的一个重要研究方向。一些标准的机器学习算法像支持向量机已经成功地运用到了这一领域。不幸的是高维的输入向量严重的影响了分类速度,而支持向量机核函数参数的确定影响到分类的精度。为了提高分类精度和分类速度,本文提出了一种混合分类算法,首先用粗糙集理论对向量进行约简,然后采用基因算法对支持向量机的核函数参数进行优化。实验证明我们提出的算法是有效的。  相似文献   

3.
提出了将支持向量机应用于文本自动分类的研究,与常用的K-最邻近法相比,无论是对训练数据集还是测试数据集均具有一定的优势,而且不同特征选择方法对支持向量机的影响要比K-最邻近法小。此外,从研究中的不同特征选择的评价函数来看,它们对分类有一定的影响,应用X2统计进行特征选择的分类正确率最高,其次是文本证据权,而期望交叉熵的效果最差,说明特征选择在文本自动分类中也是相当重要的。  相似文献   

4.
支持向量机在文本自动分类中的应用研究   总被引:3,自引:0,他引:3  
田晓宇  梁静国 《情报学报》2006,25(2):208-214
针对数据挖掘中的文本自动分类问题,提出了一种基于支持向量机的分类方法。构造了可用于多个模式类识别的多层级连式SVM模型,该模型可完成对多个模式的分类识别。根据训练样本的分类体系完成对模型的构造之后,即可应用于实际文档的自动分类。文中给出了该模型的构造及应用的方法,用两种核函数作为内积回旋方案,以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性。  相似文献   

5.
一个中文文本自动分类数学模型   总被引:9,自引:1,他引:8  
本文提出了一种根据汉字统计特性和基于实例映射的中文文本自动分类模型。该模型采用汉字字频向量作为文本的表示方法。它的显著特点是引入线性最小二乘方拟合(LinearLeastSquareFit,LLSF)技术建立文本分类器模型,通过对训练集语料的手工分类标引以及对文本和类别间的相关性判定的学习,实现了基于全局最小错误率的汉字———类别两个向量空间的映射函数,并用该函数对测试文本进行分类。  相似文献   

6.
本文分析了传统定标比超方法的思想和缺陷,提出将传统情报分析方法与智能分析技术相结合,构建了融合文本自动分类的竞争情报定标比超分析模型。本文提出构建定标比超内容层次指标体系,将其作为文本自动分类的分类体系。两种方法相辅相成、相互优化,实现竞争情报的良性循环型、科学的智能分析。进而,深入研究了该模型的功能任务和情报分析过程与算法。最后,从科学性、时效性、全面性、准确性和动态性方面对该模型进行了性能评价。  相似文献   

7.
用词上下文向量来表达文本集内一个词语与其他词语之间的上下文关系,并在词上下文向量的基础上生成分类器中所有类别的类别特征向量,以及待分类文本的特征向量,最后由分类器给出待分类文本的所属类别。实验显示,在类别特征向量和文本向量中融入词语上下文关系有助于改善文本分类效果。  相似文献   

8.
陈彬  董尹  宋继伟 《图书情报工作》2012,56(24):49-54,64
在分析当前竞争情报系统信息采集模块的智能性不足的基础上,提出在竞争情报系统的设计方案中引入一种关键情报课题(KITs)模型,将用户的目标与情报需求用KITs来反映,并通过将KITs转换为关键情报问题(KIQs),进而转换成通过用户评估的KIT-KIQs信息采集指标体系,使系统能将采集到的信息自动分类到该体系下,从而提高竞争情报系统信息采集的智能性和精准性。最后,以电网公司为例具体阐述该模型在信息采集中的运用。  相似文献   

9.
对1999-2008年国内支持向量机文本分类研究论文,从来源数据库、发表时间、期刊分布等方面进行文献计量分析,按主题简要介绍该领域理论研究和应用研究两个层次的主要成果,对这些成果从内容和研究方法上进行评述,指出SVM文本分类的不足,对研究中存在的问题进行分析总结,使读者全面对该领域研究情况认识,以期促进该领域进一步的深入发展。  相似文献   

10.
停用词表对中文文本情感分类的影响   总被引:4,自引:2,他引:4  
王素格  魏英杰 《情报学报》2008,27(2):175-179
本文利用三种特征选择方法、两种权重计算方法、五种停用词表以及支持向量机分类器对汽车语料的文本情感类别进行了研究.实验结果表明,不同特征选择方法、权重计算以及停用词表,对文本情感分类的影响也不尽相同;除形容词、动词和副词外的其余词语作为停用词表以及不使用停用词表对情感分类作用较大,得到的分类结果比较好;总体上,采用信息增益和布尔型权重进行中文文本情感分类的效果较好.  相似文献   

11.
竞争情报服务系统与企业竞争战略、竞争需求、竞争环境形成一种内在的铁三角关系。企业竞争情报服务系统包括情报规划、情报采集、情报加工、情报服务和评估反馈五大功能模块。认为企业构建竞争情报服务系统必须正确认识CIS在竞争情报服务系统中的作用,必须充分考虑自身的实际情况,竞争情报工作人员必须全程参与竞争情报服务系统的业务环节。  相似文献   

12.
供应链环境竞争情报系统构建研究   总被引:1,自引:0,他引:1  
确定供应链环境下竞争情报的定义及其构成,识别竞争情报关键信息,包括:竞争环境信息、供应市场信息、需求市场信息、协作伙伴能力、核心企业能力与竞争策略、企业间协同信息,构建以制造企业为核心的竞争情报集成管理系统功能模块和基于SOA的集成管理系统结构,并以具体案例进行说明,为构建符合当前竞争环境的竞争情报体系提供借鉴。  相似文献   

13.
论述随着网络的发展,舆情对企业的影响越来越大,舆情监控子系统成为企业竞争情报系统不可或缺的一部分。结合为企业研发竞争情报系统中舆情子系统的设计经验,分析当前企业网络舆情的特点,分析企业竞争情报系统框架内通用的企业舆情子系统的功能结构,提出解析企业舆情监控需要解决的关键技术,并提出企业舆情监控的工作流程。  相似文献   

14.
中小企业由于受到人才、技术、资本等资源限制,在技术创新过程中经常产生信息不对称,情报获取困难等问题,所以难以形成核心技术与核心竞争力。文章首先对中小企业技术创新需求进行分析,然后结合湖南省新材料产业的发展情况,构建了新材料产业数据库,为新材料的中小企业提供决策支持。特色数据库建设与竞争情报服务体系在示范应用中获取了较好的社会效益,为科技情报机构服务中小企业提供了方法借鉴。  相似文献   

15.
雷炳旭  朱江  姜恩波 《图书情报工作》2015,59(2):118-122,88
[目的/意义]鉴于开放资源建设实践面临困境,将众包引入开放会议资源服务系统(简称"系统"),以提高其开放会议资源建设效率。[方法/过程]采用经验总结法分析"系统"现有资源建设模式的不足,结合实际,从基于众包的资源建设工作流程、众包平台开发与功能设计、系统功能与服务完善3方面构建开放会议资源众包建设模式。[结果/结论]资源众包建设模式能增加系统所需的人力、智力资源,提高资源建设效率,实现丰富系统开放会议资源、获得更多使用的建设目的。开放会议资源建设众包模式能提高"系统"的工作效率,可为其他图书馆的开放会议资源建设借鉴和参考。  相似文献   

16.
为让全区城乡群众充分享受优质的图书馆文献资源服务,平桥区政府先行先试,按照公共图书馆总分馆制的建设模式,初步建成了惠及千家万户的新型农村公共文化服务体系,效益显著。总结探究平桥区图书馆总分馆服务体系建设成效、运行经验等,为其他地区乡镇图书馆建设提供借鉴和参考。  相似文献   

17.
文章探讨了广东省立中山图书馆采分编智能作业系统,对该系统的三个阶段进行剖析说明,着重对项目的现状、未来发展进行思考,并结合业务工作实际提出若干改进建议。  相似文献   

18.
在加快建设高水平本科教育的背景下,高校图书馆应该如何顺势而为,山东师范大学图书馆对此进行了有益探索,初步构建了本科教育教学服务体系,较好地发挥了支撑保障作用。  相似文献   

19.
[目的/意义] 结合公安行业领域知识服务的实践,探讨知识链视角下的嵌入式知识服务体系,尝试在依赖嵌入式知识服务平台之"傻瓜式"工具的基础上,改变行业领域一线人员的实务操作习惯,增强知识管理领域以及情报分析领域之学科情报服务人员的职业自信与职业价值。[方法/过程] 从知识资源链和人力资源链角度,分析知识链视角下面向公安行业领域的嵌入式知识服务的构成框架及知识服务内容,通过知识获取、知识整理、知识重组、知识分析、知识关联、知识咨询等环环紧扣的知识链条,将知识资源优势转化为决策优势与情报竞争优势,从而提出知识仓储嵌入服务、知识挖掘嵌入服务、知识决策嵌入服务之"融入一线,嵌入过程"的知识服务模式。[结果/结论] 面向行业领域的嵌入式知识服务突破了图书馆学服务领域和服务范围的瓶颈,针对行业图书馆、学科专业信息服务机构及科研决策部门依托"傻瓜式"平台开展贯穿行业领域实务操作全过程的嵌入式知识服务进行了新的尝试与探索。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号