首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
围绕文本聚类中的文本表示和相似度计算两个基本的问题,对目前学界提出的文本表示方法和相似度计算方法进行了分类和较为全面的综述,将文本表示模型分为向量空间模型、语言模型、后缀树模型、本体等,相似度计算方法分为基于向量空间模型的相似度计算,基于短语的相似度计算方法和基于本体的相似度计算方法。  相似文献   

2.
LDA模型在专利文本分类中的应用   总被引:1,自引:0,他引:1  
对传统专利文本自动分类方法中,使用向量空间模型文本表示方法存在的问题,提出一种基于LDA模型专利文本分类方法。该方法利用LDA主题模型对专利文本语料库建模,提取专利文本的文档-主题和主题-特征词矩阵,达到降维目的和提取文档间的语义联系,引入类的类-主题矩阵,为类进行主题语义拓展,使用主题相似度构造层次分类,小类采用KNN分类方法。实验结果:与基于向量空间文本表示模型的KNN专利文本分类方法对比,此方法能够获得更高的分类评估指数。  相似文献   

3.
叶佳鑫  熊回香  孟璇 《情报科学》2023,41(1):166-173
【目的/意义】通过深度学习方法对图书评论进行细粒度挖掘,并基于挖掘结果优化图书间相似度计算结果。【方法/过程】首先从在线书评网站上采集图书评论,对评论进行词性分析构建属性词表,随后基于属性词表对评论进行类型标注,通过BERT-BiLSTM模型对标注数据进行学习以实现评论自动分类,最后通过BERT对分类后的评论进行向量表示,通过余弦相似度计算评论间的相似度以表征图书相似度。【结果/结论】本文构造的BERT-BiLSTM评论分类模型准确率、召回率和F1值分别达到0.922、0.921和0.921,可以较好地实现评论分类。通过模型将评论划分为文笔、人物、情节、概要、读者态度5种类型来计算图书间相似度可以得到较为契合的相似度结果。【创新/局限】相较于其他类型的评论,通过人物与情节类评论计算图书相似度的效果有待提高。以后可对这两类评论进行更为细粒度的分析。  相似文献   

4.
工程类科技项目可以划分为基础研究项目、应用研究项目、技术开发项目、软科学项目4种,构建4种项目的指标评价体系,对其绩效情况进行评估。引入适合于"少数据、贫信息"情形的灰色系统理论,提出基于中心点混合正弦可能度函数的灰色聚类评估模型,采用较为光滑的正弦可能度函数,克服原有基于三角可能度函数的部分缺点。以某工程类科技基础研究项目中某天然气开发关键技术研究项目为例,运用该评估模型进行实证研究,结果表明该方法切实可行,所评估项目属于中绩效灰类的概率为51.88%。  相似文献   

5.
文章提出了一种基于本体和设计情景的产品设计领域知识问答系统解决方案,利用本体表示产品设计知识库,提出了基于问句语义特征匹配的问题分类算法以及本体查询转换技术,并充分考虑问句中带有设计情景的复杂问题,提出情景相似度和问句相似度综合加权的设计情景问题相似度算法,最后设计实现了身管设计知识问答系统,并对实验结果进行分析验证方案的可行性。  相似文献   

6.
[目的/意义]旨在为跨语言文本聚类研究提供参考。[方法/过程]首先,通过分句及计算每个句子的语义特征值确定文档的特征句集并进行文档向量表示;其次,将词旋转距离(Word Rotator’s Distance,WRD)的思路引入相似度计算步骤中,提出语义特征句向量距离(Semantic Feature Sentence Vectors’ Distance, SFSVD)相似度计算方法,获得不同文档间的相似度;最后,利用HAC聚类算法获得文本聚类的结果。[结果/结论]提出的汉语-俄语跨语言文本聚类方法对比现有方法,其Purity值和NMI值显著提升且表现稳定。基于语义特征句和SFSVD相似度计算方法能够较准确地表示文本信息,从而进一步提升汉语-俄语跨语言文本聚类的性能。  相似文献   

7.
一种基于主题和分众分类的信息检索优化方法   总被引:1,自引:0,他引:1  
本文针对目前搜索引擎存在的检索结果缺乏组织导致检准率不高的问题,提出一种基于主题和分众分类的信息检索优化方法.首先对用户检索主题进行获取和表达,然后以社会标签为聚类项,采用向量空间模型实现基于分众分类的文档主题聚类,并将检索结果按相似度和标签"受欢迎度"复合排序,达到提高检索准确率和优化检索的效果.  相似文献   

8.
高新技术项目开发优化度评价方法研究   总被引:1,自引:0,他引:1  
黄西川 《科研管理》1994,15(3):45-52
本文对建立高新技术项目开发优化度评价指标体系的指导思想、分类评价原则、指标体系结构等问题进行了研究,提出了高新技术项目开发优化度评价指标体系和评价模型.  相似文献   

9.
本文提出了利用后缀树模抽的最大相似度优先聚类方法,通过构造文档集的广义后缀树模型抽取短语作为特征项并映射到M维向量空间模型;计算文档间的相似度矩阵,对任意两个文档之间的相似度进行降序排列,优先合并具备最大相似度的文档对形成初始聚类;合并初始聚类得到最终聚类结果。  相似文献   

10.
针对向量空间模型中语义缺失问题,将语义词典(知网)应用到文本分类的过程中以提高文本分类的准确度。对于中文文本中的一词多义现象,提出改进的词汇语义相似度计算方法,通过词义排歧选取义项进行词语的相似度计算,将相似度大于阈值的词语进行聚类,对文本特征向量进行降维,给出基于语义的文本分类算法,并对该算法进行实验分析。结果表明,该算法可有效提高中文文本分类效果。  相似文献   

11.
从项目管理的角度出发,综合考虑用户选择偏好、项目与专家的知识匹配度、项目间的相似性以及专家的历史表现等因素,融合基于内容特征、潜在主题特征、协同过滤和用户选择偏好等评审专家推荐算法,构建一种改进的组合策略的评审专家推荐算法,并通过设计实验,利用航天项目进行实验研究,结果分析表明推荐算法是可行且实用的。  相似文献   

12.
本文首先归纳了科技项目的分类,阐述了绩效评价的基本原则,通过分析科技项目绩效评价逻辑模型,从提高结果可靠性的角度来对绩效评价方法进行研究,归结为如何设计能够很好体现科技项目从计划、投入、活动到产出全过程的逻辑关系的评价框架体系,重点对框架体系中的两个重要内容工作手册的制定和指标体系的设计进行了理论研究,并对指标体系设计配以承担的省重大科技项目绩效评价工作为实证。通过研究,以构建既符合公共支出绩效评价的一般原则,又适应科技项目的特点和科技管理的要求,具有一般科技项目通用性的绩效评价框架体系,提供科技项目绩效评价有效、实用、可靠方法。  相似文献   

13.
提出基于集成学习的项目绩效预测方法,利用多分类集成监督学习算法,对网络爬虫得到的已结题项目数据中隐含的关于项目绩效的信息进行有效挖掘,形成项目绩效预测模型.基于国家自然科学基金项目数据,利用多种指标对模型的性能进行评估,将模型对项目的绩效预测结果与专家的评估结果进行比较,结果显示模型的有效性.  相似文献   

14.
针对气候变化专项,本文从绩效评估角度进行了项目分类依据的研究,设计了与绩效评估相匹配的气候变化专项投入产出表,筛选出定性与定量相结合的评估指标,依据气候变化专项研究类项目的项目特征,从项目执行的有效性、项目成本的经济性和项目产出的效益性三个维度,建立以科技投入产出比为核心指标的绩效评价指标体系,包括指标的量化、指标的赋权和评分计算方法。基于投入产出数据的关系和评估指标的权重,建立气候变化专项科研绩效评估计算模型。通过对2005-2013年153个气候变化专项的评估,测试了评估指标和评估的方法,结果证实指标体系合理有效,评估结果可靠。  相似文献   

15.
鉴于目前我国的代表性成果评价制度处于研究和探索阶段,缺乏具有推广基础的示范应用,为促进代表作评价方法和工具创新,更加科学、准确、客观地开展科研成果代表作评价,分析国内外科研项目评价研究与实践现状以及代表作评价的内涵和特点,设计提出基于客观数据和定量方法支持的医学科研项目代表性成果评价方法,并选取20个科研项目的代表作进行实证分析,依次分级计算投入和产出指标数据,并利用数据包络分析模型进行效率分析。研究结果显示,利用科学计量和数据包络分析方法综合计算得到的科研项目代表性成果的量化分析结果,可在一定程度上反映学术成果的质量和影响力,可作为专家定性评价的参考和依据。最后,在强调代表作形式的多样性、提倡代表作评价方式的多元性和利用新的方法和技术改进传统评价方法等方面作出思考并提出建议,为我国代表作评价制度的建设和完善提供参考。  相似文献   

16.
20世纪中叶以来,大型科技工程的实施和中国政府对科学界的动员,促使传统的科学权威向大型工程的管理权威转变,形成了一条"总工程师模式"的科技创新路径①,即"提出科研项目的战略咨询建议"——"汇聚科技研究与开发资源"——"以工程管理职位主导工程运行"——"以工程实现提升科学威望"的四步路径。这一模式的合理性,体现为它是高龄科学家扬长避短的合理创新方式,通过以总工程师角色主持科研工程,科学家的综合能力素质也得以提升;这一模式局限性体现为挤压了基础研究人员的自主空间并挫伤其积极性,同时可能造成总工程师"赢家通吃"的状况。  相似文献   

17.
科研项目选择的0-1目标规划模型   总被引:5,自引:0,他引:5  
本文论述了科研项目选择问题的重要性,对常用的科研项目选择方法进行了述评。为克服常用方法的缺陷即无力解决具有资源约束的、多目标相互冲突且计量单位不可比的科研项目选择问题,本文提出了基于资源分配的科研项目选择的0—1目标规划模型。最后,对模型进行了测试运行,并对运行结果给出了详细的经济学解释。  相似文献   

18.
张洪  宋达娥  王鑫鑫 《科研管理》2022,43(7):171-180
   我国进入经济转型机遇期以来,一种新兴的互联网金融模式—众筹,给初创企业及个人创业者提供了全新的营销方式和筹资渠道。众筹融资绩效不仅是创新项目发起人关注的核心问题,也是众筹平台兴衰的决定因素。本文基于创新扩散理论,对众筹项目特征进行理论抽象,构建创新项目融资绩效的影响机制模型,实证分析相对优势、兼容性和可观察性创新特征对众筹项目融资绩效的影响,并探讨项目状态和发起人信息披露在此影响机制中的调节效应。研究结果表明:众筹项目的相对优势和兼容性特征均正向影响众筹项目融资绩效;项目状态和发起人信息披露均正向调节相对优势与项目融资绩效的关系,而负向调节可观察性与项目融资绩效的关系;仅发起人信息披露负向调节兼容性与项目融资绩效的关系。  相似文献   

19.
方曦  尤宇  何华  刘云 《科技管理研究》2022,42(2):162-171
针对我国国家科技重大专项(以下简称"重大专项")知识产权育成管理工作中存在的相对主观、规范性较弱等问题,基于重大专项知识产权育成流程分析,探索构建重大专项知识产权育成管理评价指标体系。首先对重大专项知识产权育成管理概念进行界定;其次综合前人研究,在分析重大专项项目立项、实施、验收及后评估阶段工作任务的基础上,从上述4个维度设计共包含29个指标的评价指标体系,结合MATLAB和SPSS数据分析软件,利用群组决策方程根法和Pearson相关性检验对关键指标进行筛选,得出评价的重点方向。并以某卫星型号项目为例,构建卫星型号重大专项知识产权育成全过程管理评价指标体系,验证所提出评价指标体系构建方法的可行性,为其他重大专项知识产权育成管理评价指标体系的构建提供参考借鉴。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号