首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 203 毫秒
1.
[目的/意义]客观多属性学术评价方法应用较为广泛,但存在三大悖论,即方法创新悖论、方法选择悖论、方法应用悖论,本质上是其误差所致。[方法/过程]文章在对客观评价界定的基础上,分析了其误差类型,在此基础上,对误差的产生机制和应对措施进行了全方位的分析。[结果/结论]完全客观多属性学术评价方法是不存在的;客观多属性学术评价方法的误差主要是系统误差来自多个环节,包括指标选取、权重赋值、方法应用、结果处理等;应从多环节多视角解决客观多属性学术评价的误差问题;慎用最新的客观评价方法。文章提供了一套客观多属性学术评价误差的检查范式,有利于提高评价质量。  相似文献   

2.
基于改进特征提取及聚类的网络评论挖掘研究   总被引:1,自引:0,他引:1  
[目的/意义]针对信息过载条件下中文网络产品评论中特征提取性能低以及特征聚类中初始中心点的选取问题。[方法/过程]本研究提出采用基于权重的改进Apriori算法产生候选产品特征集合,再根据独立支持度、频繁项名词非特征规则及基于网络搜索引擎的PMI算法对候选产品特征集合进行过滤。并以基于HowNet的语义相似度和特征观点共现作为衡量产品特征之间关联程度的特征,提出一种改进K-means聚类算法对产品特征进行聚类。[结果/结论]实验结果表明,在特征提取阶段,查准率为69%,查全率为92.64%,综合值达到79.07%。在特征聚类阶段,本文提出的改进K-means算法相对传统算法具有更优的挖掘性能。  相似文献   

3.
基于碎片化UGC的知识元抽取研究   总被引:1,自引:0,他引:1  
[目的/意义]在大数据环境下,从海量的碎片化用户生成内容中抽取具有完整语义的知识单元。[方法/过程]文章提出一种基于碎片化UGC的知识元抽取方法,该方法首先借助BTM主题分割方法从UGC中抽取知识要素,而后基于融合TextRank和Glove词向量的K-means方法实现知识要素聚类,最后根据知识要素相关属性和知识要素聚类结果生成对应UGC知识元。[结果/结论]实验结果显示基于碎片化UGC的知识元抽取方法具有一定科学性和有效性。  相似文献   

4.
[目的/意义]研究“睡美人”文献的识别方法,对尽早发现重要科技成就及其发明人、加快科技成果转化以及完善学术评价方法等均具有重要意义。[方法/过程]针对高校学术论文成果评价这一特定场景,提出“先客观指标粗筛、后多维参数细选”的研究思路,组合使用K值算法和三指标法,对东北大学发表于Web of Science核心合集的论文样本集进行了“睡美人”文献挖掘的实证研究。[结果/结论]该方法共识别出12篇“睡美人”文献,并对其被引特征、期刊特征、睡眠特征、内容特征等因素进行了分析。实获数据处理结果表明了该方法的有效性,相关研究方法和结果可对东北大学学术论文评价提供重要参考。  相似文献   

5.
旨在利用K-means与神经网络组合模型来解决客户潜在价值与客户分类问题。在已有的CRM理论的基础上选择针对性较强的客户潜在价值指标,包括客观属性指标和行为习惯指标。构建组合模型来分析某数码网店的客户数据,利用K-means法对客观属性进行初步聚类,在每个初类内部进行自组织竞争神经网络的训练和预测,从而细分聚类结果。最后评价聚类结果的特征,对数码电商客户关系管理提出建议。  相似文献   

6.
[目的/意义]旨在为促进国内二手房市场健康持续发展提供参考。[方法/过程]以我国一二三线城市共20370条二手房交易数据为样本,利用数据挖掘方法将政策与市场相结合进行研究,采用Python2.7进行词云和K-means聚类分析,利用SPSS Clementine进行关联分析。[结果/结论]宏观政策下我国二手房交易市场总体健康,自住需求大,但旅游城市房价居高。提出加强旅游城市的土地监管与房价调控;构建房屋核心价值评价指标;二手房购房相关税采用累进税率等对策建议。  相似文献   

7.
[目的/意义]为弥补现有作者影响力评价指标缺乏内容信息的不足,发现不同研究主题下高影响力的作者,文章给出一种基于主题内容的作者影响力评价方法。[方法/过程]以情报学领域近5年核心期刊的文献为样本,首先利用CTM模型提取样本文献的主题,获得文献作者对不同主题的贡献值;再利用K-means算法对样本文献分类,由此将文献对应的作者划分到特定主题类别下;然后,将作者在某特定主题类别的贡献值与作者发表文献的平均被引频次相结合,设计特定主题类别下作者影响力指标(Author Influence Index in Specific Topic,AII-ST);最后,根据AII-ST值对作者进行影响力排序。[结果/结论]本研究在方法上,通过CTM模型与K-means算法的结合实现了K-means算法初始聚类中心与聚类数目的双重优化;在应用中,作者评价指标AII-ST值能有效限定作者的比较范围,较好地反映作者的研究方向;新指标评价视角新颖、评价结果可靠。  相似文献   

8.
一种基于聚类的云计算任务调度算法   总被引:1,自引:0,他引:1  
任务调度是云计算中的一个关键问题.针对 Min-Min 算法负载不平衡的缺点,引入 K-means 聚类,提出一种基于 K-means 聚类和 Min-Min 的云计算任务调度的新算法.该算法采用 K-means 聚类方法依据任务长度对任务聚类进行预处理,然后根据 Min-Min 算法的机制进行任务调度.仿真结果表明,该算法具有较好的负载均衡性和系统性能.  相似文献   

9.
文章通过分析传统的空间聚类算法以及新发展的聚类分析方法,最终选K-means算法进行研究。基于Hadoop平台,采用HDFS(分布式文件系统)存储数据,结合MapReduce编程模式,对K-means算法进行设计以及编程实现,最后实现了该算法在Hadoop平台上的并行化。通过实验,验证了K-means算法部署在Hadoop集群上并行化运行,在处理空间数据时,该算法有效地减少了时间复杂度,大大提高了实施效率和结果的准确性。  相似文献   

10.
汪衔石 《情报杂志》2021,40(4):50-56
[目的/意义]风险评估是国家情报工作的重要内容。通过对西印度洋非传统安全展开风险、困境及对策研究,对"21世纪海上丝绸之路"倡议在该地区推进过程中的风险评估和预警有着十分重要的意义。[方法/过程]首先对西印度洋海上非传统安全进行分类,在此基础上对地区非传统安全治理在国家、区域和国际社会三个层面存在的治理困境进行论述,分析其治理动能缺失的原因,最后对中国参与该地区的治理提供路径选择和建议。[结果/结论]在该地区,中国首先应该建立西印度洋情报研究中心,其次要以现有机制为基础深度参与地区海上治理并发挥主导作用,最后要长期不懈为地区提供护航、维和等区域公共产品。  相似文献   

11.
黄敏  吕娇 《情报探索》2022,(1):115-119
[目的/意义]旨在提高我国公共图书馆文化服务效率,为公共图书馆文化服务发展提供参考。[方法/过程]以我国31个省份公共图书馆为数据,运用DEA-BCC模型和K-means聚类分析我国各区域文化服务的效率及差异。[结果/结论]我国公共图书馆文化服务效率整体较低,呈非均衡性,存在不同程度投入冗余和产出不足,最后针对我国公共图书馆文化服务提出相应的改进建议。  相似文献   

12.
[目的/意义]旨在为地区反恐工作提供参考.[方法/过程]以全球恐怖主义数据库(GTD)为基础,对2015—2019年全球恐怖主义发展趋势进行分析,并运用GM(1,1)模型对东南亚和撒哈拉以南非洲地区未来几年的恐怖活动态势进行预测分析.[结果/结论]反恐工作效果显著,预测未来几年东南亚和撒哈拉以南非洲地区的恐怖活动次数将...  相似文献   

13.
[目的/意义]有效的风险评估有赖于对风险信息的准确分析,“信息为中心”的情报分析方法在一定程度上不利于信息的知识整合,因此可以采用“分析为中心”的情报方法提升风险决策的科学性。[方法/过程]在回顾反思“信息为中心”的情报分析方法基本过程与特征的基础上,解释“分析为中心”情报分析方法的机制与优势,探讨这种分析方法在恐怖主义风险评估中的应用价值。[结果/结论]“分析为中心”的情报分析有利于对来自不同领域的风险信息进行综合研判,并能够在协同分析中消弭认知偏见,保证风险评估的科学性与风险决策的有效性。但其具体效用仍需要在实践中加以检验。  相似文献   

14.
李勇男 《现代情报》2018,38(12):65-69
[目的/意义]对反恐情报中的时空轨迹数据进行伴随模式挖掘,可以发现涉恐群体的同时间段动态空间位置移动规律。[方法/过程]根据反恐情报数据的特点,修改经典伴随模式挖掘方法中的相似度度量方式和聚类方式,不断迭代完成"聚类和取交集"操作,将满足条件的涉恐活动时空轨迹伴随模式导出。[结果/结论]该方法能够挖掘涉恐群体的同步移动路径,定位重点活动地点,分析涉恐人员之间的亲近度,为打击暴恐活动提供数据参考。  相似文献   

15.
[目的/意义]通过实验分析不同特征提取算法对新闻文本聚类效果的影响。[方法/过程]选取搜狗实验室的搜狐新闻语料库以及澳大利亚广播公司2003-2017年间的新闻标题语料库,对TF-IDF、Word2vec以及Doc2vec三种单一特征,TF-IDF+Word2vec、TF-IDF+Doc2vec、Word2vec+Doc2vec以及TF-IDF+Word2vec+Doc2vec四种组合特征在K-means、凝聚以及DBSCAN算法上分别进行聚类分析,通过Purity以及NMI两个评测指标对聚类效果进行评价。[结果/结论]单类特征中三个特征的聚类质量呈Word2vec> TF-IDF> Doc2vec关系;组合特征中TF-IDF+Word2vec的效果最优。Word2vec在单一特征中的表现最优,其也是不同组合特征间差异的主要因素,特征组合是否可以提升聚类性能需基于多因素进行综合判定。  相似文献   

16.
文奕  陈文杰  张鑫  杨宁  赵爽 《现代情报》2018,38(4):112-117
[目的/意义]专利信息是人类科学技术进步的结晶,随着社会的发展,专利信息将为促进科技创新发挥日益重要的作用。利用聚类技术可以将海量专利信息进行自动分类,在实现信息有序归并管理的同时,有助于用户高效而全面的获取相关技术领域中的集成专利信息,具有重要的现实意义,传统聚类研究方法效率与准确度存在不足。[方法/过程]本文通过对专利信息服务网站(中国科学院知识产权网)访问日志数据的清洗与分析,生成专利信息点击序列,基于深度学习词嵌入模型,设计了PatentFreq2Vec模型,计算得出专利关联信息。[结果/结论]利用PatentFreq2Vec模型分析计算访问日志数据,能够得到关联专利信息,实现专利聚类,且聚类准确度高于传统方法。  相似文献   

17.
刘爱琴  安婷 《现代情报》2019,39(8):52-58
[目的/意义]面向非相关文献的知识关联能够促进新知识的产生,为科学研究提供了一种有效的辅助手段。[方法/过程]本文以《中国分类主题词表》为主题词受控词表,首先对文献摘要进行中文分词处理并提取主题词,利用计量分析技术和聚类技术分析文献间特征的相似、相异水平,然后基于该系统为用户检索并利用用TOP-K算法反馈用户精确结果。[结果/结论]设计了面向非相关文献的知识关联检索系统,从更细的粒度层面揭示文献之间的知识关联,为用户提供高质量的服务。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号