排序方式: 共有37条查询结果,搜索用时 0 毫秒
1.
如何借助于有效的方法和途径在大量文献数据基础上对学科主题进行深入和精准的探测和跟踪,是以情报学科学计量领域为核心、不同学科共同致力突破的热点和前沿研究问题。相关方法和途径主要涉及频次视角、内容视角、引证视角以及融合视角等四个视角。本研究试图结合近年来发表于国际国内重要期刊有关学科主题探测和演化分析的最新文献,对相关视角的主要进展进行述评,归纳总结不同视角的实现路径和机制,指出已有视角可能存在的知识单元或者网络关系的异质重要性偏差问题、知识的时间衰变以及新兴主题特征的小样本弱势问题、主题自然发育和进化的拟合困境、微观层面的知识流动和变迁刻画问题等,特别地,为融合视角这一总体趋势指明方向。 相似文献
2.
本文旨在构架基金项目研究主题挖掘与动态演化分析的情报研究流程,通过对表征基金项目标题、摘要与学部的数据进行关联建模和挖掘,从项目内容层面上探究基金资助领域研究涉及的主题特点、范围侧重、发展方向及演化脉络。首先利用RAKE (rapid automatic keyword extraction)关键词抽取算法从基金数据中的标题和摘要中抽取关键词,通过术语切分等方式获得核心关键词;然后,采用Google的word2vec深度学习工具对核心关键词进行词向量建模,并使用k-means算法对生成的词向量进行聚类,挖掘相应的研究主题;进而对主题分布进行统计分析,且通过WMD (word mover’s distance)算法计算主题之间的相似度,以分析研究主题演化趋势,并识别出演化主路径。实证研究发现,以美国NSF (National Science Foundation)数据中AI (artificial intelligence)领域为例,所提方法流程能够识别出AI领域的多个主题,且能识别出不同学部的主题侧重;在发展过程中,研究主题演化呈现出大量分裂与融合的复杂态势,演化路径明晰,侧重点突出,... 相似文献
3.
一种基于多重哈希词典和K-最短路径算法的中文粗分词方案研究 总被引:1,自引:1,他引:0
本文在已有研究基础上,针对中文粗分词,设计了多重哈希词典结构,以提高分词的词典匹配效率,同时基于删除算法改进了中科院ICTCLAS分词系统的K-最短路径搜索思想.最后,论文对所研究技术方案进行了系统实现.系统实验结果表明,对于大规模文本,论文所提出的粗分词方案体现出了很好的性能. 相似文献
4.
在对文档聚类的含义、作用和一般过程的阐述基础上,分析一种基于“最小最大”原则初始质心优选的改进K-means聚类的基本思想,并重点设计相关的聚类算法,实现聚类系统,基于系统对300篇学术文档及其相关特征词语进行聚类实验。实验结果表明,本文所设计和实现的改进K-means的聚类算法表现出较好的性能。 相似文献
5.
6.
基于Ontology的个性化信息服务系统框架* 总被引:3,自引:0,他引:3
个性化信息服务是信息检索系统的发展趋势,强调对用户服务的针对性和服务特色。文章分析总结了典型的个性化服务模式、关键技术及其研究现状。在此基础上,提出了基于Ontology的个性化信息服务系统框架,对系统的结构和主要处理流程进行了探讨。 相似文献
7.
8.
9.
10.
【目的/意义】文本情感分类是近年来情报学领域的研究热点之一。已有研究大多关注针对目标文本的单
一情感分类。本文旨在探索基于深度学习的电商评论信息多刻面情感分类方法。【方法/过程】提出一种基于Atten⁃
tion-BiGRU-CNN的多刻面情感分类模型,通过BiGRU和CNN获取上下文信息和局部特征,利用Attention机制
优化隐层权重,以深度挖掘文本内隐语义和有效刻画多刻面情感。【结果/结论】在中文电商评论信息语料上的实验
表明,相较于其他神经网络模型,本文方法可有效提高多刻面情感分类的准确度。【创新/局限】进一步丰富多刻面
情感分类的方法途径,为深度挖掘电商评论信息以及优化产品和营销策略提供参考。本文语料主要基于单一类别
电商评论信息,聚焦可归纳刻面的情感分类,进一步的研究可面向类别多元化、需通过深度学习提取刻面信息的更
大规模语料展开。 相似文献