首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 483 毫秒
1.
徐路路  王芳 《情报科学》2019,37(8):22-28
【目的/意义】识别科学研究前沿主题,预测未来发展趋势。【方法/过程】首先利用主题概率模型识别出论文、 专利及基金项目多源数据中的科学前沿主题;考虑研究前沿主题演化的复杂性和非线性的特点,利用机器学习算 法和支持向量机模型预测主题发展趋势,并采用改进后的粒子群算法对模型参数进行优化,以提高传统支持向量 机模型在处理非线性、小样本等数据上的预测准确度。【结果/结论】实验对比发现,本方法对于研究前沿主题的预测 准确度较高,准确识别出石墨烯领域未来发展趋势。  相似文献   

2.
[目的/意义]识别学科交叉前沿主题并预测其发展趋势,有助于了解学科内部结构,挖掘领域重点部署方向,为未来创新性、突破性研究提供参考。[方法/过程]以美国国家自然科学基金项目及其产出论文分别作为前端、后端数据,首先,从三个维度测度项目学科交叉度,遴选领域学科交叉项目;其次,从主题关注度、新颖度等方面构建研究前沿主题识别指标体系,对学科交叉主题进行二次遴选,满足阈值的即为学科交叉前沿主题;再次,对比时间序列分析模型ARIMA和LSTM主题拟合效果并选择误差最小模型对学科交叉前沿主题进行趋势预测分析;最后,以生物科学领域为例对方法的有效性和可行性进行实例验证。[结果/结论]生物科学领域在纳米生物学技术、全球变化和海洋环境生物学、生物信息学及壶菌病与两栖动物多样性方面有较好发展前景。经专家咨询和已有研究对比分析,该方法可有效识别领域学科交叉前沿主题,并对其未来研究趋势走向有一定参考借鉴。  相似文献   

3.
【 目的/意义】为探析研究前沿与发展趋向,突破现有跨学科科研协作研究在主题识别预测中的不足,本文提 出跨学科科研协作新兴主题识别及预测研究框架,实现新兴主题识别及未来发展趋势预测。【方法/过程】以时间切 片的形式对 SciTS 会议文本进行主题抽取,提出新兴主题测量指标,探测领域内新兴主题并构建新兴主题时间序 列;而后分别采取BP神经网络和SVR两种经典机器学习算法对新兴主题未来三年发展趋势进行预测分析。【结果/ 结论】根据历史数据对跨学科科研协作新兴主题进行识别及预测有较好的效果,在识别出的五个新兴主题中,跨学 科交流与对话、跨学科协作社区搭建、跨学科教育与培训等主题未来发展状态将趋热。【创新/局限】选取美国SciTS 会议文本为典型案例展开探索性分析,丰富当前跨学科科研协作研究内容的层次性和多样性。  相似文献   

4.
王婧  武帅 《情报探索》2024,(2):1-11
[目的/意义]现有学科研究主题的梳理多为领域专家的定性分析和学科学者的文献梳理,一定程度会由于研究思维的局限性和获取知识的片面性造成学科研究主题误判,为有效避免漏判误判现象的发生,提出识别模型。[方法/过程]首先,运用传统LDA模型分析主题特征词;其次,结合上下文语义信息进行中文分词,形成学科主题词库;最后,结合隐含位置聚类算法发现潜在社区,提高主题识别效果。[结果/结论]提出的方法一定程度上优化了主题挖掘算法在识别短文本主题的效果,消除主观意愿。由计算机自行分类并实现科学研究前沿主题的预测,揭示前沿领域的研究热点,为致力于研究前沿学科的新兴学者提供参考价值。  相似文献   

5.
[目的/意义]预测社科领域在未来有发展潜力的研究主题对于科研工作者寻找新的学科增长点和政府部门优化资源配置至关重要。文章提出一种基于语义表示和动态主题模型的社科领域新兴主题预测框架,以期丰富和完善主题预测研究的方法体系。[方法/过程]首先,使用BERT模型和UMAP算法对文本进行语义表示和向量降维,再通过动态主题模型对嵌入向量进行聚类,从而获得全局主题;其次,构建新兴主题指标计算公式,基于Neural Prophet模型和非参数检验方法预测新兴主题;最后,通过划分时间窗将全局主题细化为多个局部主题,以定位最近时间段的新兴词汇。[结果/结论]选取“人口老龄化”领域的学术论文和报纸进行实证研究,并采用资料验证法进行方法有效性分析,结果表明该方法能够快速准确地预测社科领域中的新兴主题。  相似文献   

6.
[研究目的]为细粒度发现相近学科间的知识关联,推动学科间知识交流,通过抽取方法知识元,探析不同学科领域研究方法的交流态势。[研究方法]以情报学和计算机科学学为例,首先,编写方法知识元抽取规则,基于规则抽取两学科领域大样本文献的方法知识元,构建学科领域方法知识元库;再利用LDA模型抽取两学科领域代表性期刊的方法知识元;以此为基础,对比分析两学科领域的高频研究方法、已交流的研究方法、存在交流潜力的研究方法。[研究结论]研究发现,两学科已交流的研究方法有:聚类分析、LDA模型、BP神经网络、支持向量机、主成分分析、协同过滤、文献计量等;具有交流潜力的研究方法有:提高准确率的分类算法(AdaBoost算法、XGBoost算法、SMOTE算法)、图卷积神经网络、自然语言处理模型GloVe模型等。该研究不仅能为情报学研究者选择计算机科学学领域的研究方法提供参考,而且也为学科交叉研究提供了一种新思路。  相似文献   

7.
[目的/意义]从研究主题的知识生产与扩散两方面识别学科研究热点,有利于明确学科重点,把握学科发展动向,为预测未来研究趋势提供研究基础。[方法/过程]提出主题动能概念,基于研究主题的生产与扩散指标构建主题动能模型,综合分析某时间段某主题的研究质量(横向热度)与速度(纵向变化),识别学科研究热点;并根据多时间段的动能变化情况划分不同类型的研究热点,描述其动态变化。[结果/结论]选择图书情报领域2017—2021年研究文献与引证文献为例进行实证分析,发现主题动能模型能够有效识别当前阶段的学科研究热点;选择2012—2016年和2017—2021年两个时间段的相关数据分析主题动能变化,能够划分学科“前沿型”“稳定型”“衰退型”三种类型研究热点,实现对学科研究的动态描述。  相似文献   

8.
[目的/意义]本文对近三年来(2015-2017)SCI和SSCI收录的图书情报学的影响因子排名前50%的外文期刊刊载论文及其题录数据进行计量研究,进而揭示国际LIS领域热点研究主题,再利用著名的科学分析管理工具ESI追踪LIS领域的研究发展趋势。[方法/过程]使用自主研发的程序工具基于Louvain算法对领域知识网络进行知识群落划分,进而识别领域知识主题与研究热点,再利用科学分析管理工具ESI根据共被引分析和聚类算法选出学科最新研究前沿。[结果/结论]通过研究发现,近三年国际图书情报学的研究热点主题分别是文献计量、高校图书馆、网络社交媒体研究、管理、卫生健康、技术、信息检索、电子政府、企业管理和电子商务等特定领域的信息应用,研究前沿主要集中在学术平台替代计量学研究、在线用户评论研究、政治文本内容挖掘研究、智慧城市研究、读者阅读研究、社交媒体相关研究等。  相似文献   

9.
阎巍  南洋 《科技通报》2012,28(10):158-159,162
研究了支持向量机与自组织神经网络的原理,利用支持向量机的小样本学习与推广能力强的特点,结合自组织神经网络良好的学习能力与收敛速度,实现了对支持向量机算法的改进.利用Lincoln实验室入侵检测系统评估数据集合对改进算法进行测试,并将实验结果与BP神经网络进行了比较,结果表明,改进的算法在检测精度与训练时间方面均优于BP神经网络.  相似文献   

10.
闫盛枫 《情报科学》2021,39(9):146-154
【目的/意义】探测特定领域政策文本语义主题,揭示我国政策部署领域与未来发展趋势。【方法/过程】提出 一种融合词向量语义增强和DTM模型的公共政策文本时序建模与可视化方法,采用DTM模型实现政策文本的时 序切割和主题建模,利用深度学习Word2vec算法中Skip-gram词嵌入技术可以对上下文词汇进行有效预测,增强 其语义表达性和政策解释性,以更为准确地揭示我国公共政策的部署重点。【结果/结论】实验表明本文提出的方法 对于公共政策主题识别和政策文本量化具有更好的知识抽取和语义表达能力,对我国公共政策挖掘和信息揭示具 有良好的揭示。【创新/局限】提出融合词向量语义增强和DTM模型的公共政策文本时序建模方法,一定程度上提 升了政策文本的主题语义表达,未来考虑利用深度学习技术如LSTM算法、BERT模型等识别政策中的领域知识单 元和语法结构。  相似文献   

11.
[目的/意义]产业变革快速演进,技术创新成为驱动社会经济发展、提高国家和企业科技竞争力的关键所在,如何对前沿技术进行识别和预测,成为国家科技政策研究和企业技术创新活动关注的热点。[方法/过程]以人工智能作为重点研究领域,首先以LDA模型进行技术主题抽取,并结合K-means算法进行专利文本聚类;在此基础上,以Z分数表示技术主题创新度,以Sen's斜率估计技术主题授权趋势,两个指标结合形成技术主题前沿度并将二者映射到二维空间,识别前沿技术主题以及划分技术主题类型;再,计算前沿技术主题的新颖度和关注度,二者融合形成技术主题趋势度指标;最后,采用三次指数平滑法对前沿技术主题的发展趋势进行预测。[结果/结论]人工智能领域的前沿技术主题有“智能家居”“电动汽车”和“自动化控制系统”,其中“智能家居”在未来3年的发展呈下降态势,而“电动汽车”和“自动化控制系统”的发展呈明显上升趋势。  相似文献   

12.
[目的/意义]旨在基于眼动数据建立机器学习模型以识别出用户购物时的时间压力水平。[方法/过程]共招募了32名被试进行了一项有关购物的眼动追踪实验,让被试在不同的时间压力水平下执行四项任务,选择随机森林、支持向量机、梯度提升树和k近邻等机器学习算法构建识别模型,利用准确率、查全率、查准率、F1值和ROC等指标评估模型。[结果/结论]随机森林有着最好的识别精度,在测试集上的预测准确率达到了87.5%,其中注视持续时间和注视次数等注视类眼动指标为识别模型贡献最大。  相似文献   

13.
[目的/意义]已有研究大多是通过频次研究关键词的热点程度和分布,较少有研究综合考虑多个维度的属性,对关键词的重要性进行考量。从词汇或词组集合中识别出重要关键词,有助于研究者把握学科领域的重点内容,为科研选题、确定研究内容等提供决策支持。[方法/过程]首先,通过理论分析,引入RFM模型,提出关键词重要性概念模型和指标体系;其次,构建特征数据集,参考Glo Ve词向量模型的思想,通过共现矩阵提取关键词的特征向量;再次,使用关键词重要性概念模型提取分类标签,对数据进行自动化标注;最后,通过人工智能相关算法进行模型训练和验证,证明提出的识别方法的可行性。[结果/结论]模型训练和评估,SVC算法的F1值达到0.79,Bi LSTM模型的F1值达到0.87,具有较好的拟合效果,说明提出的重要关键词识别方法具有可行性。[创新/局限]研究的创新点在于提出了具有多维度属性的关键词重要性概念模型和指标体系,并在深度学习模型上得到较好的评估结果;局限之处在于需要进一步扩大数据量,选择更多学科领域的数据对关键词概念模型进行验证,这是进一步研究的重点。  相似文献   

14.
基于最小二乘支持向量机的数据挖掘应用研究   总被引:6,自引:0,他引:6  
蔡冬松  靖继鹏 《情报科学》2005,23(12):1877-1880
随着数据仓库技术、联机分析技术的发展。基于数据库的数据挖掘已成为一种重要的数据处理手段。最小二乘支持向量机作为一种新的机器学习方法。具有全局收敛性和良好的泛化能力。本文将其应用于数据挖掘的分类与预测研究。通过棱函数的选择及参数优化,并结合支持向量机、多层感知器神经网络模型及判别分析方法进行比较研究,证明最小二乘支持向量机作为一种有效的数据挖掘算法具有较高精度。  相似文献   

15.
[目的/意义]对国内文本情感分析的研究成果进行梳理与计量分析,有助于从不同角度了解主题研究状况、发文情况,对后续的研究具有一定的参考价值。[方法/过程]本文对发文期刊、作者团队进行统计分析,并利用共词分析法,研究关键词之间的联系,探讨近十年来在文本情感分析的研究热点及现状。[结果/结论]结果表明,我国近两年对文本情感分析的研究主要有基于情感词典的机器学习和神经网络的深度学习两种方法,文章最后指出了两种方法的研究现状及未来研究方向。  相似文献   

16.
【目的/意义】云计算的普及使得MI学科受到学术界的持续关注,对MI主题识别与演化的分析可以揭示历史演化,有助于发现人们关注的问题,预见该领域的未来发展。【方法/过程】本文利用潜狄利克雷分配(Latent Dirichlet Allocation, LDA)主题模型对web of science(WOS)数据库中与MI相关的主题进行识别和挖掘,并利用生命周期理论、变异系数法、Kullback-Leibler divergence(KL)等理论和方法绘制出MI研究主题的演化路径。【结果/结论】研究结果表明,MI的研究主题正逐渐向方法、技术和实践的研究方向发展,医疗数据分析、临床数据挖掘、健康信息技术等新兴技术和应用方向将成为未来MI学科的研究热点。【创新/局限】本文从生命周期视角对全球范围内医学信息学学科的主题演化进行挖掘和分析,为该学科未来的发展提供借鉴,但并没对各地区分别进行分析,因此存在一定的局限性。  相似文献   

17.
[目的/意义]对比论文数据和专利数据的特征指标,识别热点、新兴、潜在和消亡研究前沿主题。[方法/过程]利用LDA主题模型,对智能汽车领域相关的论文数据和专利数据进行主题提取,计算两个数据源下各主题的强度和主题新颖度并进行对比分析。[结果/结论]本文识别出路径规划技术等热点研究前沿6个、智能计算等新兴研究前沿2个、安全认证技术等潜在研究前沿6个、车载平台等消亡研究前沿6个。本文在前沿识别方法上进行了创新,有效识别出领域内研究前沿并进行分类,为相关机构和研究人员提供借鉴。  相似文献   

18.
[目的/意义]对已有研究成果进行梳理有利于明晰国内科学数据管理研究发展现状。[方法/过程]结合生命周期理论与LDA模型,对1992—2021年国内科学数据管理研究相关文献进行统计分析,以识别我国科学数据管理研究的潜在主题、揭示阶段特征与发展趋势。[结果/结论]依照文献分布特征将我国科学数据管理研究阶段分为萌芽阶段、发展阶段与繁盛阶段。从主题维度来看,国内科学数据管理相关主题围绕科学数据的服务、政策、标准、平台建设与功能拓展、科研用户及科学数据共享而展开。从演进过程来看,国内科学数据管理经历了科学数据存储研究、科学数据共享基础设施建设研究、多主体全方位科学数据管理与服务研究三个阶段的主题演进。从发展趋势来看,科学数据政策、科学数据标准、科研人员以及科学数据共享主题的研究是未来该领域的研究热点。  相似文献   

19.
[目的/意义]定量化、可视化地分析、总结健康信息领域研究主题演化特征,有利于把握健康信息领域整体的发展现状与未来发展方向。[方法/过程]利用Node2vec算法和LDA主题模型,从内部文本和外部引文两个维度进行健康信息领域研究主题扩张与收敛程度计算,然后利用科学、严谨的数学模型对研究主题扩张与收敛时序变化数据进行跟踪建模,结合模型构建结果对健康信息领域几十年来研究主题的动态演化规律进行总结归纳。[结果/结论]研究发现,健康信息领域研究主题的发展演变过程呈现出以下规律:健康信息素养从对健康信息的认可到利用再到评价的变化趋势,健康信息需求从专业集中性、单一被动性到多主体性、多层次性的变化趋势,健康信息行为从搜寻性到传播性再到评价性的演变趋势等。  相似文献   

20.
王仕俊  平常  薛国斌 《科技通报》2019,35(11):135-138,142
针对目前在局部放电模式识别领域中常用的分类器算法的缺陷,本文研究随机森林(random forest,RF)算法在局部电放模式识别领域的应用。首先对局部放电试验数据提取统计特征量,构建放电的学习样本。利用十折法对算法分类性能进行评判,并比较常见分类算法BP神经网络、支持向量机(support vector machine,SVM))、KNN、分类回归树算法(classification and regression tree,CART)以及RF算法的识别准确率。结果表明:利用RF算法构建放电模式分类器的识别准确率最高。此外,利用组成RF的基分类算法CART可分析不同放电模式间的主要区别。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号