首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 312 毫秒
1.
李静  徐路路 《现代情报》2019,39(4):23-33
[目的/意义]细粒度分析学科领域热点主题发展脉络并对利用机器学习算法对未来发展趋势进行准确预测研究。[方法/过程]提出一种基于机器学习算法的研究热点趋势预测方法与分析框架,以基因工程领域为例利用主题概率模型识别WOS核心集中论文摘要数据研究热点主题并进行主题演化关联构建,然后选取BP神经网络、支持向量机及LSTM模型等3种典型机器学习算法进行预测分析,最后利用RE指标和精准度指标评价机器学习算法预测效果并对基因工程领域在医药卫生、农业食品等方面研究趋势进行分析。[结果/结论]实验表明基于LSTM模型对热点主题未来发展趋势预测准确度最高,支持向量机预测效果次之,BP神经网络预测效果较差且预测稳定性不足,同时结合专家咨询和文献调研表明本文方法可快速识别基因领域研究主题及发展趋势,可为我国学科领域大势研判和架构调整提供决策支持和参考。  相似文献   

2.
王婧  武帅 《情报探索》2024,(2):1-11
[目的/意义]现有学科研究主题的梳理多为领域专家的定性分析和学科学者的文献梳理,一定程度会由于研究思维的局限性和获取知识的片面性造成学科研究主题误判,为有效避免漏判误判现象的发生,提出识别模型。[方法/过程]首先,运用传统LDA模型分析主题特征词;其次,结合上下文语义信息进行中文分词,形成学科主题词库;最后,结合隐含位置聚类算法发现潜在社区,提高主题识别效果。[结果/结论]提出的方法一定程度上优化了主题挖掘算法在识别短文本主题的效果,消除主观意愿。由计算机自行分类并实现科学研究前沿主题的预测,揭示前沿领域的研究热点,为致力于研究前沿学科的新兴学者提供参考价值。  相似文献   

3.
[目的/意义]用户间的专业知识异构以及用户场景的动态性,导致现有的目录式数据查询方式难以为用户提供主动式数据服务。文章针对用户在数据使用中的差异化专业知识进行识别和重组,作为连接用户和数据资源的中间知识库,以支持进一步的场景化数据互操作研究。[方法/过程]为实现这一目的,提出一套基于主题分析和语用情境融合的多义术语识别、建模方法,借助静态概念关系和动态语用情境构建术语知识库。主要研究内容包括:基于词频和词性构建文本向量空间;在领域知识不充足的情形下,提出采用主题模型半自动识别多义术语,并基于语用情境模型,在多义术语与其适用情境之间建立语义关联路径。[结果/结论]文章提出的一套基于主题分析和语用情境建模的多义术语识别方法,通过建筑工程领域的实例研究,证明该方法能够识别并解决用户之间的专业知识异构问题。  相似文献   

4.
[研究目的]专利是技术信息的载体,以专利数据为研究对象,在产业链视角下进行技术主题提取及识别,从专利数据中识别新兴技术可以有助于把握新兴技术的发展动态。[研究方法]首先,根据产业链的概念和专利IPC分类号构建出产业链各个层级对应的专利集;然后,结合专利文本的特点提出EW-LDA主题模型,从词汇权重和语境两个角度对LDA主题模型进行改进,使用EW-LDA模型提取出产业链的各个层级中得技术主题;最后,根据专利文本及新兴技术的特点,从新颖度、热点度、关注度和增长率四个方面入手构建新兴技术主题识别指标,将技术主题分为新兴、热点、潜在、衰退和噪音五类。并在人工智能领域的专利数据上进行实验。[研究结论]结果表明,提出的EW-LDA主题模型具有更好的主题建模效果,产业链视角下的新兴技术主题识别方法可以有效的识别出新兴技术。  相似文献   

5.
[研究目的]将Sentence-BERT模型应用于专利技术主题聚类,解决专利文献为突出新颖性,常使用独特技术术语造成词汇向量语义特征稀疏的问题。[研究方法]以人工智能领域2015年-2019年的22370篇专利为实验数据。首先,采用Sentence-BERT算法对专利文献摘要文本进行向量化表示;其次,对向量化矩阵进行数据降维,利用HDBSCAN方式寻找原始数据中的高密度簇;最后,识别类簇文本集合中的主题特征,并完成主题呈现。[研究结论]对比LDA主题模型、K-means、doc2vec等方法,本文的实验结果提高了主题划分的细粒度和精确度,获得了较好的主题一致性。如何采用fine-tune策略进一步提升模型的效果,是未来该方法进一步深入探索的方向。  相似文献   

6.
[目的/意义]产业变革快速演进,技术创新成为驱动社会经济发展、提高国家和企业科技竞争力的关键所在,如何对前沿技术进行识别和预测,成为国家科技政策研究和企业技术创新活动关注的热点。[方法/过程]以人工智能作为重点研究领域,首先以LDA模型进行技术主题抽取,并结合K-means算法进行专利文本聚类;在此基础上,以Z分数表示技术主题创新度,以Sen's斜率估计技术主题授权趋势,两个指标结合形成技术主题前沿度并将二者映射到二维空间,识别前沿技术主题以及划分技术主题类型;再,计算前沿技术主题的新颖度和关注度,二者融合形成技术主题趋势度指标;最后,采用三次指数平滑法对前沿技术主题的发展趋势进行预测。[结果/结论]人工智能领域的前沿技术主题有“智能家居”“电动汽车”和“自动化控制系统”,其中“智能家居”在未来3年的发展呈下降态势,而“电动汽车”和“自动化控制系统”的发展呈明显上升趋势。  相似文献   

7.
基于主题细分的社交网络用户间交互特征分析   总被引:1,自引:0,他引:1  
[目的/意义]针对一微博子网,从主题细分的角度对用户间历史交互记录进行研究,发现用户间交互的主题偏好特征,以期从微观层面了解用户信息传播行为的规律。[方法/过程]通过用户实例分析得出对用户间交互进行主题细分的必要性;利用主题模型(LDA)对用户间历史交互记录进行主题细分,采用多维向量表示用户间在不同主题下的交互强度;通过统计分析和网络分析方法探索用户间交互的主题特征。[结果/结论]各主题下用户间交互强度的分布具有长尾特征;用户间的交互内容在时序上具有主题相关性;基于多维的用户间交互强度,可抽取出特定主题下的用户交互子网。用户间交互在时序上具有主题相关性这一特征,以及特定主题的用户交互子网,可用于对特定主题的信息传播进行监控和预测。  相似文献   

8.
[目的/意义]识别学科交叉前沿主题并预测其发展趋势,有助于了解学科内部结构,挖掘领域重点部署方向,为未来创新性、突破性研究提供参考。[方法/过程]以美国国家自然科学基金项目及其产出论文分别作为前端、后端数据,首先,从三个维度测度项目学科交叉度,遴选领域学科交叉项目;其次,从主题关注度、新颖度等方面构建研究前沿主题识别指标体系,对学科交叉主题进行二次遴选,满足阈值的即为学科交叉前沿主题;再次,对比时间序列分析模型ARIMA和LSTM主题拟合效果并选择误差最小模型对学科交叉前沿主题进行趋势预测分析;最后,以生物科学领域为例对方法的有效性和可行性进行实例验证。[结果/结论]生物科学领域在纳米生物学技术、全球变化和海洋环境生物学、生物信息学及壶菌病与两栖动物多样性方面有较好发展前景。经专家咨询和已有研究对比分析,该方法可有效识别领域学科交叉前沿主题,并对其未来研究趋势走向有一定参考借鉴。  相似文献   

9.
柴文越  刘小平  梁爽 《现代情报》2023,(12):164-177
[目的/意义]梳理国内外新兴主题识别相关研究,总结不同方法的优缺点,归纳现有研究存在的问题,为新兴主题识别研究提供参考。[方法/过程]首先对新兴主题及其相关概念进行辨析;其次根据新兴主题识别的流程,从数据源及分析对象的选择、识别主题的方法、用于筛选新兴主题的特性与指标3个层面对相关文献集进行梳理与分析;最后,提出现有研究的局限与不足,并对未来发展作出展望。[结果/结论]新兴主题识别研究经过20余年的发展,已经形成了较为规范的研究流程及较为丰富的研究方法,但仍存在一定的不足。在理论层面,新兴主题的定义尚不明确;在数据集构建方面,数据源的选择与融合方式有待完善;在主题识别方面,研究方法时滞性较强,对语义关注和解释不足;在筛选指标方面,缺乏客观完整的评价体系。未来需要针对相关理论和研究方法进行更为深入的研究。  相似文献   

10.
[目的/意义]从微观视角把握研究前沿主题在基金项目、论文数据中的关联关系,有助于准确把握科学知识生长中的研究前沿活动机理,对于研究前沿、新兴趋势识别和多源科技文献融合等工作具有一定的实践指导意义。[方法/过程]首先,利用LDA模型进行基金、论文研究主题探测;然后,综合新兴度、关注度指标和战略坐标图进行初始研究前沿判别,在主题扩散演化滞后效应测度结果基础上进行滞后修正的研究前沿识别;最后,利用ARIMA模型和Word2Vec模型进行研究前沿主题趋势预测分析。[结果/结论]以美国纳米农业领域为例进行了实证研究。研究发现,基金和论文在外部数量和内部主题特征两个层面都显示出一定的滞后性。文章对纳米颗粒在农作物代谢过程中诱导应激机制、用于绿色可持续环境及农业应用的纳米气泡技术、农作物吸收不同剂量下纳米材料的反应与机制等7个研究前沿主题发展趋势进行了预测分析。  相似文献   

11.
[目的/意义]从研究主题的知识生产与扩散两方面识别学科研究热点,有利于明确学科重点,把握学科发展动向,为预测未来研究趋势提供研究基础。[方法/过程]提出主题动能概念,基于研究主题的生产与扩散指标构建主题动能模型,综合分析某时间段某主题的研究质量(横向热度)与速度(纵向变化),识别学科研究热点;并根据多时间段的动能变化情况划分不同类型的研究热点,描述其动态变化。[结果/结论]选择图书情报领域2017—2021年研究文献与引证文献为例进行实证分析,发现主题动能模型能够有效识别当前阶段的学科研究热点;选择2012—2016年和2017—2021年两个时间段的相关数据分析主题动能变化,能够划分学科“前沿型”“稳定型”“衰退型”三种类型研究热点,实现对学科研究的动态描述。  相似文献   

12.
周海炜  吴成凤 《情报杂志》2022,41(2):86-94,48
[研究目的]对新兴技术进行识别,有助于跟踪行业的最新发展动态,为企业提供最新的情报。[研究方法]通过分析以往相关文献,针对目前新兴技术识别研究中存在的不足,构建了基于专利SAO结构和多指标评价的新兴技术识别模型。首先,将基于语言层级的SAO结构和基于关键词语义的TF-IDF算法相结合,划分出各项子技术领域;其次,根据新兴技术特征建立多指标评价体系,结合专利数量年度变化,判别出新兴技术;最后,根据术语的语法规则,利用语言过滤器抽取出特定专利文献中的技术术语,识别新兴技术主题。[研究结论]将新兴技术识别模型应用于手机芯片行业,成功识别出了5G基带芯片和新型存储芯片两项新兴技术,与业界动态基本一致,从而验证了该模型的可行性。  相似文献   

13.
[目的/意义]定量化、可视化地分析、总结健康信息领域研究主题演化特征,有利于把握健康信息领域整体的发展现状与未来发展方向。[方法/过程]利用Node2vec算法和LDA主题模型,从内部文本和外部引文两个维度进行健康信息领域研究主题扩张与收敛程度计算,然后利用科学、严谨的数学模型对研究主题扩张与收敛时序变化数据进行跟踪建模,结合模型构建结果对健康信息领域几十年来研究主题的动态演化规律进行总结归纳。[结果/结论]研究发现,健康信息领域研究主题的发展演变过程呈现出以下规律:健康信息素养从对健康信息的认可到利用再到评价的变化趋势,健康信息需求从专业集中性、单一被动性到多主体性、多层次性的变化趋势,健康信息行为从搜寻性到传播性再到评价性的演变趋势等。  相似文献   

14.
LDA模型在专利文本分类中的应用   总被引:1,自引:0,他引:1  
对传统专利文本自动分类方法中,使用向量空间模型文本表示方法存在的问题,提出一种基于LDA模型专利文本分类方法。该方法利用LDA主题模型对专利文本语料库建模,提取专利文本的文档-主题和主题-特征词矩阵,达到降维目的和提取文档间的语义联系,引入类的类-主题矩阵,为类进行主题语义拓展,使用主题相似度构造层次分类,小类采用KNN分类方法。实验结果:与基于向量空间文本表示模型的KNN专利文本分类方法对比,此方法能够获得更高的分类评估指数。  相似文献   

15.
[目的/意义]为提高主题建模结果的可读性,解决主题标注过程中主观性强、可解释性弱的问题,引入本体和关联规则构建频繁语义模式。[方法/过程]以肿瘤靶向治疗专利数据为研究对象,首先构建LDA2vec模型挖掘主题;然后考虑主题词的语义与共现,将UMLS本体与FP-growth关联规则相结合,得到频繁语义模式的主题标注;最后将结果与Canopy方法对比评估。[结果/结论]实证结果显示,基于频繁语义模式的标注能够从统计和语义的角度概括主题含义,在主题标注工作中效果更佳。  相似文献   

16.
[目的/意义]对比论文数据和专利数据的特征指标,识别热点、新兴、潜在和消亡研究前沿主题。[方法/过程]利用LDA主题模型,对智能汽车领域相关的论文数据和专利数据进行主题提取,计算两个数据源下各主题的强度和主题新颖度并进行对比分析。[结果/结论]本文识别出路径规划技术等热点研究前沿6个、智能计算等新兴研究前沿2个、安全认证技术等潜在研究前沿6个、车载平台等消亡研究前沿6个。本文在前沿识别方法上进行了创新,有效识别出领域内研究前沿并进行分类,为相关机构和研究人员提供借鉴。  相似文献   

17.
[目的/意义] 探索一种融入数据驱动思维的人文社科专题数据库建设主题选择方法,为相关主体在建库主题的遴选、比较和确定等工作提供决策参考。[方法/过程] 从政策、用户两个维度出发,提出基于政策文本与检索数据的人文社科专题数据库主题筛选框架。以Fulink平台为例,基于政策文本LDA主题分类建模和检索数据的词频统计归类,确定专题数据库建设备选主题,最后通过比对筛选将主题进行分类。[结果/结论] 本文构建的主题选择框架,能够有效提升相关主题选择工作的全面性、准确性、科学性,为人文社科专题数据库建设的项目规划等提供了良好的思路。  相似文献   

18.
[目的/意义]随着产业和技术复杂化,需要融合多个技术领域才能有效进行创新。研究技术融合趋势,有利于提供产业创新路径,促进技术融合,识别新兴技术。[方法/过程]采用LDA主体模型和社会网络方法,以关节机器人专利为例,对专利文献进行主题分类,提炼技术关键词,构建技术关键词间的主题共现矩阵,对技术融合进行测度并分析技术融合趋势。[结果/结论]研究结果发现:关节机器人专利技术融合呈小世界趋势,机械本体与驱动结构,控制系统与驱动结构融合趋势不明显,传感器是关键核心技术,机器人与人工智能结合是产业技术发展的新兴领域。  相似文献   

19.
[目的/意义]探索基于Altmetrics的新兴主题探测方法,有利于弥补目前新兴主题识别的不足、推动知识服务与情报学学科发展。[方法/过程]从新兴主题特征出发,基于AAS(Altmetrics Attention Score)聚合分数设计新兴主题探测过程和指标,并结合第三方结果比较和指标验证等对构建方法进行检验和分析。[结果/结论]提出的新兴主题探测方法识别结果有效,并能较好地识别具有发展潜力的新兴主题。  相似文献   

20.
【目的/意义】针对学术APP评论数据特征,挖掘用户评论语义关联关系,为平台运营者和开发者高效获取 用户需求和关注点提供思路和指导方法。【方法/过程】首先,基于LDA主题模型和GloVe 词向量模型构建学术APP 用户在线评论主题语义关联研究框架,然后,采集超星移动图书馆APP在线评论作为样本数据,通过主题识别获取 用户评论主题并基于词向量相似性得到主题语义关联,最后构建出语义关联主题图谱。【结果/结论】实验结果表明 运用文章提出的思路方法能够有效发现用户评论主题和主题间关联关系并得到主题关联图谱,从而为学术APP平 台运营者完善平台功能提供参考和借鉴。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号