首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 27 毫秒
1.
[研究目的]跨领域关键共性技术强调技术的跨领域关联与主导作用,对其识别将为政府推动跨产业跨领域创新、提前布局相关技术领域提供决策支持。[研究方法]首先,运用GloVe模型向量化专利文本,按照专利与技术领域的语义接近程度划分专利所属领域;其次,基于GMM算法提取各领域技术主题,依据技术主题之间的语义距离,构建技术主题关联网络;最后,利用漏斗模型,依据技术主题的共性指标、跨领域指标、关键性指标筛选出跨领域关键共性技术。[研究结论]运用养老科技领域专利数据进行实证研究,结果显示“智能控制辅助技术”“无接触式躯体感知技术”“沟通与信息辅助技术”“适用性技术”为跨领域关键共性技术,通过比对国家相关政策内容,验证了方法的有效性。  相似文献   

2.
[目的/意义]实现对领域概念的自动学习抽取,解决领域本体自动化构建的首要基础任务。[方法/过程]以无监督的学习方法和端到端的识别模式为理论技术基础,首先通过对主流词嵌入模型进行对比分析,设计提出了基于Word2Vec和Skip-Gram的领域文本特征词嵌入模型的自动生成方法;其次研究构建了以IOB格式的标注文本作为输入,基于自注意力机制的BLSTM-CRF领域概念自动抽取模型;最后以资源环境学科领域为例进行了实验研究与评估分析。[结果/结论]模型能够实现对领域概念的自动抽取,对领域新概念或术语的自动识别也具有一定的健壮性。[局限]模型精度尚未达到峰值,有待进一步优化提升。  相似文献   

3.
[目的/意义]当前各学科领域文献增长迅速,迫切需要以面向“问题解决”的思路,从大量科技文献中抽取出研究问题、解决方案及其解决关系,并以此为基础开展领域知识演化研究。[方法/过程]文章提出了可应用于实践的低成本领域实体关系抽取方案:依托词嵌入类比的思想,仅从领域知识资源中提取的少量实体关系对作为基准即可实现关系分类。[结果/结论]在人工智能领域数据集上使用基于词嵌入类比方案的集成模型,抽取解决关系、问题层级关系、方法层级关系的F1值分别为82.33,81.49,74.81。最后,将集成模型应用于全量数据抽取实体关系,从宏观、中观、微观三个层面展示了面向问题解决的人工智能领域知识演化情况。  相似文献   

4.
[目的/意义]关键技术问题研究对于辅助各创新主体把握创新突破方向、攻克关键核心技术、推进技术创新具有重要意义。[方法/过程]针对目前技术关键问题挖掘领域识别样本、流程、方法上的不足,提出多文本分析的领域关键技术问题挖掘框架,以专利说明书技术背景为主,综述性论文结束语和技术需求文档为辅,从数据获取及转化、技术问题提取、技术问题主题识别、关键技术问题发现4个环节展开分析。[结果/结论]对石墨烯领域案例研究证明了多文本分析的领域关键技术问题识别框架的有效性;专利说明书技术背景、综述论文结束语与技术需求文档在挖掘技术问题上的表现、描述极性、结果上具有不同的解释力度,可互相佐证补充。  相似文献   

5.
[目的/意义]随着我国关于政策文本研究文献的日益增多,对国内CSSCI期刊发表的相关研究文献进行综合述评有助于梳理政策文本分析研究的脉络,为未来政策文本研究的深入提供参考。[方法/过程]基于文献计量学和可视化分析视角,绘制我国政策文本研究的作者共现图谱、机构共现图谱、关键词共现图谱、关键词聚类图谱、关键词突变图谱等。[结果/结论]可视化地呈现了我国政策文本研究中具有影响力的作者及科研机构间的合作情况,通过分析关键词共现、聚类、突变情况以揭示政策文本研究发展脉络,并对研究方法、研究视角与研究领域进行总结。  相似文献   

6.
[目的/意义]在新技术环境下,图书情报学领域期刊影响力评价与排名的需求正在发生变化。为了完善学科排名体系,文章基于社会网络分析法提出一种新的排名思路--从知识传播角度考虑期刊排名。[方法/过程]文章以近十年的中文社会科学引文索引(CSSCI)数据库中图书馆、情报与文献学(简称LIS)专业的来源期刊为研究对象,应用社会网络分析的研究方法,运用UCINET软件,对这些期刊的知识传播模式进行分析,在知识传播网络中按不同特性对期刊进行排名,并且探究了LIS期刊在知识传播网络中子群的构成。[结果/结论]LIS各个期刊知识传播的出度与入度差距较大,少数的期刊传播领域内大量知识。按照LIS期刊在知识网络中的不同特性排名与按照影响因子排名有差异,在知识传播网络中也可提取出具有相似的出度入度的LIS期刊的子群,以便对LIS期刊影响力进行更好的研究。  相似文献   

7.
张晓丹 《情报杂志》2021,(1):184-188
[目的/意义]随着互联网数字资源的剧增,如何从海量数据中挖掘出有价值的信息成为数据挖掘领域研究的热点问题。文本大数据分类是这一领域的关键问题之一。随着深度学习的发展,使得基于深度学习的文本大数据分类成为可能。[方法/过程]针对近年来出现的图神经网络文本分类效率低的问题,提出改进的方法。利用文本、句子及关键词构建拓扑关系图和拓扑关系矩阵,利用马尔科夫链采样算法对每一层的节点进行采样,再利用多级降维方法实现特征降维,最后采用归纳式推理的方式实现文本分类。[结果/结论]为了测试该文所提方法的性能,利用常用的公用语料库和自行构建的NSTL科技期刊文献语料库对本文提出的方法进行实验,与当前常用的文本分类模型进行准确率和推理时间的比较。实验结果表明,所提出的方法可在保证文本及文献大数据分类准确率的前提下,有效提高分类的效率。  相似文献   

8.
[目的/意义]从学术共同体的评论性引用视角出发,以引文全文本为基础,结合词频统计、深度学习等方法,探析引文文本中表征突破性评价的文本特征并构建自动识别模型以实现从海量文献中识别潜在突破性文献。[方法/过程]以诺贝尔生理学或医学奖获得者的关键文献以及Science十大科学突破主题的代表文献(医学领域)作为金标准突破性文献集并获取引用语句,对引用语句进行词频统计并结合人工筛选获取表征突破性评价的常用词。对引用语句进行人工标注,利用BERT、BIOBERT模型进行训练形成自动识别模型,并选择癌症领域进行实证分析。[结果/结论]结果表明,学术共同体在评价具有重大突破价值的文献时具有明显的文本特征;相较BERT模型,生物医学语言表示模型BIOBERT对突破性评价引用语句的识别能力明显增强,F1值为0.84。基于引用语句的自动识别模型能够较为精准地识别具有重要学术价值的文献并能在一定程度上实现早期识别和早期评价。  相似文献   

9.
[目的/意义]随着跨学科研究不断深入,识别并分析跨学科知识生长点的生命周期,对于把握学科发展现状、未来趋势和跨学科规律具有重要意义。[方法/过程]改变以往以文献作者标注关键词、题名摘要抽取关键词为研究对象的方式,通过对目标学科文献与跨学科参考文献进行全文分词,构建跨学科知识生长点识别模型,全面分析知识节点的影响力与共现强度,识别并分析跨学科知识生长点所处生命周期的不同阶段,并以图书情报学“引文分析”领域为例,全文提取2016—2020年研究文献及其跨学科参考文献关键词进行实证分析。[结果/结论]引文分析领域不同生命周期的跨学科知识生长点具有不同特点:形成期不稳定生长;成长期创新发展能力较强,且外来知识主要来源于计算机科学;成熟期合作紧密,其中“社会网络分析”是最稳定的外来知识。  相似文献   

10.
陈文珺  杨佳佳 《情报科学》2020,38(6):126-132
【目的/意义】基于迁移学习理论,提取多领域间共享知识模型,并进行有效的领域适应,提升目标领域推荐 性能。【方法/过程】充分利用领域中的用户-物品评分矩阵,分别对多领域用户和物品进行潜在特征提取,并将用 户-物品特征向量分别进行特征聚类;同时对多领域特征矩阵进行领域适应融合,得到共享知识模型;最后再运用 迁移学习理论与方法,将收敛的共享知识模型从源领域迁移至目标领域,提高目标领域推荐性能。【结果/结论】实 验结果表明,首先,多领域信息融合较于单领域推荐有着更好的推荐性能;其次,本文所提出的基于共享知识迁移 学习的跨领域推荐模型在推荐效果上要优于当前业界已有的其它跨领域推荐算法。  相似文献   

11.
[目的/意义]专利关键词提取是专利挖掘任务中非常重要的前置子任务,基于图模型的关键词提取是目前最有效的算法。传统图模型只考虑了单词的局部上下文信息,为了捕获单词的全局信息,提出一种基于图神经网络的专利关键词提取算法,结合词向量与图模型实现专利关键词的提取。[方法/过程]首先,用专利数据集构建异构网络,以专利分类号为标签,训练图神经网络模型,使得同一主题下的单词具有相似的向量表示,获取包含主题信息的词向量;然后,根据专利摘要在滑动窗口内的单词共现关系和词向量相似度,构建融合了单词主题信息的文本图,利用词向量中的主题信息捕获单词的全局联系;最后,在文本图上使用PageRank算法,获取关键节点,构成专利的关键词。[结果/结论]与基线方法相比,该算法在提取专利关键词时,能够检测到新颖性与准确性更高的关键词。  相似文献   

12.
[目的/意义]文本智能计算是近年来的新兴交叉学科,揭示其研究动态对情报学研究有重要意义。[方法/过程]从关键词共现网络的视角,以WOS核心合集中的文献为分析样本,借助复杂网络计算、社区划分以及可视化等技术手段,揭示了文本智能计算研究的主题结构和演化脉络,并总结归纳了其发展态势。[结果/结论]当前文本智能计算研究的结构趋于稳定,各子领域关联性较强。研究当前主要分为5个子领域,人工智能、数据挖掘是当前的领域研究热点,文本分析领域将有所突破,并成为新的研究重心。  相似文献   

13.
[目的/意义]已有研究大多是通过频次研究关键词的热点程度和分布,较少有研究综合考虑多个维度的属性,对关键词的重要性进行考量。从词汇或词组集合中识别出重要关键词,有助于研究者把握学科领域的重点内容,为科研选题、确定研究内容等提供决策支持。[方法/过程]首先,通过理论分析,引入RFM模型,提出关键词重要性概念模型和指标体系;其次,构建特征数据集,参考Glo Ve词向量模型的思想,通过共现矩阵提取关键词的特征向量;再次,使用关键词重要性概念模型提取分类标签,对数据进行自动化标注;最后,通过人工智能相关算法进行模型训练和验证,证明提出的识别方法的可行性。[结果/结论]模型训练和评估,SVC算法的F1值达到0.79,Bi LSTM模型的F1值达到0.87,具有较好的拟合效果,说明提出的重要关键词识别方法具有可行性。[创新/局限]研究的创新点在于提出了具有多维度属性的关键词重要性概念模型和指标体系,并在深度学习模型上得到较好的评估结果;局限之处在于需要进一步扩大数据量,选择更多学科领域的数据对关键词概念模型进行验证,这是进一步研究的重点。  相似文献   

14.
张彬  徐建民  吴姣 《现代情报》2023,(3):157-166
[目的/意义]跨域推荐通过挖掘、迁移并融合利用不同来源的知识为用户提供个性化的推荐服务,近年来得到学术界和工业界的热点关注,文章从多个角度对跨域推荐中的知识融合研究进展进行梳理和归总。[方法/过程]首先对跨域推荐问题进行了系统地分析,探讨了跨域推荐的“域”、跨域推荐场景和跨域推荐任务中的知识需求;其次对跨域推荐中的知识融合方法进行了分类,总结了基于聚类、基于语义、基于图模型和基于标签关联的跨域知识融合方法的优点和不足;然后分析了知识图谱技术对于跨域知识融合的启发;最后对跨域推荐研究中的知识融合进行了总结和展望。[结果/结论]知识融合作为跨域推荐研究中的重要环节,可以在知识层面实现对数据的深度加工和有效利用,为跨域推荐问题研究与实践提供新的范式。  相似文献   

15.
[目的/意义]在计算化学中,化学键能是重要的化学领域科学数据,目前化学键能数据抽取工作主要是由领域专家手动抽取,效率低下,大多数化学键能科学数据被湮没于海量文献中,无益于深入的、创新的科学数据分析。[方法/过程]为了解决该问题,本研究以ChemBE化学键能语料为实验对象,设计在较少专家支持的情况下,使用迁移学习的方法在化学论文中自动抽取与化学键能相关的科学数据。本文提出了一种端到端的BERT-CRF模型,通过构建领域高频子词的方法来解决大量未登录词的问题,并在后续深度学习模型的训练中,将构建好的领域高频子词作为领域特征输入到深度学习模型中,实现了对论文中的化学键能科学数据自动、高效地抽取。[结果/结论]实验表明,端到端的BERT-CRF模型与需要专家构建规则的基线模型相比,取得了理想的实验结果,F1值达到了88.56%。本文通过构建领域高频子词来解决大量未登录词的问题,降低了对领域专家的要求,可以较为容易地、低成本地迁移到其他领域。本文的研究结果是情报分析技术在化学领域的实践,为化学键能的智能知识检索提供了重要支撑。  相似文献   

16.
[目的/意义]现代社会已进入大数据时代,基于用户画像的智能信息服务深刻地改变了人们的生活,对图书馆领域产生了重要影响,研究用户画像对社会的发展具有重要作用。[方法/过程]以CNKI中国学术文献网络出版总库中的用户画像文献作为研究对象,使用CiteSpace绘制可视化知识图谱,进行关键词分析,揭示我国用户画像研究的时间分布、学科领域、主题演变和研究热点问题。[结果/结论]我国用户画像研究划分为初始阶段、起步阶段和发展阶段,从2015年开始快速发展,但基础理论研究较少,研究成果尚未形成体系;用户画像研究文献从最初的计算机和电子商务等学科领域逐渐向管理学、经济学、人文社科领域发展,呈现出明显的跨学科特征;大数据构成了用户画像研究的数据基础,随着计算机和信息网络技术的发展,用户画像研究和实践应用不断发展,图书情报与数字图书馆是用户画像研究的重要领域;研究热点包括基础理论、核心技术、实践应用和基础数据四方面内容。  相似文献   

17.
[目的/意义]提出融合母评论文本信息的评论短文本情感分类模型以提高互联网环境下短文本评论情感分析效果,适应舆情工作中的实际应用需求。[方法/过程]以短视频平台舆情事件的评论数据为实验对象,利用GRU提取母评论文本特征和直接提取评论区特征,分别将这些特征与CNN提取原评论文本特征并行融合进行情感分类。[结果/结论]相较于传统深度学习方法,引入的母评论文本特征使两个数据集的情感分类效果都获得了一定提升,F1值等均分别提升了2%和1%,说明本文提出的特征引入方案能够提升评论短文本的分类效果,为舆情工作中的情感监测实际应用提供了思路,验证了舆情相关理论研究对实际技术应用有借鉴和指导意义。  相似文献   

18.
[目的/意义]定量化、可视化地分析、总结健康信息领域研究主题演化特征,有利于把握健康信息领域整体的发展现状与未来发展方向。[方法/过程]利用Node2vec算法和LDA主题模型,从内部文本和外部引文两个维度进行健康信息领域研究主题扩张与收敛程度计算,然后利用科学、严谨的数学模型对研究主题扩张与收敛时序变化数据进行跟踪建模,结合模型构建结果对健康信息领域几十年来研究主题的动态演化规律进行总结归纳。[结果/结论]研究发现,健康信息领域研究主题的发展演变过程呈现出以下规律:健康信息素养从对健康信息的认可到利用再到评价的变化趋势,健康信息需求从专业集中性、单一被动性到多主体性、多层次性的变化趋势,健康信息行为从搜寻性到传播性再到评价性的演变趋势等。  相似文献   

19.
[目的/意义]旨在提出一种基于领域词典的突发公共安全领域舆情事件自动识别方法,有效识别公共安全领域的热点舆情事件,预防危机舆情事件,提高政府公信力。[方法/过程]首先以中国应急服务网中的公共安全事件语料为数据来源,提取并筛选公共安全领域的高频词汇;然后结合人工干预方式选择部分高频且与领域高度相关的种子词;随后以互信息方法计算种子词与语料中的其他词汇共现概率(点互信息),同时以与种子词具有较高点互信息的词汇作为领域候选词,并结合人工审核方式对候选词汇进行调整。最后在对待识别语料进行文本表示的基础上,将其与词典中的领域词汇进行匹配,并以语料中出现的公共安全领域词汇的数量和权重来判断待识别语料是否为突发公共安全舆情事件。[结果/结论]在标注语料上的实验结果表明,与经典的Naive Bayes方法相比,提出的方法能够有效提高公共安全领域热点舆情事件的识别准确率。  相似文献   

20.
[目的/意义]知识通过跨学科引用输入目标学科,与目标学科知识合作产生跨学科知识生长点,刺激知识创新与生长。衡量跨学科知识生长点成长态势,有利于分析学科知识的交叉与融合、继承与创新,把握学科发展方向与进展。[方法/过程]文章基于动能理论与引文分析方法,提出输入推动力概念,从生长质量和传播速度两个方面构建跨学科知识生长点动能模型,测度跨学科知识生长点成长态势,并以图书情报领域为例进行实证分析。[结果/结论]研究发现,热点知识更容易受输入知识刺激生成跨学科知识生长点,并根据生长质量、传播速度和动能将跨学科知识生长点划分为成熟型、传播型和生长型三类。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号