首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
崔鸿飞  冯子函  张靖雨 《情报学报》2023,(10):1224-1237
丰富的互联网文献数据库是科研人员了解领域发展和前沿的重要资源,从全局视角对领域的海量科研成果进行高效信息挖掘,可以在知识洪流中为科研人员提供更加明确的方向。本研究基于经典生物医学文献数据库PubMed收录的发表于2010—2021年的13万篇文章,挖掘科研人员的历史行为信息,构建同时包含作者、论文、关键词的异质信息网络,利用异质信息网络表示学习算法metapath2vec将该网络嵌入成为异质向量空间,并通过计算异质向量空间中向量的相似度指标,同时实现科研合作者推荐与科研兴趣关键词推荐。与已有研究相比,本研究的方法更加重视多任务协同,不仅在新增的科研兴趣关键词的任务中获得了有意义的推荐结果,还显著提高了科研合作者推荐的准确度。同时,本研究在作者空间与关键词空间进行了深入挖掘,并证明其在科研兴趣的语义理解方面具有指导意义。本研究在科研兴趣的研究、挖掘与推荐方面提供了新的研究视角。  相似文献   

2.
[目的/意义]融合多元网络和网络表示学习方法学习并发现作者间的关联性,能够更好地进行合作者推荐。[方法/过程]文章首先搜集情报学领域相关文献数据作为原始数据集,在经过数据清洗后,根据作者间的多元关系构建各信息实体的多个科研信息网络,然后对高维网络利用Node2vec网络表示学习方法学习各节点的信息,从而得到各网络中节点的向量表示。其次,通过余弦相似度计算各网络中的作者相似度。最后融合作者间机构合作偏好和作者学术水平相似度得到最终的推荐结果。[结果/结论]文章提出的融合模型考虑了多元网络和数据稀疏性,在AUC值上的表现优于单一维度,得到了更好的合作预测效果。实验结果表明,该合作者推荐模型在情报学领域作者合作者推荐中具有可行性。  相似文献   

3.
[目的/意义]预测用户是否转发、评论通缉微博,研究及评估影响通缉微博传播的重要特征,有助于公安微博提升其运营绩效,增强警民之间的沟通和合作。[方法/过程]针对通缉微博的特点,在抽取通缉微博的用户特征、时间特征、微博文本结构特征的基础上,提取通缉微博中的案件特征,包含案件地点关键字、时间关键字、通缉令等级、有无悬赏等,利用xgboost算法计算不同特征在转发、评论预测中的重要性,并结合传播网络特征和节点属性,构建基于特征属性异质信息网络嵌入的公安微博传播预测模型,并对模型进行训练和评估。[结果/结论]预测模型在转发、评论数据集上的AUC值分别达到0.737和0.799。由于该模型融合了网络结构特征和不同节点属性,更贴近现实的异质信息网络,相比传统的链接预测模型精确度更高。另外,特征重要性实验结果表明,所提出的案件关键字特征在影响微博转发、评论预测的所有特征中重要性最高。  相似文献   

4.
在大数据环境下,科研合作是提高科研水平、促进科研产出的重要途径。如何在浩如烟海的学者、机构、领域信息中准确地找到与自身研究方向相近的合作对象是近年来科研合作预测的研究重点。本文通过科学学领域科学文献的记录数据,构建作者-作者、机构-机构、作者-机构、作者-关键词、机构-关键词的共现网络,接着通过网络表示方法学习作者、机构、关键词在所处网络中的语境信息,将信息实体表示成相同空间的低维稠密向量,最后根据表示向量的相似度计算实现合作对象、合作领域挖掘。通过网络表示学习方法能实现多种异质信息融合,定量计算各信息实体间的关联强度,可以很好地捕捉科研网络中学者-学者、学者-机构、学者-关键词的关系,准确地为学者挖掘潜在合作者、合作机构和关键词。  相似文献   

5.
[目的/意义]针对某些包含多级用户和多级资源的异质网络,在总结其各种异质模态的基础上提出一种多维度推荐框架MDRM,向目标用户进行好友和资源的推荐。[方法/过程]通过对用户、资源划分等级,在分析各种网络模态的基础上建立其异质关系;利用情感倾向分析得到二级用户——二级资源评分矩阵,借助协同过滤算法,实现同级用户和二级资源的推荐;基于异质关系,实现一级用户和一级资源的推荐,最终实现多维度推荐。[结果/结论]在以豆瓣网数据作为数据集的实验中取得了较好的效果,说明MDRM模型适合某些异质网络资源的推荐。  相似文献   

6.
科研领域知识的网络表示模型及应用研究   总被引:1,自引:0,他引:1  
科学研究中的科研领域拥有大量有价值的知识,如何将这些知识显性的表示出来,并在实际中有效的应用,是目前研究中的一个难点问题.本研究从知识管理的角度出发,首先依据科研领域知识的特点,构建了科研领域知识的网络表示模型,然后运用复杂网络理论对该模型进行分析,获得了模型的特性.再根据这些特点对网络进行了聚类降维,聚类降低了网络的表示维度和复杂度,在此基础上构建了更简单的知识树状结构模型.建构的网络模型能很好表示科研领域知识,而且在降维的基础上得到的树状结构模型具有更好的效果,并能方便地接入到计算机系统中.最后给出一个实例进行验证.  相似文献   

7.
余传明  李浩男  安璐 《情报学报》2020,39(5):521-533
随着大数据的迅速发展,知识网络在不同语言、不同领域和不同模态等情境下呈现高度多样性和复杂性,如何对齐与整合多源情境下的异构知识网络,成为研究者所面临的严峻挑战。本文在知识网络深度表示学习的基础上,提出一种由知识网络构建、跨语言网络表示学习和统计机器学习三个模块构成的知识网络对齐(knowledge network alignment,KNA)模型。为验证模型的有效性,在中英文双语知识网络数据集上开展实证研究,借助于网络表示学习算法将异构知识网络表征到同一空间,利用已知的对齐链接来训练统计机器学习模型,并通过模型来预测未知的节点对齐链接。KNA模型在跨语言共词网络对齐任务中取得Precision@1值为0.7731,高于基线方法 (0.6806),验证了KNA模型在跨语言知识网络对齐上的有效性。研究结果对于改进知识网络的节点对齐效果,促进多源情境下的异构知识网络融合具有重要意义。  相似文献   

8.
王日花 《情报工程》2023,(1):118-127
[目的/意义]通过分析图书馆的图书流通数据,本文提出一种基于时间兴趣因子融合网络学习的图书推荐模型—TIF_N2V_CF。[方法/过程]评估用户借阅图书的时间间隔并定义兴趣因子权重,根据流通数据构建同质关系网络;网络表示学习将得到的特征矩阵输入融合推荐模型并得到推荐结果。[结果/结论]实验表明,TIF_N2V_CF模型的召回率在top z=10和z=20时分别为0.1302、0.2031,高于未引入时间兴趣因子的N2V_CF模型。TIF_N2V_CF模型将时间兴趣因子引入到网络表示学习,对融合用户和图书的特征矩阵进行相似度计算,解决图书借阅流通数据中同一时间包含多本图书借阅记录造成的难以序列化的问题,缓解数据稀疏和冷启动对模型性能的影响,提高了推荐精度。  相似文献   

9.
科技文献跨语言推荐模型研究   总被引:1,自引:0,他引:1  
信息超载和语言障碍影响我国科研人员对外文科技文献的有效获取,如何提高获取效率成为亟待解决的问题。个性化推荐能很好地处理信息超载现象,但当前国内外相关研究都基于单一语种进行,多语种环境下的推荐研究非常缺乏。本文提出网络环境和海量数据背景下的科技文献跨语言推荐模型,并论证用户兴趣特征抽取、语言转换和混合推荐等步骤。利用Web日志挖掘技术,分析基于多种信息行为的整合分析方法抽取用户兴趣特征,以分类表作为参考体系建立用户兴趣表示模型,在用户—特征词转化为用户—类目矩阵的基础上开展推荐研究。  相似文献   

10.
情感倾向性分析旨在识别评论中隐含的情感信息,在产品声誉分析、舆情监控、个性推荐等方面具有广阔的应用前景.在评测消费者对新发布产品的态度时,本产品领域中可供参考的已分类评论数据往往较少,而其他相关领域可能存在大量的已分类的评论数据,利用其他产品已标注的评论数据对新产品进行情感倾向性分析,属于跨领域的情感分类问题.针对这一问题,本文引入迁移学习机制,将经典迁移学习TrAdaBoost算法的样本迁移机制应用于情感倾向性分析,并针对积极类和消极类分类精度不均衡问题提出了改进策略,首先根据评论样本权重进行第一次选择,其次结合分类置信度对评论样本进行第二次选择.实验结果表明,在整体分类精度有所提高的前提下,改进算法的优势在于均衡了积极类和消极类的分类精度,使得分类结果更具实际参考价值.  相似文献   

11.
12.
曹志鹏  潘定  潘启亮 《情报学报》2021,40(2):135-144
当前,针对知识网络的链路预测主要是基于网络拓扑结构的相似性,很少考虑作者的研究领域,导致信息利用不充分等问题,因此本文提出了双层知识网络的链路预测框架hypernet2vec。双层知识网络,即作者合著关系网络和学术领域关系网络,利用网络表示学习,分别将两层网络中的节点映射到低维的向量空间,再输入到专门设计的卷积神经网络中计算并进行链路预测。与经典的链路预测指标如RA指标、LP指标和LRW指标等相比,hypernet2vec模型预测的AUC (area under curve)值取得了显著的提升,平均提升幅度达11.17%。文章还从情报产生层面和复杂系统层面,对模型发生作用的深层机理进行了探讨。  相似文献   

13.
14.
[目的/意义]通过在标注资源丰富的源领域(Source Domain)中学习,并将目标领域(Target Domain)的文档投影到与源领域相同的特征空间(Feature Space)中去,从而解决目标领域因标注数据量较小而难以获得好的分类模型的问题。[方法/过程]选择亚马逊在书籍、DVD和音乐类目下的中文评论作为实验数据,以跨领域情感分析作为研究任务,提出一种跨领域深度循环神经网络(Cross Domain Deep Recurrent Neural Network,CD-DRNN)模型,实现不同领域环境下的知识迁移。CD-DRNN模型在跨领域环境下的平均分类准确度达到了81.70%,优于传统的栈式长短时记忆网络(Stacked Long Short Term Memory,Stacked-LSTM)模型(79.90%)、双向长短时记忆网络模型(Bidirectional Long Short Term Memory,Bi-LSTM)模型(80.50%)、卷积神经网络长短时记忆网络串联(Convolution Neural Network with Long Short Term Memory,CNN-LSTM)(74.70%)模型以及卷积神经网络长短时记忆网络并联(Merged Convolution Neural Network with Long Short Term Memory,Merged-CNN-LSTM)模型(80.90%)。[结果/结论]源领域和目标领域的知识迁移能够有效解决监督学习在小数据集上难以获得好的分类效果的问题,通过CD-DRNN模型能够从无标注数据中有效地筛选特征,从而大大降低目标领域数据标注相关的工作量。  相似文献   

15.
16.
刘非凡  张爽  罗双玲  夏昊翔 《情报学报》2021,40(11):1209-1220
准确地探测和识别学科领域知识结构对于理解学科发展动态、制定科技政策以及开展科研活动具有重要意义。当前,针对该问题的探索思路主要集中在两个方面:文本内容分析和网络结构分析。在现有的研究中,这两种研究思路往往仅作为相互辅证的依据,缺少同时融合文本信息与结构信息来探测领域知识结构的方法。因此,本文借助深度学习领域涌现出的新兴算法,把深度图神经网络模型与文档表示学习以及流形学习算法加以综合,提出新的学科领域知识结构探测框架。分别选取了代表基础研究学科与新涌现研究领域的两个数据集对所提研究框架进行验证,实验结果表明,深度图神经网络能够有效融合文献的文本内容特征信息以及其引用关系特征信息,提高了领域知识结构探测效率及可识别度。本文的研究拓展了深度图神经网络模型的应用场景,并对情报工程应用领域具有一定的借鉴参考价值。  相似文献   

17.
如何在信息时代增加馆藏资源的可见度,提高馆藏资源的利用率,是一个急需研究和解决的问题。实时新闻和图书馆馆藏资源间的连接可以提高图书馆馆藏资源的可见度,增加图书馆馆藏资源的利用率,为用户提供丰富、全面的阅读资料和专业知识,帮助用户形成全面、深入阅读和思考的良好习惯。基于快数据处理技术的实时新闻分析和馆藏资源推荐框架,通过分析网络实时新闻获取用户感兴趣的话题,应用快数据处理技术、潜在语义分析、非负矩阵分解、权重矩阵分解等方法对数据进行语义分析和处理,对图书馆馆藏资源进行相关话题的分类和推荐。对OCLC的百万数据集和雅虎新闻的分析和实验表明,这种资源推荐框架和方法有较好的应用效果。图2。表1。  相似文献   

18.
叶佳鑫  熊回香  易明  刘明 《情报学报》2022,41(4):364-374
在社交网络中,以用户群体作为服务对象来进行个性化推荐服务,能有效提升推荐效率。已有的研究在进行群推荐时大多仅考虑用户群体的整体兴趣,忽视了群体中用户间的相互影响。为此,本文提出了一种基于影响力传播的社交网络群推荐方法,综合考虑用户自身兴趣与其受核心用户影响而产生的兴趣来进行社交网络群推荐服务。以微博“超话”上的数据为例对本文所提方法进行验证,证明了本文所提方法的有效性,从研究结果来看,加入对影响力传播的考量能显著提升群推荐效果。  相似文献   

19.
20.
考虑专利技术主体间技术邻近、地理邻近、共申请关系、引证关系、经济圈效应、主体类型邻近、主体间从属关系这7种因素对交易的影响,构建由4类节点、10类关系组成的异构信息网络,设计基于元路径与元结构的异构关系遍历算法获取主体间关系序列。以关系序列为语料,构建基于网络嵌入的异构信息网络主体间交易推荐模型(PSR-vec),采用基于Huffman树的Skip-Gram方法进行网络嵌入训练,计算主体向量间相似度以实现交易推荐。通过2012-2018年电子信息领域专利数据的实证研究得出:第一,PSR-vec模型相比DeepWalk、node2vec与PathSim等方法,推荐精度大幅提高,达到82.4%;第二,融合多个元路径与元结构特征的推荐与单一特征相比,推荐精度大幅提高;第三,基于ρ2以及改进的元结构S4、S6、S8、S10、S12、S14的推荐结果均高于基于ρ1以及改进的元结构S3、S5、S7、S9、S11、S13的推荐精度,说明基于主体间转让技术邻近性的推荐精度更高;第四,在技术邻近元路径基础上分别融合主体间共申请、引证、从属、经济圈效应这4类邻近关系获得元结构并进行推荐,推荐精度均显著提高,而融合地理邻近、类型邻近2类关系后推荐精度有所降低,说明地理邻近、类型邻近对交易的促进作用不明显;第五,基于PSR-vec模型的推荐结果包括具有控股和供应等紧密关系的主体,也包括关系松散的主体,推荐结果具有多样性。本研究为专利技术主体间的有效对接提供了决策方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号