首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 578 毫秒
1.
[目的/意义]作者身份识别是语言文体学的重要研究方向,利用文本特征的身份识别也是文本挖掘的重要任务。在开放和虚拟网络环境下海量信息的作者身份或发布者的识别难题和传统作者身份识别方法在处理效率和成本等方面存在的问题有待解决。[方法/过程]将复杂网络理论引入该研究领域,在利用传统文体学特征识别作者身份方法的基础上结合文本词共现网络模型及其指标特征改进相关算法,使用文本文体学特征和文本网络模型度量指标构建作者风格特征集合,通过计算文本间风格相似度进行作者识别。[结果/结论]基于复杂网络模型的作者身份识别方法可以有效的利用作者风格特征,提高识别的精度,与其他算法的对比试验表明其识别结果的准确性更高。  相似文献   

2.
[目的/意义] 提出一种融合评论主题识别与技术属性多维度分析的技术机会发现方法,从技术需求驱动视角识别技术机会,为企业前瞻布局研发方向与进行科研管理规划提供决策建议支持。[方法/过程] 以产品在线评论为研究数据源,首先,利用LDA主题模型识别出评论技术主题,提出技术评论主题强度和主题新颖度两个指标,筛选出新兴重点技术评论主题。然后,从学术论文、技术专利中人工选取技术属性词,通过TF-IDF值计算得到评论高频词,结合专家知识进一步筛选出技术特征词,构建产品技术属性词-技术特征词表。通过相关性计算分别得到与评论相关和与新兴重点技术评论主题相关的技术属性。最后,提出一种产品重要技术属性识别指标模型并设计一种多维度分析方法,分析产品重要技术属性的特征情况,最终识别出蕴含在评论文本中的新兴技术机会。[结果/结论] 实验结果表明该方法能够有效地识别技术机会,为企业产品技术研发管理提供参考。  相似文献   

3.
[目的/意义] 科学网络中的重叠结构代表学科或领域之间的交叉渗透,从重叠结构的角度研究学科或领域之间的交叉渗透是一个值得探索的问题。[方法/过程] 通过构建ESI高被引论文的共被引网络,利用改进BGLL算法实现重叠结构探测,并结合Guimera和Amaral定义的Hub节点指标进一步分析具有跨学科属性的重叠关系链接。[结果/结论] 研究表明重叠结构可以直观地反映学科交叉的主题,并可以用于分析和探测潜在的跨学科领域。  相似文献   

4.
[目的/意义]基于大量专利文献数据的核心技术主题识别有助于识别某技术领域的关键技术、分析关键技术的发展方向,是进行技术创新的基础情报工作,对于研究人员、企业乃至国家层面都具有一定的意义。[方法/过程]提出基于Chunk-LDAvis的核心技术主题识别方法,首先基于经典LDA模型进行主题识别,然后利用名词组块对初始LDA主题识别结果进行标注,构建Chunk-LDA主题识别结果,提高其可解读性;然后基于社会网络分析方法构建主题网络,识别核心技术主题;基于R语言的LDAvis工具包绘制可交互的Chunk-LDAvis核心技术主题关联分析图谱,发现核心技术主题的隐含联系,辅助进行核心技术主题识别。[结果/结论]通过对纳米农业领域进行实证研究,验证了本文提出方法的准确性和可行性。  相似文献   

5.
[目的/意义] 为便于机构人才引进,构建领域核心团队识别规范化流程,从核心区域作者确定、团队指导/师承关系判别、团队发刊倾向和团队研究方向4个方面对领域核心团队进行挖掘研究。[方法/过程] 首先,进行数据前期规范;然后,结合作者合著无向二值矩阵与核心-边缘结构分析,划分核心区域作者,综合多维指标对核心区域作者进行适当调整;最后,基于第一作者与其他作者的有向合著网络,识别领域核心研究团队。[结果/结论] 在厘清团队指导/师承关系判别基本流程上,提炼通用性规律,包括:①在"外射星型"拓扑结构的合著团队中,处于中心位置节点有较高概率为导师/指导者,而"内聚星型"拓扑结构合著团队位于网络中心的作者科研能力较强;②在第一作者与其他作者的有向合著网络中,两个节点若同时具备第一作者与通讯作者关系、有相同的所属机构、学术年龄有一定差距,则这两个节点间一定存在指导关系,有较高的概率存在师承关系。  相似文献   

6.
[目的/意义]突破性创新对科技发展具有关键作用。大数据环境下,科学技术发展本身所具有的复杂、多维、不断进化等特征越发凸显。以动态视角进行突破性创新主题识别,对于为国家、企业及高校详析突破性创新领域、合理配置创新资源以及提供创新升级解决方案具有重要意义。[方法/过程]综合运用主题模型、词嵌入算法以及复杂网络分析等方法构建动态主题网络,全面考量主题在时间窗口内的结构特性以及时间窗口间的演化状态,并以其为基础结合突破性创新的新颖性、突变性、影响力和学科交叉性特征识别突破性创新主题。[结果/结论]面向区块链领域展开实证研究,识别出神经网络(Neural Network)和边缘计算(Edge Computing)两个主题的突破性创新特征最为显著。结合区块链现有研究及美国国家科学技术委员会发布的关键和新兴技术清单,验证了本文方法的可行性和有效性。但有关结果的定量验证,以及融合多源数据的突破性创新主题识别有待进一步研究。  相似文献   

7.
[目的/意义]衍生性网络健康谣言生成门槛低,周期性强,危害影响深远,是网络健康谣言识别与治理中需要优先解决的重点问题之一,也是重要突破口。[方法/过程]借助深度语义表征和聚合方法,探索衍生性网络健康谣言文本内容的六要素特征;通过结合网络健康谣言的分布式语义特征预训练模型,构建包括六个类别、6287个词汇的网络健康谣言文本内容要素词库;在将健康谣言标题特征、内容文本六要素特征以及主体内容文本特征进行统一的向量空间表示与融合后,构建面向多源文本特征融合的网络健康谣言识别模型。[结果/结论]模型的实证研究表明:与已有的对照模型相比,本文所提出的文本特征融合模型使衍生性网络健康谣言识别的准确率有较好的提升,且丰富的可拓展健康谣言要素词库可为后续的研究提供较好的资源支持。  相似文献   

8.
[目的/意义]为全面、客观、高效、直观地掌握科技领域主题的发展规律和演变趋势,提出一种基于多源数据的领域主题演化路径识别和分析框架。[方法/过程]获取不同来源的科技文献数据,利用多维样本有序聚类方法辅助时间切片,基于改进的词袋构建方法,提升LDA模型主题识别效果,借助Louvain社区发现算法在主题层进行多源数据的融合,分析领域主题演化路径。[结果/结论]利用美国太赫兹研究领域基金项目、论文和专利3种来源的数据进行实证研究,结果表明,3种数据源能够清晰划分出4个时间窗口,改进的词袋构建方法能够表征更准确的领域信息内涵,主题社区有助于从多源数据复杂的演化网络中厘清主题演化脉络。  相似文献   

9.
网络舆情信息语义识别关键技术分析   总被引:1,自引:0,他引:1  
[目的/意义]在梳理和分析主要网络舆情语义识别关键技术的基础上,详细分析网络舆情信息情感倾向性分析技术、网络舆情话题识别技术的现阶段研究状况。[方法/过程]从技术特征中提取出处理精度、技术复杂程度、通用性、适应性等指标,根据所提出的指标对网络舆情信息语义识别关键技术加以比较分析。[结果/结论]分析得出各类技术的优劣之处,挖掘其未来的发展方向,为有效开展舆情监测和管理实践提供参考。  相似文献   

10.
[目的/意义] 学科主题演化研究有助于掌握学科发展现状、研究热点、研究前沿和发展趋势等情况,是进行科技创新的基础,是面向科技创新的重要研究方向。[方法/过程] 提出一种语义分类的学科主题演化分析方法:将关键词分为研究问题、研究方法和研究技术3类,构建不同语义分类的共词网络;然后基于Fast Unfolding社区发现算法识别具有语义特征的社区(主题);利用相似度算法计算相邻子时期主题间的相似度,构建学科主题演化图谱,以分析某学科领域研究问题、研究方法和研究技术的变化,实现深度、细致的学科主题演化分析。[结果/结论] 通过对2012-2015年CNKI数据库收录的我国大数据研究领域相关论文数据的处理分析,证明该方法的准确性和有效性。  相似文献   

11.
[目的/意义]旨在研究肿瘤疫苗领域技术创新合作网络演化特征,为我国肿瘤疫苗领域的技术突破和产业发展提供思路。[方法/过程]提出一种产业技术创新合作网络演化特征分析方法和框架。首先引入专利指标法,通过技术生长率、技术成熟系数、技术衰老系数和新技术特征系数等指数的定量计算对肿瘤疫苗产业技术生命周期进行划分;其次利用社会网络分析法构建技术生命周期各阶段合作网络,从节点数、网络密度、中心势、核心-边缘分析等维度对合作网络的拓扑结构演化规律进行分析;从中心度、凝聚子群分析、创新机构等维度对核心个体演化规律进行分析,进而揭示肿瘤疫苗产业技术创新合作网络的动态演化特征。[结果/结论]以肿瘤疫苗战略性新兴产业为案例进行研究,验证方法的有效性和可行性,为肿瘤疫苗领域技术发展战略和技术合作提供理论依据。  相似文献   

12.
[目的/意义] 为更加客观地进行科研评价,激发我国科研创新,遏制学术不端,本文从遵循科学发展规律的角度进行分析,认为科研评价维度应多元化发展,并尝试提炼出创新力、影响力、传承力3个维度。[方法/过程] 首先,论述3个维度的产生机制、重要性、评价困境与进展、相互关系。其次,选取能够表征3个维度的指标进行实证研究,分析不同维度指数的相关性,不同维度指数关联评价的结果类型及发生概率,维度与扩散阶段融合评价的作用。[结果/结论] 得出的结论包括:科研评价指标体系中应确立不同的评价维度,且每个维度下都具有丰富的指标;应明确每种科研指标所表征的维度;评价时宜综合采用多种指标;重视区分创新扩散阶段的融合评价。并对"创新力-影响力-传承力"的评价维度以及更广泛意义上的多维评价的应用前景进行展望,包括增强科研评价的灵活性、针对性、客观性和解释力;对于潜在人才和创新的发现;为评价指标从基于数量到基于网络结构的跃升提供广阔空间;避免"评价陷阱";鼓励深层次研究和创新发现,匡正学术风气;引导学术出版和写作规范;增强同行评议的洞察力。  相似文献   

13.
袁润  钱过 《图书情报工作》2015,59(2):123-130
[目的/意义]研究应用粗糙集理论分析专利信息的可行性及其方法,建立识别核心专利的粗糙集理论模型。[方法/过程]综述国内外研究核心专利识别的相关文献,确定包含8个指标的核心专利识别指标体系,再用粗糙集理论分析专利信息数据,确定各指标的权重系数,按照计算的核心专利综合指数(CICP)大小将某特定技术领域的专利信息序列分为核心专利、关键专利、重要专利和一般专利。[结果/结论]以通信领域的976件专利数据为分析样本,运用本文核心专利识别模型识别出11件核心专利,其中包含获得中国专利奖的专利,核心专利识别结果在一定程度上表明核心专利识别模型的可行性和科学性;本文核心专利识别模型具有一般性,可应用于分析研究专利价值及其重要性。  相似文献   

14.
黄颖  叶冬梅  丁凤  徐畅  张琳 《图书情报工作》2022,66(22):142-154
[目的/意义] 开展面向特定技术领域的技术演化路径识别,有助于梳理技术发展脉络进而对未来的技术发展方向做出合理预测,对识别科技优先领域、合理配置科技资源具有重要意义。[方法/过程] 在梳理技术演化与技术演化路径的相关内涵的基础上,简要辨析了技术演化路径相关概念;进而从专利文献中的不同信息出发,从专利分类、专利引文、专利文本以及融合多种字段信息来总结技术演化路径识别研究的主要进展,并进一步归纳出该主题的整体发展趋势。[结果/结论] 技术演化路径识别研究主要趋势包括:数据来源从单一数据转向多源异构数据融合,研究方法从注重定量转向定性与定量相结合,关注视角从历史演化路径识别转向未来演化路径预测,应用场景由一般性技术到颠覆性技术转变。  相似文献   

15.
主题词组合新颖性与论文学术影响力的关系研究   总被引:1,自引:0,他引:1  
[目的/意义] 研究学术论文内容的组合新颖性与其学术影响力的关系,为研究论文的学术影响力提供新的研究视角。[方法/过程] 采用文本挖掘方法对论文题目、摘要和关键词中的主题词进行提取,通过构建领域主题词共现网络,为每篇论文设计了新颖组合率、中等组合率和常规组合率3个指标,将领域论文划分为不同的新颖性/常规性类型,然后对不同类型论文中高被引论文所占的比例进行统计分析。[结果/结论] 同时具有主题词组合高新颖性和高常规性特点的论文成为高被引论文的几率显著高于其他类型的论文,因此建议研究者在科学研究中应注重新颖知识与常规知识的适当组合。  相似文献   

16.
[目的/意义]为了更好地揭示主题研究领域跨学科发展的学科对象和研究内容,提出一种综合的跨学科态势分析方法。[方法/过程]首先,根据主题领域确定涉及到的所有学科类别,并定义学科影响力指数,构建学科影响力网络。然后,对学科影响力网络进行中心度、结构洞和可视化分析,识别核心学科类别。最后,构建关键词-学科类别共现网络,使用网络中心度分析获得由关键词表示的主题内容,并结合核心学科类别和领域专家意见获得跨学科主题内容。[结果/结论]实证表明提出的分析方法能够在一定程度上揭示主题研究领域跨学科发展态势,其有效性得到一定程度的验证。  相似文献   

17.
[目的/意义] 立足计量视角,通过对新兴技术特征的量化评价识别“目前处于科学研究阶段、尚未完全进入产业研发落地”的新兴技术。[方法/过程] 借助Node2Vec网络表征方法,从术语共现网络中学习技术术语的向量表示;以此为基础量化新兴技术“过去、现在及未来”三大时间维度特征-“融合性、新颖性及潜在的科学影响力”,用特征值筛选技术主题是否具有新兴性,由此探索得到向量表征视角下的新兴技术识别模型。最后以航空领域为例进行实证研究,验证该方法的科学性和合理性。[结果/结论] 通过引入“术语向量表征”的计算视角,有效编码了术语实体间显性和隐性的关联关系,提升了新兴技术特征计算的客观性;同时结合技术的历史、当前和预测信息,从网络结构和语义特征两方面进行识别,取得了较好的效果。  相似文献   

18.
Identifying research fronts is an essential aspect of promoting scientific development. Many researchers choose their research directions and topics by analyzing their field's current research fronts. Many previous researchers have used academic papers or patents to identify research fronts; however, this is potentially outdated and reduces the prospective value of the research front detection. Considering this, this work proposes adapted indicators to conduct research front topic detection based on research grant data, which aims to identify research front topics and forecast trends using path analysis. First, research topics were identified using topic modeling, and then the mapping relations from topics to both fund projects and cross-domain categories were built. Then, research front topics were detected by multi-dimensional measurements, and the evolution of research topics was analyzed using topic evolution visualization to predict development trends. Finally, the Brillouin index was used to measure the cross-domain degree. Our method was evaluated using a dataset from the field of health informatics and was shown to be effective in research front identification. We found that the proposed adapted indicators were informative in identifying the evolutional trends in the health informatics field. In addition, research grants with higher cross-domain degrees are more likely to receive a high amount of funding.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号