首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 375 毫秒
1.
[目的/意义]针对专业领域研究人员难以从大量无监督文本数据中快速获取领域关键知识,以精准把握专业研究方向和内容。[方法/过程]文章提出一种基于迁移学习领域自适应的文本关键词提取模型。首先通过采集中国知网中特定领域的文章和关键词,将其作为目标域数据,将待提取关键词的无监督文本作为源域数据,通过最小化二者间的共享相似特征和关键词分类交叉熵,实现关键词提取方法的跨领域迁移,完成对无监督领域文本的关键词提取任务。[结果/结论]对1313篇“人工智能风险”主题的文章进行领域关键词提取,实验表明该领域关键词提取模型相比于BiLSTM-CRF、TF-IDF模型提取效果提升显著,在领域关键知识提取场景中有较强应用价值。  相似文献   

2.
[目的/意义]构建社交平台用户隐私协议文本规制评估模型框架,规范社交平台用户隐私保护协议及提升协议规制评估效率。[方法/过程]首先,结合用户隐私关注研究、用户隐私保护相关法规文本、社交平台用户隐私保护规制研究进行规制指标提取,并在指标融合的基础上构建规制评估框架模型;其次,基于规制框架模型,对获取的社交平台隐私协议进行分类模型训练数据的人工标注;最后,通过对部分文本数据训练,获得分类效果最好的模型参数,进而对收集到的33个社交平台用户隐私保护协议文本进行分类及规制评估。[结果/结论]社交平台用户隐私协议的规制结果显示,其存在内容缺失、内容粗糙、权责不明在内的多层问题,基于此从政策监督主体、平台、用户维度出发细化完善保护策略。[局限]人工编码和筛选有一定的主观性,选取的社交平台类型多而总量不大。  相似文献   

3.
[目的/意义]构建基于机器学习的成本法专利价值评估方法,快速识别海量专利的实际成本,并预测其价值区间,在为专利价值评估提供新研究思路的同时,也为专利转移转化定价提供了参考借鉴。[方法/过程]通过Innography数据库与Incopat数据库下载“新能源汽车”领域多指标专利数据,提取专利成本影响因素与专利价值影响因素,并形成专利数据训练集与专利数据预测集;构建AutoGluon机器学习分类算法,将包含成本数据的Innography专利数据训练集导入模型进行训练,并将训练好的模型对Incopat专利数据预测集进行成本预测;最后使用成本法并结合本研究提出的专利价值指数对预测结果进行计算,估算其价格区间。[结果/结论]通过实证分析与结果验证可知,本研究构建的基于机器学习的成本法专利价值评估方法在预测专利价值区间中具备一定有效性,为促进专利价值评估研究深化及专利转移转化定价实践发展提供了参考。  相似文献   

4.
[目的/意义]对多媒体网络舆情是否进入衰退期进行评估,丰富多媒体网络舆情相关研究。[方法/过程]通过文献调研法构建多媒体网络舆情衰退期形成的评估指标体系,采集案例数据并利用BP神经网络对构建的指标体系进行评估。[结果/结论]文章构建的多媒体网络舆情衰退期形成的评估指标体系具有一定的可行性和实用性,能够对多媒体网络舆情是否进入衰退期进行有效评估。  相似文献   

5.
[目的/意义]专利关键词提取是专利挖掘任务中非常重要的前置子任务,基于图模型的关键词提取是目前最有效的算法。传统图模型只考虑了单词的局部上下文信息,为了捕获单词的全局信息,提出一种基于图神经网络的专利关键词提取算法,结合词向量与图模型实现专利关键词的提取。[方法/过程]首先,用专利数据集构建异构网络,以专利分类号为标签,训练图神经网络模型,使得同一主题下的单词具有相似的向量表示,获取包含主题信息的词向量;然后,根据专利摘要在滑动窗口内的单词共现关系和词向量相似度,构建融合了单词主题信息的文本图,利用词向量中的主题信息捕获单词的全局联系;最后,在文本图上使用PageRank算法,获取关键节点,构成专利的关键词。[结果/结论]与基线方法相比,该算法在提取专利关键词时,能够检测到新颖性与准确性更高的关键词。  相似文献   

6.
[目的/意义]理解用户需求是企业管理实践中的重要一环,在线评论作为用户偏好表达的重要渠道,是企业发现用户需求的重要数据来源。因此,如何从在线评论中有效挖掘出用户需求,是一个重要的研究问题。[方法/过程]文章构建了一个基于KANO模型、面向在线评论的用户需求分析框架。首先利用LDA主题模型从在线评论中抽取商品属性,然后基于BERT模型标注出不同属性上的评论短句,并对其进行情感分析,最后依据不同属性上的评论短句与情感分析结果,通过KANO模型分析用户属性需求。以手机评论数据为例对模型进行验证。[结果/结论]将商品属性分为必备属性、期望属性、魅力属性与无差异属性四类,并以可视化结果呈现。实验结果表明面向在线评论的用户需求分析框架能够有效提取在线评论中用户的属性需求信息,为企业提供产品改进策略参考。[局限]样本数据集有限,存在不均衡状况。  相似文献   

7.
高劲松  黄梅  付家炜 《现代情报》2021,40(12):130-139
[目的/意义] 能以简洁的可视化来追踪某学科研究热点随时间的变化趋势,对于掌握学科研究热点的动向具有重要意义。词频分析法是学科研究热点分析方法之一,目前存在众多的基于词频分析的可视化工具,但是这些可视化工具能够以简洁的可视化形式清晰地展现年度热点存在局限性。[方法/过程] 因此本文提出通过学科领域年度发文量与学科全部发文量的比值来衡量年度热点关键词对总年度热点关键词贡献率的可视化方法:基于年度贡献率与二八定律设定并调整阈值参数来控制年度高频关键词的呈现数量,将选取的年度高频关键词按照词频大小与年份依次排序以实现研究热点可视化。[结果/结论]以"关联数据"领域为例进行实证研究,通过分析本文方法提取的高频关键词与现有高频词阈值算法的匹配情况,对比本文方法与Citespace共现图谱的可视化呈现效果,对本文方法的可行性进行检验与评价。  相似文献   

8.
[目的/意义]围绕图书功用分类问题,提出开展图书功用自动化分类研究,并融合预训练和深度学习方法进行实现方案设计,为图书功用属性揭示和信息组织提供参考。[方法/过程]文章基于功用视角进行图书分类体系调研与数据验证,构建图书功用分类体系框架。在此基础上,融合BERT预训练模型和BiLSTM模型构建图书功用分类模型,并基于大规模数据集进行实验验证。[结果/结论]实验结果显示,模型的准确率达到0.89以上,召回率达到0.87以上,总体效果相对较好,能够较为准确地实现图书功用特征的提取。  相似文献   

9.
[目的/意义]理解用户需求是企业管理实践中的重要一环,在线评论作为用户偏好表达的重要渠道,是企业发现用户需求的重要数据来源。因此,如何从在线评论中有效挖掘出用户需求,是一个重要的研究问题。[方法/过程]文章构建了一个基于KANO模型、面向在线评论的用户需求分析框架。首先利用LDA主题模型从在线评论中抽取商品属性,然后基于BERT模型标注出不同属性上的评论短句,并对其进行情感分析,最后依据不同属性上的评论短句与情感分析结果,通过KANO模型分析用户属性需求。以手机评论数据为例对模型进行验证。[结果/结论]将商品属性分为必备属性、期望属性、魅力属性与无差异属性四类,并以可视化结果呈现。实验结果表明面向在线评论的用户需求分析框架能够有效提取在线评论中用户的属性需求信息,为企业提供产品改进策略参考。[局限]样本数据集有限,存在不均衡状况。  相似文献   

10.
[目的/意义]学术论文评价是科研评价的基础,是科研管理和评价的刚需。目前基于引文和论文内容视角构建的论文评价模型效果仍有提升的空间。[方法/过程]首先,利用复杂网络分析法,从文献相似性网络的节点属性构建论文重要性评价模型,探讨从文献网络的角度评价论文质量的可行性。其次,选择8个医学相关学科,下载数据形成8个文献数据集,根据论文被Faculty Opinions数据库收录的情况,事先标记为重要论文和普通论文。再次,从论文的主题词、题目摘要和参考文献3种信息源分别构建基于医学主题词表树状结构、Doc2Vec算法和文献耦合的3种文献相似性网络,并对每一种文献相似性网络,利用复杂网络分析方法对网络中的节点进行特征计算,选择具有统计学差异的节点属性指标作为区别两类论文的评价指标。最后,采用4种机器学习算法对数据集中的论文进行二分类学习,构建并评估论文重要性评价模型。[结果/结论]基于文献网络进行论文评价的方法是可行的,3种文献网络构建算法效果差异较小,语义相似性文献网络和文献耦合两种算法略优于基于Doc2Vec的算法。BP神经网络算法在基于文献网络构建的论文重要性评价模型中性能最好。  相似文献   

11.
[目的/意义]《中国制造2025》计划中提出推进干支线飞机、直升机、无人机和通用飞机产业化。分析我国直升机研究中的学科交叉现象,对我国直升机的科学研究与产业化提供参考。[方法/过程]从直升机研究中论文的自身学科属性与关键词两个角度出发,对直升机研究的学科交叉进行分析。通过关联网络的绘制,分析多个学科交叉下学科共现,关键词与学科共现,得到直升机研究中学科交叉的主题与特征。[结果/结论]我国直升机研究呈现多学科互相交叉但交叉程度不同的特点,不同学科在直升机研究中占据不同地位,且学科与关键词共现也体现了学科之间存在交叉关系,控制理论与方法是直升机研究中的关键。  相似文献   

12.
[目的/意义]探索不同社会科学学科间差异,支持学科建设、科技检索服务,进一步完善文献学科的分类体系。[方法/过程]基于多种深度学习模型和预训练语言模型构建社会科学文献学科分类器,利用CSSCI目录中的20多个一级学科中近350万篇文献构成的数据集进行实验;利用Sentence-BERT输出摘要句子向量并进行层次聚类,根据聚类结果划分学科组,并计算模型对于不同学科组的分类性能以缓和学科交叉的影响;利用模糊准确性指标输出模型对每条记录输出的前N个高概率学科以弥补原有学科分类的局限性。[结果/结论]在“摘要+标题”上使用深度预训练语言模型取得最佳性能;基于层次聚类所得的学科组进行的分类较单一学科性能有所提升;模型的模糊准确性在N=3时能够达到96%。[局限]未考虑从全文文本上获取更丰富的文献学科特征进行自动分类。  相似文献   

13.
[目的/意义]大数据环境下,传统的竞争对手识别方法存在局限性,文章针对这种不足提出了一种能够适应大数据环境的竞争对手识别方法。[方法/过程]第一,基于互联网下顾客价值领先战略,从消费者角度出发,选择基于消费者情感特征的竞争对手评价体系;第二,以顾客评论作为数据源,通过对评论文本分析,提取顾客关注的产品特征;第三,基于文本情感分析技术计算企业相应产品特征的顾客情感得分;第四,基于自组织神经网络(SOM)构建竞争对手识别模型,并根据模型结果识别目标企业竞争对手。[结果/结论]使用酒店行业顾客评论数据进行实验,证实了该方法能够在大数据环境下快速、高效、客观地识别企业竞争对手。  相似文献   

14.
[目的/意义] 我国专利数量巨大,但质量高低不齐。高质量专利对技术追踪、技术引进和资产管理极其重要,低质劣质专利则会阻碍科技创新的评估。聚焦高质量专利并进行挖掘可以获取更加深层与核心的情报,但高质量专利筛选却如"大海捞针",目前尚无可行的识别筛选方法。探索适合中国专利的高质量专利评价模型及筛选方法迫在眉睫。[方法/过程] 通过文献调研法对当前专利质量及评价进行综合归纳的基础上,延伸并界定高质量专利的内涵,对专利质量评价维度及指标进行创新拓展,构建分级、分层的多维视角专利质量评价指标体系,并基于创新指标体系建立高质量专利识别方法流程模型,最后以上海市高质量专利分布现状为例验证了方法模型的实用性及可行性,并为创新主体提出相应建议。[结果/结论] 研究结果表明本文提出的高质量专利指标模型及识别方法具有较强的科学性和可操作性,利用该指标模型和识别方法可对某地区或某领域的大批量专利进行筛选识别,为实现专利技术情报的科学高效利用提供有价值的参考。  相似文献   

15.
【目的/意义】探索论文学术创新力指标体系中特征的重要性,为学术创新力评价研究提供基础。【方法/过 程】系统梳理学术创新力评价相关研究,根据对现有成果的分析以及对学术创新力内涵的研究,提取学术创新力相 关的特征指标,并给出特征指标的计算方法。经过分析比较,选择动态网络测度法计算论文创新力,并通过散点图 分析单个特征与创新力之间的相关性,分析单个特征对创新力的影响机制。【结果/结论】各指标特征与论文学术创 新力不是简单线性关系,不能简单使用传统指标体系来评价学术创新力,需要探索机器学习方法进行评价。【创新/ 局限】从新的视角研究特征指标体系,通过对机器学习模型的实证分析得到各个特征对创新力评价的重要性程度, 筛选出真正与学术创新力相关的特征,对原始指标体系进行更正。  相似文献   

16.
[目的/意义]为提高新兴技术主题识别的全面性、准确性,在专利、论文信息的基础上,融入舆情信息,提出一种复合型的新兴技术主题识别方法,以期能为微观层面新兴技术主题识别方法的研究提供参考。[方法/过程]面向专利、期刊论文、学位论文、会议论文、舆情共5种不同的科技文献类型,运用LDA模型从多源异构文本中获取主题词,并进行融合分析,提取候选新兴技术主题;设计识别指标体系,弥补现有指标体系缺乏未来前景相应指标的不足;运用CRITIC法进行综合评价,确定最终的新兴技术主题。[结果/结论]以智能网联汽车为实验对象,成功识别出多传感器融合信息技术这项新兴技术,实验结果与业界分析保持一致,说明多源信息视角下的多指标新兴技术主题识别方法能有效地对多源异构文本开展新兴技术的主题识别。  相似文献   

17.
[目的/意义]开放政府数据质量问题影响数据价值释放,成为开放政府数据实践可持续发展的痛点和难点问题。[方法/过程]通过对开放政府数据评估相关的代表性中英文文献、国际和国家标准、重要国际评估项目的文本分析,使用修正德尔菲法和层次分析法构建了开放政府数据质量评估指标体系。选择北京市公共数据开放平台上发布的数据作为实证研究样本,使用专家评议法和模糊综合评价法对北京市开放政府数据质量进行评价。[结果/结论]从针对性、科学性、系统性、有效性和可操作性对开放政府数据质量评估指标体系的构建过程与结果进行总结与讨论,并进一步提出未来研究建议。  相似文献   

18.
[研究目的]基于专利寿命视角,探究潜在高价值专利识别方法,快速精准识别早期高价值专利。[研究方法]结合已有专利价值评估的相关研究,构建潜在高价值专利评估指标体系;以无线网络通信技术领域为例,构建潜在高价值专利识别指标数据集;采用Lasso回归对指标进行约简,构建潜在高价值专利识别特征集;采用机器学习生存预测算法构建专利生存风险预测模型,根据设置的生存风险评分阈值,实现潜在高价值专利识别。[研究结论]构建了基于专利寿命视角的潜在高价值专利识别模型,并且以无线网络通信技术领域专利数据验证了模型的有效性和可靠性,证明该模型可以较好地识别早期高价值专利,有利于企业和决策部门较早进行高价值专利的定向培育。  相似文献   

19.
[目的/意义]利用本体对重大突发事件下网络舆情信息源及要素等进行分析,更好地管理与组织相关数据,为设计重大突发事件网络舆情案例数据库奠定基础,进而辅助政府进行精准决策。[方法/过程]分析并提取异源平台网络舆情数据属性与属性值,依据舆情传播过程及要素分析本体核心概念、数据属性及关系,利用UML完成本体数据模型的构建。[结果/结论]为各类突发事件网络舆情异构信息源统一描述、组织、存储与管理建立了数据模型,为各类突发事件进一步应急决策与防范提供了有力支持。[局限]文章对数据模型的研究未进一步细化和解释相关概念、关系和数据属性,也未完成数据库存储平台的实际搭建并对数据的属性、属性值及数据类型进行深入分析。  相似文献   

20.
[目的/意义]基于科技文献构建问题—方法矩阵,探索科技文献研究内容新颖性评估方法,辅助科技查新应用。[方法/过程]对科技文献内容进行信息抽取,提取研究问题和方法内容文本并构建问题—方法矩阵。利用LDA模型对科技文献采用的问题与方法进行分类,将科技文献在问题—方法矩阵中定位并可视化。通过设定阈值划分区域,确定待评估科技文献研究问题和方法所在区域,进行新颖性评估分析,并通过实验验证该方法的有效性。[结果/结论]提出的基于问题—方法矩阵的文献新颖性评估方法通过可视化方式不仅有利于辅助科技查新判断,还可服务于创新选题。[局限]基于科技文献的研究问题与方法信息抽取和新颖性评估计算的自动化方法有待进一步研究。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号