首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
文奕  陈文杰  张鑫  杨宁  赵爽 《现代情报》2018,38(4):112-117
[目的/意义]专利信息是人类科学技术进步的结晶,随着社会的发展,专利信息将为促进科技创新发挥日益重要的作用。利用聚类技术可以将海量专利信息进行自动分类,在实现信息有序归并管理的同时,有助于用户高效而全面的获取相关技术领域中的集成专利信息,具有重要的现实意义,传统聚类研究方法效率与准确度存在不足。[方法/过程]本文通过对专利信息服务网站(中国科学院知识产权网)访问日志数据的清洗与分析,生成专利信息点击序列,基于深度学习词嵌入模型,设计了PatentFreq2Vec模型,计算得出专利关联信息。[结果/结论]利用PatentFreq2Vec模型分析计算访问日志数据,能够得到关联专利信息,实现专利聚类,且聚类准确度高于传统方法。  相似文献   

2.
[目的/意义]构建基于机器学习的成本法专利价值评估方法,快速识别海量专利的实际成本,并预测其价值区间,在为专利价值评估提供新研究思路的同时,也为专利转移转化定价提供了参考借鉴。[方法/过程]通过Innography数据库与Incopat数据库下载“新能源汽车”领域多指标专利数据,提取专利成本影响因素与专利价值影响因素,并形成专利数据训练集与专利数据预测集;构建AutoGluon机器学习分类算法,将包含成本数据的Innography专利数据训练集导入模型进行训练,并将训练好的模型对Incopat专利数据预测集进行成本预测;最后使用成本法并结合本研究提出的专利价值指数对预测结果进行计算,估算其价格区间。[结果/结论]通过实证分析与结果验证可知,本研究构建的基于机器学习的成本法专利价值评估方法在预测专利价值区间中具备一定有效性,为促进专利价值评估研究深化及专利转移转化定价实践发展提供了参考。  相似文献   

3.
郑皓  许琦 《情报探索》2021,(4):22-28
[目的/意义]旨在揭示某领域技术发展历程。[方法/过程]在深化、拓展连接度算法基础上,提出一种专利引证主路径分析算法。按照有界深度优先搜索策略,运用搜索路径遍历数测度专利引证路径权重,遵循遍历数局部最优法则,寻找贯穿整个专利引证网络的主路径。在燃料电池领域开展实证研究,采集专利数据和专利引证数据,构建燃料电池领域专利引证网络。应用Pajek作连接度分析,挖掘得到了燃料电池领域的主路径。[结果/结论]极少数专利引证路径聚合绝大多数权重,体现了主路径挖掘效果,验证了本文算法的可行性和有效性。  相似文献   

4.
[目的/意义]精准识别潜在专利技术组合,将相互关联的技术组成保护范围更大的专利网,对于打破单项专利的局限性、构建更为缜密的技术壁垒具有重要意义。[方法/过程]首先在对关键词与核心IPC进行语义抽取的基础上,筛选出核心专利集合,然后计算基于专利相似性与互补性的专利组合强度,最后利用MCL聚类算法直观、精准地识别潜在专利组合,并以艾滋病疫苗领域专利对方法进行了验证。[结果/结论]该方法以核心专利集合为数据源有效降低了组合识别中的噪音,基于多维度的专利组合强度计算克服了以往组合识别指标的片面性,利用MCL聚类算法无需人为规定簇群数量,保证识别质量。  相似文献   

5.
[目的/意义]本文探讨挖掘技术和应用间的关联关系,便于把握技术的目标应用场景和了解应用需求的可选技术方案,为技术转化提供基础。[方法/过程]首先,建立基于改进GloVe词向量的"技术——应用"发现模型,提出改进词向量的算法;然后,以机器学习技术为例,获取该领域学术论文文摘数据,预处理后建立训练文本集合,再使用改进GloVe模型训练获得词向量;最后,对词向量聚类获得"技术"和"应用"类词汇集,通过共现获得两者之间的关联并分析。[结果/结论]实验结果表明,本文改进GloVe模型后训练的词向量性能获得提升,聚类效果好,最终实现"技术——应用"的关联分析。  相似文献   

6.
[研究目的]基于专利寿命视角,探究潜在高价值专利识别方法,快速精准识别早期高价值专利。[研究方法]结合已有专利价值评估的相关研究,构建潜在高价值专利评估指标体系;以无线网络通信技术领域为例,构建潜在高价值专利识别指标数据集;采用Lasso回归对指标进行约简,构建潜在高价值专利识别特征集;采用机器学习生存预测算法构建专利生存风险预测模型,根据设置的生存风险评分阈值,实现潜在高价值专利识别。[研究结论]构建了基于专利寿命视角的潜在高价值专利识别模型,并且以无线网络通信技术领域专利数据验证了模型的有效性和可靠性,证明该模型可以较好地识别早期高价值专利,有利于企业和决策部门较早进行高价值专利的定向培育。  相似文献   

7.
周洪  魏凤  王辉 《情报理论与实践》2023,(12):149-156+182
[目的/意义]多技术融合已成为当前科技创新的重要特征,开展多元技术融合过程和预测研究,识别技术融合的趋势和规律,有助于支撑国家战略决策、企业研发策略制定。[方法/过程]提出一种基于高阶网络的技术融合预测方法,通过三元技术融合过程分析和高阶链路预测,预测特定领域的多元技术融合。首先,以专利分类号为节点,采用单纯复形方法构建专利技术高阶网络;其次,结合边的形成和加强,分析三节点组的形态和三角形闭包事件的过程;最后,构建训练集和测试集,从12个模型中获得效果最佳的相似性指标,开展三元技术融合预测。[结果/结论]以人工智能领域进行实证研究,发现边的加强对于三角形闭包事件具有重要意义,成功预测了F16M、G06F、G06N等三节点组发生三元技术融合,验证了方法的有效性。  相似文献   

8.
[目的/意义]金融科技包括的技术主题及范围边界并不清晰,使得“IPC分类号+关键词”的传统专利检索和分类方法效果不佳,需要针对跨领域专利数据的分类及识别流程进行研究。[方法/过程]构建了一套结合文本挖掘、层次聚类、置信学习和自然语言处理等技术的方法流程,能够直接从专利说明书中获取分类体系并形成相应分类模型。[结果/结论 ]提出一种构建跨领域专利分类体系及自动识别方法的流程框架,形成了较为全面、客观的金融科技专利技术分类体系,以及较为准确高效的分类模型,并对国内金融科技专利的发展情况进行了分析。[创新/局限]未来可基于Bert等大规模预训练模型的Prompt Tuning方法,进一步降低人工参与成本并提升效率。  相似文献   

9.
[目的/意义]为了实现从非结构化的在线评论中有效提取用户需求,文章提出了数据驱动下产品需求识别的方法。[方法/过程]利用Word2vec表示学习方法,获取评论文本内容的语义向量表示;结合K-means算法和LSA模型实现评论文本聚类,识别产品需求主题;在此基础上,通过网络分析方法探索需求主题间的关联关系。以华为手机的评论数据为例进行方法验证。[结果/结论]结果表明,基于语义的文本特征可以取得较好的聚类效果,与传统方法相比,CH指标和SC指标均得到显著提高,验证了该方法的有效性。研究方法和结果能够为企业产品创新和运营决策提供一定参考。[局限]样本数据集规模不够,缺少跨平台实验计算和比较。  相似文献   

10.
[目的/意义] 采用企业专利大数据,构造高维云模型,预测企业成长性。[方法/过程] 选取中国股票市场创业板公司为研究对象,依据企业专利聚类结果,用逆向云模型多步式算法生成专利的云模型改造神经网络神经元,构造云模型;用因子分析计算企业的成长性并通过聚类分析分成4类;用云模型补充不平衡数据。[结果/结论] 研究表明,高维云神经网络能很好预测企业的成长性,准确性和稳定性得到提高,同时也表明企业专利对其成长性有重要作用。企业专利对成长性的影响是复杂的:专利同族数、发明专利占比、专利权利要求数对企业的成长性促进作用,而单纯专利数量有负面的影响。  相似文献   

11.
[目的/意义]围绕图书功用分类问题,提出开展图书功用自动化分类研究,并融合预训练和深度学习方法进行实现方案设计,为图书功用属性揭示和信息组织提供参考。[方法/过程]文章基于功用视角进行图书分类体系调研与数据验证,构建图书功用分类体系框架。在此基础上,融合BERT预训练模型和BiLSTM模型构建图书功用分类模型,并基于大规模数据集进行实验验证。[结果/结论]实验结果显示,模型的准确率达到0.89以上,召回率达到0.87以上,总体效果相对较好,能够较为准确地实现图书功用特征的提取。  相似文献   

12.
[目的/意义]探索不同社会科学学科间差异,支持学科建设、科技检索服务,进一步完善文献学科的分类体系。[方法/过程]基于多种深度学习模型和预训练语言模型构建社会科学文献学科分类器,利用CSSCI目录中的20多个一级学科中近350万篇文献构成的数据集进行实验;利用Sentence-BERT输出摘要句子向量并进行层次聚类,根据聚类结果划分学科组,并计算模型对于不同学科组的分类性能以缓和学科交叉的影响;利用模糊准确性指标输出模型对每条记录输出的前N个高概率学科以弥补原有学科分类的局限性。[结果/结论]在“摘要+标题”上使用深度预训练语言模型取得最佳性能;基于层次聚类所得的学科组进行的分类较单一学科性能有所提升;模型的模糊准确性在N=3时能够达到96%。[局限]未考虑从全文文本上获取更丰富的文献学科特征进行自动分类。  相似文献   

13.
[研究目的]缺乏成熟的专利价值评估系统作为参考,是当前高校专利高产出却低转化的重要原因之一。对于非市场基准的专利价值评估方法而言,各项指标对评估模型的影响度不一且没有统一标准。使用深度学习的方法构建专利价值评估体系可以有效降低人为筛选的主观倾向性,从而提升专利价值评估效率。[研究方法]基于锚定效应理论,重点选取专利发明人的历史专利转化特征作为锚定指标,构建了基于注意力机制的深度学习模型,对高校专利价值进行评估和预测。引入的注意力机制可自适应地强调关键指标,一定程度上避免了先前研究中人为筛选的主观因素影响。[研究结论]通过采集1540条电子信息相关方向的高校专利价值数据进行深度学习实验,构建的基于深度注意力机制的模型在测试集上平均预测准确率达96.88%,证实该评估方法具有高准确性和强实用性,且研究发现发明人的历史专利转化价值对于专利价值评估具有显著的信息锚特征。  相似文献   

14.
[研究目的]为提高专利知识图谱构建的自动化水平,并实现知识服务与交易服务的融合,提出了面向供需信息挖掘的供需知识图谱(PSD-KG)的构建思路。[研究方法]知识图谱规划方面,对专利交易涉及实体及关系进行了拓展,规划了共由12类实体和14类关系组成的PSD-KG。知识图谱构建方法上,建立专利领域词典以实现语料自动化标注,并提出了基于BERT-BiLSTM-CRF模型的语义实体识别方法。[研究结论]与传统的CRF、BiLSTM-CRF模型对比发现,该文模型的准确率、召回率和F1指数均高于85%,验证了方法的有效性;以燃料电池领域为例构建PSD-KG,通过技术供需热点识别及演化研究,识别出三类技术热点,包括:持续热门技术点、新兴热门技术点和潜在热点技术;并在交易网络分析、供需信息检索等方面挖掘新应用场景。研究成果也为专利交易推荐提供了知识库。  相似文献   

15.
王雪原  孙美霞 《情报杂志》2023,(3):110-116+150
[研究目的]专利群落符合数字化下超级专利网络复杂创新要求,专利群落的科学划分及基于网络特征的技术布局策略研究,可为行业技术发展提供更具针对性、客观性与系统性的决策支持。[研究方法]该文提出双层嵌套聚类确定专利群落的方法。首先,基于IRM并行模型,构建专利种群网络;其次,立足于网络结构、关系以及表型三维度,设计专利种群网络特征测度指标体系,并利用DSM实现网络特征指标聚类,确定专利群落特征集及具体构成;最后,以碳纤维领域为实证对象,识别专利群落,并综合TF-IDF与LDA模型确定各群落技术领域主题,提出技术布局策略。[研究结论]双层嵌套聚类方法能够科学划分专利群落,融合突破、迭代成长与边缘搜索三大群落应分别通过纵横整合、代际储备、利基挖掘等方式实现有效技术布局。  相似文献   

16.
[目的/意义]有效融合引文网络中的引用关系和文本属性等多元数据,增强文献节点间的语义关联,从而为数据挖掘和知识发现等任务提供有力的支撑。[方法/过程]提出了一种引文网络的知识表示方法,先利用神经网络模型学习引文网络中的k阶邻近结构;然后使用doc2vec模型学习标题、摘要等文本属性;最后给出了基于向量共享的交叉学习机制用于多元数据融合。[结果/结论]通过面向干细胞领域的CNKI引文数据集的测试,在链路预测上取得了较好的性能,证明了方法的有效性和科学性。  相似文献   

17.
[目的/意义]科学准确识别关键共性技术对企业和国家来说都是至关重要的战略议题。[方法/过程]文章提出了一种基于专利文献分析的关键共性技术识别框架,运用文本挖掘和技术演化分析方法,获取特定领域的关键共性技术。首先,使用Viterbi算法识别专利文献中的专业术语,通过LDA算法捕捉专利文献中的技术主题聚类;其次,通过将技术主题的共类特征数值化,作为共性程度的度量;随后,将技术主题节点在技术演化转移网络中的关键程度作为技术关键性的表征,并使用PageRank算法衡量技术主题的关键性。最后,以机器人及数控机床技术为例,验证了该方法的可行性和有效性。[结果/结论]该方法可实现高效、准确的关键共性技术识别,为国家制定创新扶持政策提供支撑。[局限]研究仍需扩大科技文献的收集范围,以实现更全面的关键共性技术识别。  相似文献   

18.
为及时有效地识别潜在技术机会,采用文本挖掘和异常值检测的方法,提出一种基于专利文本的技术机会识别方法.首先采用文本表示模型Doc2vec技术对专利摘要进行建模,以更深层表征文本语义信息;然后利用基于密度的离群值检测算法,识别出具有潜在技术机会的专利方向;最后以深度学习领域潜在技术识别为例,构建专利检索式并收集458条专利文献作为数据集.实证结果总结出4类主题共10个潜在的技术机会,验证了该基于专利的技术机会识别方法的有效性,可为企业相应技术应用、研发和创新提供参考.  相似文献   

19.
[目的/意义]专利关键词提取是专利挖掘任务中非常重要的前置子任务,基于图模型的关键词提取是目前最有效的算法。传统图模型只考虑了单词的局部上下文信息,为了捕获单词的全局信息,提出一种基于图神经网络的专利关键词提取算法,结合词向量与图模型实现专利关键词的提取。[方法/过程]首先,用专利数据集构建异构网络,以专利分类号为标签,训练图神经网络模型,使得同一主题下的单词具有相似的向量表示,获取包含主题信息的词向量;然后,根据专利摘要在滑动窗口内的单词共现关系和词向量相似度,构建融合了单词主题信息的文本图,利用词向量中的主题信息捕获单词的全局联系;最后,在文本图上使用PageRank算法,获取关键节点,构成专利的关键词。[结果/结论]与基线方法相比,该算法在提取专利关键词时,能够检测到新颖性与准确性更高的关键词。  相似文献   

20.
[目的/意义]挖掘高强度关联学科,揭示多学科知识融合规律,有助于更好地把握和推动多学科知识融合。[方法/过程]从Web of Science核心集获取新冠肺炎主题论文,采用Apriori算法挖掘参考文献所属学科的频繁项集和强关联规则,揭示知识融合特征。以一项强关联规则为例,结合关键词聚类分析,识别该学科组合在知识融合后形成的热门主题。[结果/结论]新冠肺炎研究的知识来源非常广泛,跨学科知识融合十分普遍,关联规则挖掘提供了一种识别和预测强关联学科组合及其知识融合趋势的新方案。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号