首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
本文以专利中的技术术语作为事务、以术语中的词汇作为项,通过闭频繁项集挖掘方法,对专利文献中的技术术语的结构变化情况进行时序分析,以从新的角度来研究技术演化趋势,之后以硬盘驱动器磁头技术为例进行实证分析,实证结果表明,该方法能够对技术演化过程中所产生的技术变化进行有效识别。  相似文献   

2.
[目的/意义] 立足计量视角,通过对新兴技术特征的量化评价识别“目前处于科学研究阶段、尚未完全进入产业研发落地”的新兴技术。[方法/过程] 借助Node2Vec网络表征方法,从术语共现网络中学习技术术语的向量表示;以此为基础量化新兴技术“过去、现在及未来”三大时间维度特征-“融合性、新颖性及潜在的科学影响力”,用特征值筛选技术主题是否具有新兴性,由此探索得到向量表征视角下的新兴技术识别模型。最后以航空领域为例进行实证研究,验证该方法的科学性和合理性。[结果/结论] 通过引入“术语向量表征”的计算视角,有效编码了术语实体间显性和隐性的关联关系,提升了新兴技术特征计算的客观性;同时结合技术的历史、当前和预测信息,从网络结构和语义特征两方面进行识别,取得了较好的效果。  相似文献   

3.
科技术语属性抽取方法研究*   总被引:3,自引:0,他引:3  
使用共现分析的方法从术语定义抽取术语属性,然后使用对应分析的方法对科技术语和术语属性之间的关系进行分析,并使用图形作为表达方式。最后利用市场营销学科领域的科技文献进行实证研究,对市场营销的概念进行深入挖掘,发现市场营销领域学科研究重点和研究内容等有价值的信息。  相似文献   

4.
通过科学-技术知识关联指标与测度方法研究,能够细粒度分析科学与技术的互动关系,为科技评价奠定基础。提出一种基于知识元的科学-技术知识关联指标与测度方法。以论文和专利为数据来源,在知识元抽取基础上,基于科技术语在不同类型知识元中的共现情况实现科学-技术知识关联指标测度。以糖尿病领域为例开展实证研究,结果验证提出的科学-技术知识关联指标与测度方法能够在高质量论文识别中有效发挥作用,所提指标和方法对于完善科技评价体系、促进创新驱动发展战略实施有参考意义。  相似文献   

5.
基于隐马尔科夫模型的中文术语识别研究   总被引:2,自引:1,他引:2  
基于对中文文本信息语法构成尤其是词性搭配的概率特征的分析,提出一种基于双层隐马尔科夫模型的中文泛术语识别和提取的思路和系统框架,并实现相关系统,基于训练语料对多个领域的文本信息进行术语提取测试。实验结果表明,所提出的基于隐马尔科夫模型的中文泛术语识别和提取思想具有较好的实践参考意义。  相似文献   

6.
认为利用专利技术功效主题词与专利引文进行共现分析可直观识别核心专利簇的技术功效特征。与专利引文共现分析相比,专利技术功效主题词与专利引文的交叉共现增加了主题标识,使得基于相同标引主题词的被引专利有相似的技术主题和功效特征。同时,不同的技术功效主题词通过专利引文交叉共现,可以识别不同技术主题的关联度以及技术主题对应的功效特征。最后,选择医用显微内窥镜领域相关专利做实证分析,通过技术功效主题词-专利引文、技术主题词-专利引文以及专利引文共现分析,论证专利技术功效主题词与专利引文共现方法在核心专利挖掘方面的特征、优越性及不足。  相似文献   

7.
对双语术语抽取技术中的一项重要分支:基于可比语料库的双语术语抽取技术进行了综述分析.当前研究者采用的方法依据是"上下文相似"理论,即两个在源语言共现的词,对应到目标语言中的两个词也将共现.当前技术主要包含候选词的上下文特征的模型构造和上下文特征模型的优化.对已有的研究给出了一个初步的评价标准,分别对两项研究按照方法复杂度层次进行分析总结,指出存在的问题.最后对基于可比语料库的双语术语抽取技术的未来进行了展望.  相似文献   

8.
利用多策略模糊综合评判的方法进行术语关系识别,首先采用多种相似度计算方法计算术语的相似度,然后利用连续属性离散化方法确定关系类别及阈值区间的划分,利用样本分布概率确定区间对类别的隶属度,利用粒子群算法和交叉验证法确定因素权重,最后利用模糊综合评判方法将所有相似度计算方法的计算结果进行融合处理,实现术语关系的识别。本研究将以中国科学技术信息研究所已有的新能源汽车领域汉语科技词系统中的术语作为测试集,用准确率、召回率和 F 值对关系识别的结果进行评价,论证该方法的有效性。  相似文献   

9.
当前商业竞争不断加剧,创新和产品的迭代周期不断加快,识别未来新兴技术的早期弱信号,具有重要的战略意义。本文提出了一种基于异类数据和语义建构的新兴技术弱信号识别新方法。首先,以文献数据作为新兴技术弱信号识别的分析对象,探索使用文档离群性和文本相异性指标筛选异类数据,并构建合适的量化评估方法;其次,通过改进TF-IDF (term frequency-inverse document frequency)算法和组合图法,抽取弱信号关键词表征术语;最后,基于意义建构理论抽取术语上下文语境,挖掘并解析弱信号含义,以实现新兴技术弱信号识别。本文以量子信息领域作为实证研究对象,识别出当前量子信息领域新兴技术弱信号包括量子点吸附、量子保密协议、量子点医学和量子博弈等。研究结论证实了本文方法的有效性,可为决策者和技术研发人员提供决策支持。  相似文献   

10.
刘俊婉  庞博  徐硕 《情报学报》2023,(12):1395-1411
基于专利的弱信号探测模型与技术颠覆性潜力测度体系相结合的方法,开展颠覆性技术早期识别,为颠覆性技术的早期识别提供一套有效的方法和思路。利用专利信息进行领域弱信号探测,利用LDA (latent Dirichlet allocation)主题模型从领域专利内容中抽取主题,基于弱函数对主题进行过滤得到包含弱信号的主题集合,进一步通过预兆函数对弱信号主题包含的术语进行过滤,得到该研究领域弱信号术语集合及其对应的专利集合。基于技术颠覆性潜力测度指标体系,对包含弱信号术语的专利进行颠覆性潜力测度,最终得到目标领域具有颠覆性潜力的技术,为该领域颠覆性技术的早期识别提供参考。以incoPat专利数据库中2008—2019年基因编辑领域的专利数据作为研究对象,结合弱信号探测模型与技术颠覆性潜力测度体系,对该领域具有颠覆性潜力的技术进行早期识别,通过与基于关键词识别的弱信号结果对比,并利用CRISPR/Cas9技术对上述颠覆性技术识别结果进行验证,证明了本文方法的可行性和有效性。  相似文献   

11.
利用信息计量、共引分析、共现分析、信息可视化、社会网络分析等方法,借助CiteSpace信息可视化软件和Ucinet社会网络分析软件,对我国信息构建研究领域发表的学术论文进行了定量分析,绘制了文献共引、作者共现、关键词共现和期刊共现图谱,直观地展示了我国信息构建研究的热点领域、核心群体、核心期刊和代表文献。  相似文献   

12.
基于Hadoop的海量共现矩阵生成方法   总被引:4,自引:0,他引:4  
海量数据的处理分析是当前信息处理技术的热点之一,介绍开源并行系统Hadoop的体系结构以及基于Hadoop的MapReduce编程框架,并在Hadoop基础上提出一种通过多重MapReduce操作,实现海量共现矩阵的生成方法。  相似文献   

13.
汉语科技词系统的Web服务研究与实现*   总被引:2,自引:0,他引:2  
对国内外词汇知识的Web服务研究现状进行调研分析,比较OCLC术语服务、英国高级叙词表、FAO多语种农业叙词表、STAR、中文叙词表本体网络术语学服务等国内外主要研究项目。介绍汉语科技词系统的基本架构、数据模型、功能模块和基于Web服务的汉语科技词系统应用模型、接口封装、部署、以及性能测试情况。最后对下一步研究工作进行展望。  相似文献   

14.
在分析标签共现的基础上, 提出一种基于共现的标签谱聚类方法, 该方法直接利用标签的共现关系来测度标签的相关性, 能够避免将标签表示成向量空间模型时所带来的高维稀疏等问题.在衡量标签的共现相似性时, 设计一种综合的方法, 并给出标签综合共现相似度的计算公式.与传统的单一利用标签的个体共现来衡量其相似性相比, 综合的方法同时考虑标签的个体共现相似性和标签的群体共现相似性, 能够更加精确地刻画标签的共现相似度.实验结果表明, 基于综合共现相似度的标签共现谱聚类方法具有较好的效果.  相似文献   

15.
通过介绍技术融合的概念,采用信息计量学的关键词词频分析方法和共现分析方法,以物联网、大数据、云计算、语义网为例,从4个层面分析技术融合的结构并进行一致性分析,设计一种技术融合结构的计量方法。研究认为,物联网、大数据、云计算和语义网4种新兴信息技术存在不同程度的技术融合现象,而且主要受研究关注度不同、技术的底层支撑不同以及技术的功能阶段不同的影响。  相似文献   

16.
在对可视化概念进行概述的基础上,分析目前在知识图谱领域应用的可视化分析方法与软件工具,并对可 应用于多特征项共现的可视化分析方式进行研究,包括社会网络可视化方式以及交叉图技术可视化方式,还对这两种 可用于多特征项共现可视化的具体分析方法、显示方式进行阐述和展示。最后通过对比这两种不同可视化方式的特 点,发现多特征项共现交叉图的可视化技术较好。在应用前景方面,通过应用本文中基于科技文献多特征项共现的图 谱可视化方法和软件工具,可以对研究机构、研究领域、研究学者等发表论文情况进行分析,能够观测所选论文集中 多  相似文献   

17.
We are recently witnessing a radical shift towards digitisation in many aspects of our daily life, including law, public administration and governance. This has sometimes been done with the aim of reducing costs and human errors by improving data analysis and management, but not without raising major technological challenges. One of these challenges is certainly the need to cope with relatively small amounts of data, without sacrificing performance. Indeed, cutting-edge approaches to (natural) language processing and understanding are often data-hungry, especially those based on deep learning. With this paper we seek to address the problem of data scarcity in automatic Legalese (or legal English) processing and understanding. What we propose is an ensemble of shallow and deep learning techniques called SyntagmTuner, designed to combine the accuracy of deep learning with the ability of shallow learning to work with little data. Our contribution is based on the assumption that Legalese differs from its spoken language in the way the meaning is encoded by the structure of the text and the co-occurrence of words. As result, we show with SyntagmTuner how we can perform important tasks for e-governance, as multi-label classification of the United Nations General Assembly (UNGA) Resolutions or legal question answering, with data-sets of roughly 100 samples or even less.  相似文献   

18.
本文在界定多重共现概念的基础上,阐述了它与一般共现的区别,同时对Morris交叉图技术进行改进,开发了多重共现的可视化分析工具,并对多重共现的知识发现方法进行了研究。最后还综合运用多重共现可视化分析工具及多重共现的知识发现分析方法,对机构-期刊-关键词的样本数据进行了实证分析。通过分析发现,该套工具以及知识发现方法能较为有效地发现论文中三个特征项之间的多重共现关系,并能揭示出比一重共现现象更为广泛和深入的信息内容。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号