首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
基于深度学习模型的摘要结构功能识别方法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
  相似文献   

2.
电子计算机广泛应用于信息处理中,有极强的算术和逻辑运算能力,有极高的运算速度、精确度和可靠度。但是,它的形象思维能力与人相距甚远。如果计算机具备了模式识别能力,人们就可以使用机器来执行感知任务。文章运用了人工神经网络,模式识别的方法及原理,以Matlab软件作为平台来探讨应用神经网络对汉字进行识别。并通过对汉字样本图象采集输入,汉字图象二值化,行字切分,十进制存储等预处理,分别在有、无干扰的情况下对汉字进行识别,从而评价其性能的优劣。  相似文献   

3.
王红 《情报理论与实践》2006,29(5):629-631,523
为了提高信息查询的效率,本文将自适应谐振神经网络引入中文文档搜索分类之中。在讨论自适应谐振神经网络基本原理的基础上,提出一种新的中文文档的层次聚类算法,从而提高中文文档的分类识别效率。  相似文献   

4.
协同神经网络是Haken提出的一种模式识别方法。本文在分析经典Haken协同神经网络的关键技术问题的基础上,提出了一种改进的协同神经网络新算法,并将改进的新算法应用于某高速公路地层断面信息识别问题上,与实际地层断面对比校验,表明网络的识别性能比经典Haken协同神经网络有较大的改进和提高。  相似文献   

5.
[目的/意义]为了支撑数据驱动研究范式,促进科学数据的共享与利用,提高数据仓储和发现平台中数据集检索功能的效果。[方法/过程]将科学数据集检索过程分为候选数据集检索和候选数据集重排序两个主要阶段:在第一阶段,将BM25模型与基于SimCSE的稠密检索模型结合,获取潜在的相关数据集;在第二阶段,基于BERT排序模型对候选数据集的相关性进行评分,据此优化检索结果排序。[结果/结论]从国内外13个人文社科相关的科学数据仓储平台采集约10万数据集的元数据进行检索实验和效果评价,结果表明:提出的检索模型效果最优,其NDCG@10的得分分别高于基准的向量空间和BM25模型23.6和11.7个百分点;对各模型检索结果分析发现,该模型相比基准模型具有更强的语义检索能力;此外,还对模型权重设置进行分析,可为实践应用中的参数设置提供参考。[局限]仅在英文人文社科数据集上进行模型效果验证。  相似文献   

6.
【目的/意义】学术论文的结构功能是学术论文篇章结构和语义内容的集中体现,目前针对学术论文结构功 能的研究主要集中在对学术论文不同层次的识别以及从学科差异性视角探讨模型算法的适用性两方面,缺少模 型、学科、层次之间内在联系的比较研究。【方法/过程】选择中医学、图书情报、计算机、环境科学、植物学等学科中 文权威刊物发表的学术论文作为实验语料集,在引入CNN、LSTM、BERT等深度学习模型的基础上,分别从句子、 段落、章节内容等层次对学术论文进行结构功能识别。【结果/结论】实验结果表明,BERT模型对于不同学科学术论 文以及学术论文的不同层次的结构功能识别效果最优,各个模型对于不同学科学术论文篇章内容层次的识别效果 均最优,中医学较之其他学科的学术论文结构功能识别效果最优。此外,利用混淆矩阵给出不同学科学术论文结 构功能误识的具体情形并分析了误识原因。【创新/局限】本文研究为学术论文结构功能识别研究提供了第一手的 实证资料。  相似文献   

7.
随着自然语言处理技术的快速发展,藏文信息处理技术也取得了较大进展。其中,藏文舆情分析作为藏族地区社会舆情分析的重要技术,受到广泛关注。但是,现有的藏文文本情感分析研究由于起步较晚,还存在很大提升空间。本文提出基于深度集成学习的藏文文本情感分析算法。并通过建立藏文情感数据集进行实验,本文算法在三类情感(正向、负向、中性)中精确率平均提升1.65%,召回率提升1.63%,F1分数提升1.96%。实验结果表明,本文采用的深度集成学习有效地提高了文本情感分类的性能。  相似文献   

8.
本文在阐述几种不同时频分布基本原理的基础上,针对LFM的时频(时间-瞬时频率)特征展开研究,利用线性时频表示方法和二次型时频分布来分析LFM的时频特征,结论发现二次型时频分布的时频分辨率优于时频表示方法.  相似文献   

9.
10.
11.
王倩  曾金  刘家伟  戚越 《情报科学》2020,38(3):64-69
【目的/意义】在学术大数据的应用背景下,对学术文本更加细粒度、语义化的分析挖掘日益迫切,学术文本结构功能识别成为科研领域的一个研究热点。【方法/过程】本文从段落的层次来识别章节结构功能,提出利用结合卷积神经网络和循环神经网络的特征对学术文本段落进行表达,然后进行分类。【结果/结论】文本提出的深度学习方法在整体分类结果上优于传统的机器学习方法,同时极大的减少了传统特征工程的人力需求。  相似文献   

12.
Nowadays a large amount of knowledge has been born on the Internet and the way of constructing knowledge graph is not uniform. Due to the recent outbreak of numerous diseases, the community has placed more importance on the healthcare system. Diabetes is a severe disease that affect people's health. To assist the health sector in combating this deadly disease, the authors developed a deep learning strategy for diabetes named entity extraction based on a fusion of text characteristic and relationship extraction utilizing text data as the object. This study aims to develop a multi-feature entity recognition model that considers the differences in text features across different fields. Firstly, in the word embedding layer, a multi-feature word embedding algorithm is proposed, which integrates Pinyin, radical, and the meaning of the character itself, so that the word embedding vector has the characteristics of Chinese characters and diabetes text. Then in modeling, CNN and BiLSTM are used to extract the local and global features before and after the text sequence, respectively, which solved the problem that the traditional method cannot capture the dependence before and after the text sequence. Finally, CRF is used to output the predicted tag sequence. The experimental results show that the multi-feature embedding algorithm and local features extracted by CNN can effectively improve the recognition effect of the entity recognition model.  相似文献   

13.
杨宁  张志强 《情报杂志》2022,41(2):182-189
[研究目的]科学数据已经成为科研产出的重要成果类型之一,通过研究和观察科学数据的使用情况可以发现科学数据的管理需求,提高科研人员共享和重用科学数据的积极性。[研究方法]以生物信息学领域学术论文全文信息作为研究对象,利用规则抽取和人工标注形成了生物信息学引文分类数据集,并对比评估了8种机器学习方法在数据集上的分类和识别效果。[研究结论]实证研究效果显示,机器学习分类方法可以用于科学数据正式引用识别,全文信息和样本集大小对分类效果起到关键性作用。  相似文献   

14.
潘国巍  吉久明  李楠  郑荣廷 《现代情报》2011,31(11):163-165
与基于词典和基于规则的识别方法相比,统计机器学习方法更加适合被应用到命名实体的识别工作中来。本文主要在中文化学物质名称的识别工作中,考察两类统计机器学习模型识别效果及识别效率的优劣,实验结果表明,在所取训练语料与测试语料相同的情况下,以CRF模型为代表的条件概率模型可以展现出更好的实验性能。  相似文献   

15.
[目的/意义]实现对领域概念的自动学习抽取,解决领域本体自动化构建的首要基础任务。[方法/过程]以无监督的学习方法和端到端的识别模式为理论技术基础,首先通过对主流词嵌入模型进行对比分析,设计提出了基于Word2Vec和Skip-Gram的领域文本特征词嵌入模型的自动生成方法;其次研究构建了以IOB格式的标注文本作为输入,基于自注意力机制的BLSTM-CRF领域概念自动抽取模型;最后以资源环境学科领域为例进行了实验研究与评估分析。[结果/结论]模型能够实现对领域概念的自动抽取,对领域新概念或术语的自动识别也具有一定的健壮性。[局限]模型精度尚未达到峰值,有待进一步优化提升。  相似文献   

16.
[目的/意义] 从跨语言视角探究如何更好地解决低资源语言的实体抽取问题。[方法/过程] 以英语为源语言,西班牙语和荷兰语为目标语言,借助迁移学习和深度学习的思想,提出一种结合自学习和GRU-LSTM-CRF网络的无监督跨语言实体抽取方法。[结果/结论] 与有监督的跨语言实体抽取方法相比,本文提出的无监督跨语言实体抽取方法可以取得更好的效果,在西班牙语上,F1值为0.6419,在荷兰语上,F1值为0.6557。利用跨语言知识在源语言和目标语言间建立桥梁,提升低资源语言实体抽取的效果。  相似文献   

17.
对步态识别的国内外研究现状进行了详细的论述;介绍了基于步态识别的身份识别过程,阐述了在步态识别各阶段用到的一些方法;对步态识别的下一步工作进行了探讨。  相似文献   

18.
汪维东 《科技通报》2012,28(10):52-54
研究基于图像的人脸准确识别问题.人在佩戴眼镜的情况下,脸部受到眼镜遮挡,造成无法提取眼部区域特征,人脸主要特征丢失,造成识别准确率下降.为了避免上述缺陷,提出了少量特征相关性计算的人脸识别方法.对提取的人脸图像少量的特征参数进行非线性变换处理,获取特征向量权值系数.利用小波变换方式计算人脸特征相关性系数,通过少量特征相关性进行人脸识别.实验证明,这种眼部特征图像人脸识别方法提高了佩戴眼镜情况下,人脸识别的准确率,取得了满意的效果.  相似文献   

19.
刘畅  殷聪 《现代情报》2016,36(10):62
为了解决电子商务平台中存在的虚假交易问题,本文依据商品的销售记录以及商家的基本信息,提出了一种结合深度置信网络和多层感知器的虚假交易识别方法,通过识别出以通过刷单增加销量的商品来识别虚假交易。首先利用深度置信网络对交易特征进行学习,得到更高层次的抽象特征;然后利用多层感知器进行分类任务,从而识别出虚假交易。从淘宝中爬取商品的交易记录和评论数据进行实验验证,与其他机器学习模型的实验结果进行对比,其性能有明显的提升。  相似文献   

20.
徐彤阳  滕琦 《情报杂志》2021,40(4):163-169
[目的/意义]作为科研人员知识获取、交流与利用的重要场所,虚拟学术社区资源具有数量多、价值高等特征,探索智能问答服务在社区的理论、方法与应用,对推动学术资源高效检索与利用,促进知识服务创新具有重要意义。[方法/过程]梳理虚拟学术社区研究现状与目前知识服务存在的不足,联合双向长短期记忆网络(BiLSTW)、文本相似度等技术作为支撑,基于注意力机制的CNN的智能问答方式构建学术社区内资源的智能问答模型,增加注意力分支以抽取细粒度特征,提高检索速度,提升科研效率。[结果/结论]智能化技术的应用实现学术资源的深度聚合,实现传统信息交互与智能化新技术的协同发展,提升了学术资源利用率,扩大信息资源共建共享。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号