首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 390 毫秒
1.
密码创建规则中包含多种多样的个人身份信息组合方式,不仅文法结构规范特殊,而且语义内容丰富.对于文本处理方法,传统的基于概率上下无关文法模型会导致文本特征表示稀疏、语义信息或丢失的问题,因此提出利用深度学习DNN算法.通过对个人身份信息数据进行特征提取,构建语义分类表示的深度神经网络,并为该模型设计训练方法来进行广泛的训练.最后通过实验表明深度学习DNN算法能够提高个人身份信息语义识别的性能,在一定程度上优于已有的一些密码攻击方法.  相似文献   

2.
目前,互联网身份认证普遍采用单一的固定密码认证模式,认证安全性非常低,因此迫切需要一种安全系数高又能普及的身份认证方式。声纹作为一种高活性生物特征,用于身份认证具有十分广阔的应用前景。基于深度学习(DL)的语音认证系统包含两个模型:声纹辨别(VI)模型和声纹文本匹配(VTM)模型,都基于卷积神经网络(CNN)。其中,VI模型是一个二分类模型,主要用于确认当前说话人是否为恶意(录音)攻击者;VTM模型是一个多分类模型,主要用来匹配用户预先设定的身份认证信息。通过实验,两个模型在ASVD数据集的识别率分别达到100%和98.3%,相比caffe-net模型,VTM模型的识别率提高了10.8个百分点。  相似文献   

3.
生物医学文本语义消歧研究中,上下文语义表示存在精度不高、忽略语言特性等问题,对此提出一种基于Bi-LSTM的新型语言模型。该模型通过考虑上下文词序将整个句义信息以无监督学习方式嵌入低维连续空间,并以此生成高质量的上下文表示,然后利用该方法构建歧义向量,最终计算cosine相似度,完成对歧义词的分类。实验表明,相比传统线性语言模型,基于Bi-LSTM生成的语义向量能更好地表示歧义词的语义信息,并在不同生物医学文本数据集中达到高准确度(95.01/91.27)。  相似文献   

4.
随着互联网中网页数量的激增,网页自动分类已经成为互联网技术中亟待解决的问题。提出一种领域向量模型的设计与构建方法,设计并实现一种针对新闻网页的基于领域向量模型的网页分类TSC(Topic Sensitive Classify)算法,从新的角度解决网页自动分类问题。首先,对大量的新闻网页URL进行分析,提取新闻网页的URL特征;然后,设计一个领域向量模型,对特定领域的新闻网页内容特征进行提取;最后,结合新闻网页URL特征和内容特征对新闻网页进行自动分类。实验结果表明,TSC算法分类效果比传统SVM和ID3等文本分类算法更优。  相似文献   

5.
新闻文本分类是长文本分类的典型问题,因此提取词与词之间的关系特征就尤为重要.提出了基于双向Transformer编码表示的预训练模型(Bidirectional Encoder Representations from Transformers, BERT)和双向长短时记忆网络(Bi-directional Long Short-Term Memory, BiLSTM)以及注意力机制的对抗训练分类模型(BBA-AT).将预处理新闻文本数据经过BERT进行训练得到词嵌入编码,在训练后的词向量级别上进行扰动达到数据增广的效果,以此来进行对抗训练,之后通过双向长短时记忆网络对数据集进行编码提取双向语义表征.本文提出的BBA-AT模型F1值在TNEWS数据集上比BERT模型提升了1.34%.  相似文献   

6.
为确定歌词隐含的情感主题对音乐分类的作用,在传统主题模型中融入情感、语义元素,定义基于情感主题的音乐分类标准并进行音乐分类。结合文本情感词典、Word2vec词向量空间,将主题模型的基础主题进一步归类为情感主题,并通过爬取网易云音乐歌曲信息进行模型训练及测试。实验证明,该模型具有较好的分类效果,对音乐情感分类平均准确率达到80%。  相似文献   

7.
在线教育师生情感缺失问题是当前教育研究亟待解决的难题之一。在线教育弹幕文本作为学习者对在线课程内容及自身学习状态的实时反馈,隐含了大量情感信息,对于上述问题的解决具有重要意义。然而,目前鲜有针对在线教育弹幕文本开展情感分析的研究。基于此,设计了一种融合变式情感词典与深度学习技术的在线教育弹幕情感智能识别模型。具体而言:通过构建弹幕种子情感词集,计算弹幕文本与情感种子短语间的相似度,实现极短弹幕文本情感识别;借助BERT动态表征弹幕文本,双向长短时记忆网络挖掘弹幕文本中的深层特征,实现常规弹幕文本情感识别;融合两类弹幕文本情感识别信息并更新后,完成在线教育弹幕文本情感信息的智能识别。研究通过模型对比实验检验模型性能有效性,并借助具体案例验证模型应用可行性。  相似文献   

8.
近年来,随着智能移动设备的普及,人们可以随时随地通过网络社交媒体获取与分享信息。然而,便捷的上网方式以及自由的网络空间,也为网络谣言的产生与传播提供了条件,广泛传播的谣言可能具有极大的破坏性。因此,及时识别谣言对于保障社会稳定具有重要意义。使用词嵌入对微博短文本进行向量化处理,然后使用朴素贝叶斯、K最近邻和支持向量机对文本向量进行主题分类,以期及时发现具有周期性出现特点的谣言。将该模型在中文谣言真实数据集上进行有效性验证,使用5 487条数据作为训练集,2 703条数据作为测试集进行分类实验。实验结果表明,K最近邻模型相比于朴素贝叶斯模型及支持向量机模型,在谣言主题分类任务中表现最佳,其F1值和分类准确率都达到0.93,表明基于词嵌入的谣言主题分类方法可及时发现周期性谣言。  相似文献   

9.
对于网络运行过程中产生的海量日志信息,传统故障诊断方法很难进行实时而全面的日志分析。针对该问题,提出一种基于卷积神经网络(Convolutional Neural Network,CNN)的网络故障诊断模型,利用Skip-gram模型进行词向量训练,并将词向量作为卷积神经网络输入,最终通过Softmax回归进行分类。实验结果表明,该模型可以有效处理网络故障诊断任务,且优于传统机器学习方法,对于网络运行日志的故障诊断准确率可达73.2%以上。  相似文献   

10.
利用深度学习方法进行情感分析时,将文本作为一个整体进行编码,缺乏对表情符号与情感词的有效关注。而传统基于词典的方法则过分依赖于情感词典与判断规则的质量,不能充分考虑文本深层语义关系。针对该问题,构建融合表情符号与情感词的自注意力模型。通过BLSTM训练得到情感符号,并与文本特征向量融合,同时引入结构化自注意力机制识别文本中不同情感符号的情感信息。在NLPCC2014和微博公开语料数据集上的实验表明,相较传统情感分析方法,该模型可有效提高情感分类准确率。  相似文献   

11.
为了探究国内深度学习领域的研究进展和热点前沿,综合利用CiteSpace和VOSviewer两款软件对中国知网数据库中2005-2019年深度学习领域相关文献进行科学知识图谱分析,绘制关键词时区图谱、突变检测图谱以及关键词共现权重图谱。通过对所绘知识图谱的分析,可知国内自2014年开始对深度学习领域进行集中研究,理论模型研究热点为卷积神经网络和循环神经网络,应用领域研究热点为计算机视觉、自然语言处理等。其中,深度置信网络应用广泛,至今仍是研究重点。  相似文献   

12.
针对唇语识别过程中唇部特征提取和时序关系存在的问题,提出一种卷积神经网络(CNN)和双向长短时记忆网络(Bi-LSTM)相结合的深度学习模型。利用CNN学习唇部特征,并将学习到的唇部特征送入Bi-LSTM进行时序编码,通过Softmax进行分类。建立NUMBER DATASET和PHRACE DATASET两个大型汉语数据集以解决汉语唇语数据缺失问题。将该模型与传统的唇语识别方法在两个数据集上进行实验对比,发现在NUMBER DATASET上识别准确率为81.3%,比传统方法提高了8.1%,在PHRACE DATASET上识别准确率为83.5%,比传统方法提高了9%。实验结果表明该模型能有效提高唇语识别的准确率。  相似文献   

13.
为解决海量数据导致用户信息过载问题,通过分析人民网、新浪网等网站的新闻网页数据,将传统方法与深度学习方法相结合,提出基于特征融合、CNN和GRU的多文档摘要方法(M-C-G)。首先对30种不同主题的新闻网页进行数据清洗,使用word2vec工具训练词向量模型,根据多种特征计算得到初步摘要结果;然后把8.3万条搜狐新闻语料文本数据输入带有CNN和GRU的Seq2Seq模型上训练;最后把初步摘要结果输入模型进行测试,得到最终摘要结果。实验结果表明,在ROUGE评测体系中采用该方法比现有方法准确率至少提高约2%,可有效帮助用户寻找有价值的文本信息。  相似文献   

14.
目前一些相对成熟的手势识别算法,如基于模板匹配的方法、基于人工神经网络的方法以及基于隐马尔科夫模型的方法,都存在计算复杂的劣势,而基于深度学习的手势识别具有一定优势。通过深度学习提取多层网络简化的高价值易用特征,通过向量等表示,简化算法以实现良好的识别效果。通过摄像头采集室内复杂背景下的手势图像,在计算能力、存储能力强大的PC平台通过深度学习处理图像,提取特征,然后进行分类识别,能提高识别准确率。通过改进硬件或算法还可提高识别效率及安全性。  相似文献   

15.
针对传统图像文字识别技术采用模板匹配法和几何特征抽取法存在识别速度慢、准确率低的缺点,提出一种基于深度学习的图像文字识别技术,使用开源、灵活的Tensor Flow框架以及LeNet-5网络训练数据模型,并将训练好的模型应用于特定场景印刷体文字识别。实验结果表明,识别模型的top 1与top 5准确率分别达到了99.8%和99.9%。该技术不仅可快速有效地处理大量图片文件,而且能综合提高图像文字识别性能,节省大量时间。  相似文献   

16.
1 Introduction Languagemodel (LM )iscommonlyusedin postprocessingalgorithmofrecognitionsystemtoimprovetherecognitionrate[1,2 ] .Duringpostprocessing ,lan guagemodelservesasaknowledgebasetoassisttherecognitionsystemtomakeabetterdecision .Toachievethisgoal,thelanguagemodelshouldcontainlinguisticinformationaboutalanguage .Accordingtotheircontent,languagemodelscanbecategorizedintotwoclasses ,syntacticallanguagemodelandstatisticallanguagemodel.Syntacticallanguagemodelusuallycontainssomesyntacti…  相似文献   

17.
近年来,手写数字识别是计算机视觉与模式识别中一个广受关注的问题。该问题的主要挑战是如何设计一种有效方法,以识别用户通过数字设备提交的手写数字。目前,深度学习算法在计算机视觉领域非常流行,被用于处理诸如图像分类、自然语言处理及语音识别等问题。以几种深度学习常见算法,包括线性感知器、卷积神经网络、循环神经网络、长短时记忆网络等为研究对象,分析其在手写数字识别方面的优缺点,并引入Google 第二代人工智能系统 TensorFlow,对比相同算法在不同框架下的识别速度及准确率。实验结果表明,几类深度学习算法都能明显提高识别准确率,且在训练数据集时不会损耗过多计算资源。  相似文献   

18.
乳腺癌严重威胁女性健康和生命,及时诊断并提供治疗方案给医生带来了挑战,病理图像分类结果是医生确诊的重要依据,实现乳腺癌病理图像识别分类具有重要意义及临床应用价值。近年来,大多数研究集中于良恶性分类,而不同类型的乳腺肿瘤本身具有不同病因及治疗方法。采用 Inception-ResNet-V2 深度卷积神经网络模型,实现对乳腺癌病理图像的八分类,利用数据增强和迁移学习方法,在 Matlab 上对数据集 BreaKHis进行实验。结果表明,该方法识别率基本达到 80%以上,比大部分已有研究成果效果更优。  相似文献   

19.
提出了一种基于单词分类的神经网络语言模型,以解决归一化问题。实验方法为,在基础翻译系统中加入模型参数,然后利用开发集调整参数,再对测试集进行翻译,对比加入模型参数前后的翻译质量以及训练模型和翻译过程所需时间。实验结果表明,在保证归一化的前提下,该模型的性能优于Vaswani等人的模型,且翻译质量与Vaswani等人的模型相当。  相似文献   

20.
医疗大数据指数目庞大、增长迅速、结构复杂、隐藏价值高的数据。机器学习技术能够有效分析医疗大数据的内部联系,对疾病的早期诊断及预后具有重要临床指导意义。阐述了机器学习技术在医疗大数据中的应用及研究进展,包括在大数据分析中的回归分析、决策树、基于内核的算法、降低维度算法等浅层机器学习算法模型,卷积神经网络、循环神经网络、自动编码器、深度信念网络等深度学习算法模型,以及各个算法模型的临床应用,分析了机器学习在医疗数据挖掘中的应用前景和存在的技术难题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号