共查询到20条相似文献,搜索用时 15 毫秒
1.
针对现有情感分类算法中存在的问题,本文提出了一种基于word2vec和自训练的无监督情感分类方法。该方法首先利用word2vec和词性标签构建领域情感词典,并在此基础上融合否定词和程度副词来计算评论的情感倾向值;其次,选取情感倾向强烈的评论作为已标注训练集,剩余部分作为待分类数据集;最后,采用机器学习方法生成分类器进行自训练学习,直到迭代结束。采用手机评论作为实验数据,结果证实了该方法的有效性。 相似文献
2.
<正>为提高人脸表情识别效果,提出基于迁移学习和数据增强技术的人脸表情识别方法。在ResNet50卷积神经网络的基础上,保留了愿网络的卷积层并设计了全新的全连接层。对数据集的训练集图片使用Keras中翻转、偏移、旋转等方式达到数据增强,在相同参数和实验环境下,对7种人脸表情的分类效果优于AlexNet、GoogleNet模型。实验结果:基于迁移学习的ResNet50模型在FER2013的测试集上对各类表情的平均识别率为68.7%,达到了主流识别效果。 相似文献
3.
4.
5.
基于BP神经网络的语音情感识别研究 总被引:1,自引:0,他引:1
随着科技的迅速发展,人机交互越来越受到人们的重视,语音情感识别更是学术界研究的热点。将BP神经网络算法用于语音情感识别研究,并在汉语情感数据集上进行了相关实验,识别的准确率达到了91.5%,相较于SVM算法分类精度提高了5%。 相似文献
6.
随机森林是一种优秀的分类算法,然而随机森林算法不能有效的判断冗余属性,因此影响了在含有冗余属性的数据集上的分类效果。针对这一问题,本文提出了一种基于局部线性嵌入的随机森林算法。该算法利用局部线性嵌入算法对冗余属性数据集进行降维,然后利用随机森林算法进行分类学习。在UCI标准数据集上的仿真实验说明,本文算法是一种优秀的含冗余属性数据集分类算法。 相似文献
7.
随着智能终端设备的不断普及,微博、微信等国内最受欢迎的社交平台等富含情感倾向的中英文混合极短文本数据的信息呈爆发式增长。为了有效提取中英文混合极短文本中的情感倾向等关键特征信息,本文提出了一种基于情感倾向和SVM的极短文本分类模型。首先对原数据进行识别并利用kettle、N-Gram模型对数据进行处理;然后利用TF-IDF提取分类所需要的关键词;再将处理后的数据存入词向量集;最后利用SVM对混合极短文本进行分类。经过K-fold交叉验证,检验了模型的有效性。实验以微博等主流社交平台上的6905条极短文本数据作为样本进行实验与分析。结果表明在分类准确率方面,该方法能够有效提高匹配效率;同时在泛化误差与精确度指标上匹配结果更加均衡。 相似文献
8.
【目的/意义】准确挖掘消费者在线评论情感倾向,对于改善商家服务具有重要意义,而情感倾向预测的准
确性仍需提高。【方法/过程】文中设计基于集成学习的在线评论情感分类算法,即以N-gram算法分析在线评论词
语特征,结合情感词典构造文本特征,利用逻辑回归、Light GBM等机器学习方法为基础的集成学习进行训练,实现
在线评论情感分类。【结果/结论】实现了评论的情感倾向预测,在电脑评论数据集,较之于经典的SVM算法和无监
督类算法,该模型的分类衡量指标F1值分别提高了10%到30%不等。同时,在酒店、图书等不同领域的数据集上显
示,该方法的分类准确性仍具有上述效果,证明了该方法具有领域移植性。 相似文献
9.
10.
针对PSVM没有考虑不平衡数据的情况,提出一个基于改进PSVM的分类方法(PSVM-2).首先用PSVM对输入集数据进行初次训练,并得到分类超平面的法向量,做输入集在法向量上的投影,利用投影样本点提供的数据改进PSVM,并对输入集数据进行再次分类.实验证明本方法在处理不平衡数据时性能表现良好. 相似文献
11.
[目的/意义]提出融合母评论文本信息的评论短文本情感分类模型以提高互联网环境下短文本评论情感分析效果,适应舆情工作中的实际应用需求。[方法/过程]以短视频平台舆情事件的评论数据为实验对象,利用GRU提取母评论文本特征和直接提取评论区特征,分别将这些特征与CNN提取原评论文本特征并行融合进行情感分类。[结果/结论]相较于传统深度学习方法,引入的母评论文本特征使两个数据集的情感分类效果都获得了一定提升,F1值等均分别提升了2%和1%,说明本文提出的特征引入方案能够提升评论短文本的分类效果,为舆情工作中的情感监测实际应用提供了思路,验证了舆情相关理论研究对实际技术应用有借鉴和指导意义。 相似文献
12.
【 目的/意义】解决获取虚假网络医疗信息数据集时专业知识不足的问题,帮助在小样本领域构建虚假网络
医疗信息识别模型。【方法/过程】本文提出一种基于权威辟谣信息转化提取构建网络虚假医疗信息数据集的思路,
并依次构建传统机器学习模型、CNN模型和BERT模型进行分类识别。【结果/结论】结果表明,基于辟谣信息能够
实现以较低成本、不依赖专家标注构建虚假医疗信息数据集。通过对比实验发现,基于微博数据预训练的 BERT
模型准确率为 95.91%,F1值为 94.57%,相比于传统机器学习模型和 CNN模型提升分别接近 6%和 4%,表明本文构
建的基于预训练的BERT模型在网络虚假医疗信息识别任务上取得了更好的效果。【创新/局限】本文提出的方法能
以较低成本建立专业领域的虚假信息数据集,所构建的BERT虚假医疗信息识别模型在小样本领域也具有实用价
值,但在数据集规模、深度学习模型对比、模型性能评价指标等方面还有待拓展与延伸。 相似文献
13.
把主分量分析(PCA)方法和自组织特征映射网络(SOM)相结合,应用到基因数据聚类分析中。首先对基因数据集进行PCA分析,提取出少量的特征主分量,再对数据集进行降维。这些主分量基本上可以反映原数据集的综合信息,然后应用SOM网络对得到的特征分量进行聚类分析,把相似的基因划分到一个区域。实验结果表明,与单一地选用SOM网络进行聚类分析相比,该方法有较高的分类正确率及较为清晰的分类边界,是一种非常有效的聚类分析方法。 相似文献
14.
15.
【目的/意义】数据分类是数据挖掘研究的重要内容之一。数据分类时,由于单一分类算法分类性能的差异 性,使其不能很好地解决大部分的分类问题,探讨一种基于多类型分类器装袋技术的数据分类方法具有重要理论 意义和应用价值。【方法/过程】基于分类性能评价的准确率,使用五种不同类型的分类算法作为分类器,随机抽取 训练集后分别训练得到若干个弱分类器,然后采用自动优化加权方式,组合构建一个强的分类器。通过实验对五 种分类算法和装袋算法的分类准确率均值和标准差分别进行对比,得出各分类算法在四种数据集上分类性能的优 劣和稳定性。【结果/结论】在四个UCI数据集上的实验结果表明,与五种不同类型的分类算法相比,装袋算法不仅 在大部分数据集上都表现出很好的稳定性,而且具有更好的泛化能力。 相似文献
16.
【目的/意义】本文融合文本和图像的多模态信息进行情感识别,引入图片模态信息进行情感语义增强,旨在
解决单一文本模态信息无法准确判定情感极性的问题。【方法/过程】本文以网民在新浪微博发表的微博数据为实
验对象,提出了一种基于DR-Transformer模型的多模态情感识别算法,使用预训练的DenseNet和RoBERTa模型,
分别提取图片模态和文本模态的情感特征;通过引入Modal Embedding机制,达到标识不同模态特征来源的目的;
采用浅层Transformer Encoder对不同模态的情感特征进行融合,利用Self-Attention机制动态调整各模态信息特征
的权重。【结果/结论】在微博数据集上的实验表明:模型情感识别准确率为 79.84%;相较于基于单一文本、图片模
态的情感分类算法,本模型准确率分别提升了 4.74%、19.05%;相较于对不同模态特征向量进行直接拼接的特征融
合方法,本模型准确率提升了 1.12%。充分说明了本模型在情感识别的问题上具有科学性、合理性、有效性。【创
新/局限】利用 Modal Embedding 和 Self-Attention 机制能够有效的融合多模态信息。微博网络舆情数据集还需进
一步扩充。 相似文献
17.
[目的/意义]针对单纯使用统计自然语言处理技术对社交网络上产生的短文本数据进行意向分类时存在的特征稀疏、语义模糊和标记数据不足等问题,提出了一种融合心理语言学信息的Co-training意图分类方法。[方法/过程]首先,为丰富语义信息,在提取文本特征的同时融合带有情感倾向的心理语言学线索对特征维度进行扩展。其次,针对标记数据有限的问题,在模型训练阶段使用半监督集成法对两种机器学习分类方法(基于事件内容表达分类器与情感事件表达分类器)进行协同训练(Co-training)。最后,采用置信度乘积的投票制进行分类。[结论/结果]实验结果表明融入心理语言学信息的语料再经过协同训练的分类效果更优。 相似文献
18.
针对传统网络入侵检测方法在实时性响应和入侵行为识别率上存在的不足,本文提出了一种抽取多数类边界样本的入侵检测算法。该算法首先根据中心距离确定网络链接行为中多数类样本的边界样本,然后将多数类样本的边界样本与少数类样本合并构成新的训练集合,最后进行分类学习。该算法有效地降低了类别之间的不平衡度和减少了训练样本数目,具有更好的入侵检测性能。在KDD CUP 99数据集上的仿真实验,充分验证了该算法的有效性。 相似文献
19.
[研究目的]舆情情感分析作为开源情报的重要方面,以少样本学习的形式进行能极大提高情报获取效率。针对在低资源场景下信息不足而导致的情感检测模型性能不佳问题,提出一种融合大语言模型知识的对比提示情感分析方法。[研究方法]首先利用大语言模型的通用知识实现训练样本的扩充,然后使用无标注数据进行对比嵌入训练以优化文本编码器的语义表征能力,最后利用提示学习机制,在无标注数据上进行自预测的迭代扩充训练以使模型进一步使适应特定任务。[研究结论]在公开数据集上的实验结果表明,提出的模型在同等标注数据量的条件下表现优于基线方法。 相似文献
20.
BP神经网络因具有自学习、自适应、大规模并行处理等特点而广泛应用于遥感影像分类中,但是该方法训练时容易陷入局部极小值,且收敛速度较慢,针对这些不足提出一种基于相容粗糙集的BP神经网络分类方法。本文以双台子河口湿地为研究对象,以Landsat-8 OLI影像为数据基础,利用相容粗糙集理论对样本数据集进行预处理,将得到的数据作为新的训练样本,在Matlab软件平台下建立BP神经网络的湿地覆被分类模型,进行湿地覆被信息提取,将分类结果与单纯的BP神经网络以及粗糙集样本属性约简预处理的分类结果进行比较分析。结果表明,基于相容粗糙集的BP神经网络分类方法可以剔除训练样本中的噪声数据,提高网络的训练成功率,缩短网络的收敛时间,分类效果较好,其总体精度达到91.25%,Kappa系数为0.8969,比单纯的BP神经网络分类结果高7.92%和0.0926,比粗糙集样本属性约简预处理方法的分类结果高3.03%和0.0357,是一种有效的湿地覆被分类方法。 相似文献