基于DR-Transformer模型的多模态情感识别研究期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于DR-Transformer模型的多模态情感识别研究

引用本文：	陈杰,马静,李晓峰,郭小宇.基于DR-Transformer模型的多模态情感识别研究[J].情报科学,2022,40(3):117-125.

作者姓名：	陈杰马静李晓峰郭小宇

摘要：	【目的/意义】本文融合文本和图像的多模态信息进行情感识别，引入图片模态信息进行情感语义增强，旨在解决单一文本模态信息无法准确判定情感极性的问题。【方法/过程】本文以网民在新浪微博发表的微博数据为实验对象,提出了一种基于DR-Transformer模型的多模态情感识别算法，使用预训练的DenseNet和RoBERTa模型，分别提取图片模态和文本模态的情感特征；通过引入Modal Embedding机制，达到标识不同模态特征来源的目的；采用浅层Transformer Encoder对不同模态的情感特征进行融合，利用Self-Attention机制动态调整各模态信息特征的权重。【结果/结论】在微博数据集上的实验表明：模型情感识别准确率为 79.84%；相较于基于单一文本、图片模态的情感分类算法，本模型准确率分别提升了 4.74%、19.05%；相较于对不同模态特征向量进行直接拼接的特征融合方法，本模型准确率提升了 1.12%。充分说明了本模型在情感识别的问题上具有科学性、合理性、有效性。【创新/局限】利用 Modal Embedding 和 Self-Attention 机制能够有效的融合多模态信息。微博网络舆情数据集还需进一步扩充。

	点击此处可从《情报科学》浏览原始摘要信息
	点击此处可从《情报科学》下载免费的PDF全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏