首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
【目的/意义】随着LDA模型成为微博信息推荐的主要工具,众多的LDA演化模型的使用问题成为研究者 亟待解决地问题。【方法/过程】首先,从演化发展角度对LDA模型运行机理进行了解析,揭示了模型使用的先决条 件和算法内涵;其次,从不同需求的视角揭示了RB-LDA、RT-LDA、C-LDA、MB-LDA等扩展模型对LDA模型的 功能性补充;最后,提出LDA模型的技术演化方向。【结果/结论】结果表明可利用微型本体来提升语义性、利用多种 模型融合来提升精度、利用大数据来提升数据质量是LDA模型未来的演化方向,可使LDA模型信息推荐能力的更 具个性化和精准化。  相似文献   

2.
【目的/意义】大数据环境下,如何对海量的移动图书馆数据资源进行挖掘、重组和深度融合,从而获取最有 价值的信息对移动图书馆的长远发展至关重要。【方法/过程】构建了大数据深度融合的移动图书馆情境化推荐系 统,通过深度融合图书馆用户的情境信息,有效缓解大数据环境下评分数据稀疏导致的推荐性能下降问题;同时采 用MapReduce的并行处理方式,以此提高大数据的融合与挖掘性能。【结果/结论】实验结果表明,大数据深度融合 的移动图书馆情境化推荐系统较好地将情境信息融入到移动图书馆知识推荐过程中,改进了推荐性能,有利于为 用户提供精准的个性化服务资源,MapReduce化的并行处理方法也有效提升了大数据融合与挖掘的性能与效率。  相似文献   

3.
【目的/意义】随着广大微博用户对微博信息推荐要求的提高,如何提升微博信息推荐的精准度,实现内容 的个性化推荐成为了研究者们亟待解决的热点问题。【方法/过程】笔者利用本体构建技术构建微博信息微本体,提 出了一种基于微本体架构的微博信息内容推荐方法,使用SJ-Tree将微本体图匹配算法进行改良,完善主题微本体 和用户微博信息微本体的匹配,实现微博信息的推荐。【结果/结论】仿真实验结果证实了微本体图匹配算法可以提 高微博信息推荐的效率及精准度,为实现微博信息内容的定制化推荐打下了坚实的基础。  相似文献   

4.
【目的/意义】为提升主流融媒体意识形态建设和舆论引导能力,解决大数据时代背景下主流融媒体多模态 信息资源管理的困境,构建高效的热点发现机制。【方法/过程】笔者着眼于主流融媒体热点发现需求构建需求体 系,然后利用Scrapy-Redis框架、HBase数据库和MapReduce实现了数据的精准采集、有序存储和高效处理,再基于 多模态信息融合的理念,借助 NLP技术对信息资源的特征进行提取,最后利用 LDA2vec模型和 Single-Pass算法实 现了信息归集和热点的发现与更新。【结果/结论】仿真实验结果表明,本研究所使用的方法,能够较好地实现多模 态信息的归集和热点的提取,效果较同类模型有明显提升。【创新/局限】但是在运用NLP技术处理多模态信息时各 处理环节的衔接尚不够流畅,后续仍需进行改进提升。  相似文献   

5.
【目的/意义】通过构建数学模型,研究大数据背景下微博舆情热度预测问题。【方法/过程】分析大数据背景 下的微博舆情的首发信息特征,定义首发信息影响系数,建立微博首发信息热度预测方程模型。【结果/结论】利用百 度指数、清博舆情等软件,研究 47个微博舆情实例分析模型特征,并用 6个微博舆情案例验证模型,得出该模型根据 微博首发信息的少量数据而得到较为准确的预测结果。研究成果有利于政府面对复杂微博舆情时做到“心中有 数”, 也为进一步研究大数据背景下微博舆情预测问题提供参考。  相似文献   

6.
王静茹  陈震 《情报科学》2018,36(1):102-107
【目的/意义】目前LDA模型在文本数据挖掘方法中占有重要的地位,已成为数据挖掘领域的研究热点。 为了进一步提高LDA模型在文本挖掘中的应用效果,有必要对LDA模型文本主题提取效果进行对比研究。【方法/ 过程】本文提出了一种基于LDA模型的不同类型文本数据主题提取效果对比评价方法,先通过LDA模型对文本数 据进行主题挖掘;再通过定量的主题提取效果评价方法进行对比研究。【结果/结论】本文以期刊论文、网络舆情事 件话题、微博文本、调查问卷为文本数据源,实验结果表明LDA模型在处理语义信息明确逻辑关系合理的长文本数 据时,主题提取效果较好。这为提高LDA模型的挖掘效率提供了一定的理论依据。  相似文献   

7.
【目的/意义】研究从用户节点和网络全局两个视角出发,基于用户相似度与信任度对虚拟学术社区中学者 进行推荐,提高学者推荐的质量。【方法/过程】首先,利用 LDA 主题模型挖掘学者发表的博文主题,计算博文相似 度;通过学者共同好友比例计算好友相似度;然后将博文相似度和好友相似度融合计算用户相似度;最后,融合用 户相似度和信任度进行学者推荐。【结果/结论】提出虚拟学术社区中基于用户相似度与信任度的学者推荐方法,综 合利用用户节点和网络全局信息,为虚拟学术社区用户进行学者推荐。【创新/局限】从用户节点和网络全局两个角 度进行学者信息融合,有效提高了虚拟学术社区中学者推荐的质量。局限在于本文主要考虑的是学者在网络全局 中的信任度,用户节点间的交互信任关系还有待进一步研究。  相似文献   

8.
周鑫  熊回香  肖兵 《情报科学》2023,(3):145-154
【目的/意义】针对在线医疗信息结构松散,医疗平台医生推荐精度不足的现状,设计了一种基于标签和患者咨询文本的医生推荐算法,提升医生推荐效果。【方法/过程】利用Word2vec模型训练患者咨询文本得到特征向量,改进余弦相似度算法计算医生推荐集A;利用LDA模型训练医生标签得到医生在主题上投影的概率分布,改进KL距离算法计算医生推荐集B;基于社会网络分析理论设计相关算法重构医生网络链接,选择中心性指标得到最终医生推荐集C。【结果/结论】以“丁香医生”数据进行实证,面向UGC数据丰富了算法的可用程度,弥补了单一推荐方法的不足,提高了推荐的精度。本文所提方法有效提升了医生推荐精度。【创新/局限】通过融合标签和患者咨询文本,采用社会网络分析实现了医生混合推荐。虽然通过中心性指标进行重要医生挖掘,但挖掘效果有提升空间。  相似文献   

9.
梁珊  邱明涛  马静 《情报科学》2017,35(7):44-49
【目的/意义】考虑到使用LDA模型进行主题抽取时,抽取到的特征词是无序的,破坏了原有的主谓宾结 构,导致抽取效果不准确,可读性差的缺陷,构造了WO词序模型,并将LDA模型与WO模型结合,提出了基于 LDA-WO混合模型的微博主题有序特征抽取算法。【方法/过程】使用LDA模型进行主题建模,获得无序特征词, 然后通过WO模型对特征词进行排序,将特征词与原语料进行对比,构造特征词-语料位置矩阵,通过对特征词的 位置排序,构造特征词词序权值矩阵,最终获得有序的特征词,完成对话题特征的有序抽取。【结果/结论】本文以真 实新浪微博数据为实验对象,实验结果表明基于LDA-WO模型的特征词提取方法进行特征抽取,抽取到的特征词 可读性更强,可弥补传统LDA模型在话题可解释性上的不足。  相似文献   

10.
陈杰  马静  李晓峰  郭小宇 《情报科学》2022,40(3):117-125
【目的/意义】本文融合文本和图像的多模态信息进行情感识别,引入图片模态信息进行情感语义增强,旨在 解决单一文本模态信息无法准确判定情感极性的问题。【方法/过程】本文以网民在新浪微博发表的微博数据为实 验对象,提出了一种基于DR-Transformer模型的多模态情感识别算法,使用预训练的DenseNet和RoBERTa模型, 分别提取图片模态和文本模态的情感特征;通过引入Modal Embedding机制,达到标识不同模态特征来源的目的; 采用浅层Transformer Encoder对不同模态的情感特征进行融合,利用Self-Attention机制动态调整各模态信息特征 的权重。【结果/结论】在微博数据集上的实验表明:模型情感识别准确率为 79.84%;相较于基于单一文本、图片模 态的情感分类算法,本模型准确率分别提升了 4.74%、19.05%;相较于对不同模态特征向量进行直接拼接的特征融 合方法,本模型准确率提升了 1.12%。充分说明了本模型在情感识别的问题上具有科学性、合理性、有效性。【创 新/局限】利用 Modal Embedding 和 Self-Attention 机制能够有效的融合多模态信息。微博网络舆情数据集还需进 一步扩充。  相似文献   

11.
【目的/意义】面对网络时代数据的海量性和无序性,为用户推荐个性化资源有利于增强用户间合作、提高 知识的共享速度,对新知识的发现具有深远意义。【方法/过程】基于具有相同兴趣用户的聚合优于单纯的信息聚 合,构建基于社会化标注系统的个性化推荐模型。通过引入社会网络中用户使用标签的频次来选择与用户关联显 著的标签,并通过加权派系发现和聚合“小众”凝聚组群和相似标签集,进而为用户推荐优质资源,使其真正契合用 户的个性化需求偏好。【结果/结论】结果表明模型能够有效实现信息的个性化推荐,消除单独聚类带来的粗糙数据 集,并通过抓取豆瓣上的数据进行实证分析。  相似文献   

12.
安璐  周亦文 《情报科学》2020,38(4):9-16
【目的/意义】构建用户特征指标体系,对恐怖事件情境下微博信息与评论用户进行画像并比较有助于掌握参与恐怖事件讨论用户的特点,加强反恐舆论引导。【方法/过程】以"#巴塞罗那恐怖袭击#"话题下的所有微博及评论数据为例,使用基于相关性的LDA主题模型提取微博主题,从用户特征和文本特征两个角度构建指标体系,并采用两步聚类刻画微博用户特征,分析发布微博用户和评论用户的异同。【结果/结论】以往活跃度、影响力较高的用户在该事件中不一定拥有较高的影响力;原始微博用户的平均等级略低于评论用户,但其在该事件中的影响力高于评论用户;原始微博用户类型多于评论微博用户类型。  相似文献   

13.
【目的/意义】大数据时代文本主题挖掘在情报分析领域中的作用日趋重要,通过特征比较共词分析和 LDA模型分析两种主流文本主题挖掘方法,研究两者的具体特点,为相关人员合理地运用文本主题挖掘方法处理 数据提供一定的参考。【方法/过程】本文分两种情况对比研究:第一、两者挖掘不同时段同一种类文本数据的主题 分布信息和主题演化信息的能力;第二、两者挖掘同一时段不同种类文本数据的提取正确主题的能力。【结果/结 论】在不同时段LDA模型分析与共词分析相比挖掘主题分布信息的能力可不断提升,并且其可挖掘出更加细化的 主题演化信息;在同一时段LDA模型分析对语义关系模糊逻辑结构粗糙的文本提取正确主题的效果明显优于共词 分析。  相似文献   

14.
孟秋晴  熊回香 《情报科学》2021,39(6):152-160
【目的/意义】为了向在线医疗社区中的用户自动推荐符合其自身实际需求的医生,本文基于在线问诊文本 信息,提出了基于相似用户与相似医生的混合医生推荐算法。【方法/过程】首先从用户咨询问题出发,找到具有相 似咨询问题的用户,将其所选择的医生作为基于相似用户的推荐集合;然后从医生回答从发,通过LDA主题模型训 练,从医生回答文本集中挖掘出隐含的疾病主题,按主题查找具有相似疾病诊治经验的医生作为推荐集合;最后通 过混合相似度计算融合基于相似用户和相似医生的推荐结果,得到最终推荐列表。【结果/结论】通过对在线医疗社 区“39健康网”进行实证研究,结果表明,利用本文提出的方法进行推荐,能够有效降低数据维度,挖掘文本间的潜 在语义关联,有效缩小语义鸿沟,提升推荐质量,具有较好的推荐效果。【创新/局限】本文仅选取了针对科室的小样 本数据进行实验,且部分参数使用经验值,未来可深入探讨该方法在大规模医疗数据集上的应用。  相似文献   

15.
张雷  谭慧雯  张璇  韩龙 《情报科学》2022,40(3):144-151
【目的/意义】构建高校师德舆情微博用户评论LDA模型,可以更精准识别舆情演化特征和分析关键主题传 播路径,帮助高校和相关部门更为有效地进行舆情监管和舆情引导。【方法/过程】本文以“天津大学一教授学术造 假”事件为例,基于 LDA模型构建高校师德舆情下微博用户主题生成模型,采用困惑度评价指标确定 LDA模型最 优主题数,采用信息熵确定每一主题在不同日期的主题强度,通过关键词共现知识图谱、词云展现舆情话题的演 变,最后基于主题相似度确定主题传播路径。【结果/结论】LDA模型和信息熵可以解析出网络用户群体关注的重要 主题热点,精准识别舆情演化特征,识别主题最优传播路径进行舆论引导,对爆发的舆情实现预测和管制优化。【创 新/局限】文章创新性地构建高校学术道德舆情的LDA主题模型,有效确定微博用户群体主题、识别舆情演化特征、 分析主题间传播路径,具有普适性;进一步扩大高校师德其他舆情分析及结合网络舆情情感分析为下一步的研究 内容。  相似文献   

16.
【目的/意义】构建基于用户动态画像的学术新媒体信息精准推荐模型是满足学术新媒体用户对学术信息 资源精准化、个性化与专业化的要求,同时也是提高学术信息流转效率以及价值增值的有效途径。【方法/过程】在 探究学术新媒体信息流转模型的基础上,进一步分析学术新媒体用户需求与分层画像,重构学术新媒体用户画像 步骤,构建基于用户动态画像的学术新媒体信息精准推荐模型。【结果/结论】基于用户动态画像的学术新媒体信息 精准推荐模型能够实现学术信息资源与用户的精准对接,提升用户忠诚度,更好地服务科研工作者的学术活动。 【创新/局限】从理论框架角度分析与构建学术新媒体信息推荐模型,后续将重点研究模型的技术实现与实践应用。  相似文献   

17.
【目的/意义】提出融合深层演化特征的情感分析方法,以提升公共安全事件微博情感分析精度。【方法/过 程】以红黄蓝幼儿园涉嫌虐童事件为例,使用LDA与爬虫软件提取演化特征中的主题特征、时间特征,结合传统浅 层文本词性特征与情感特征,应用于XGBoost以生成微博情感分析集成模型。【结果/结论】演化特征的融入使得 情感识别准确度Auc值提高4%,且XGBoost分类精度均优于SVM、随机森林。本文提出的情感识别模型能够在公 共安全事件微博情感分析方面取得较好效果  相似文献   

18.
【目的/意义】为微博用户生成质量较高的标签,帮助用户对微博特征进行描述。【方法/过程】首先,分析微 博的特征建立候选标签与候选词表。随后,用 LDA对用户的微博进行主题分析,将用户的微博与预选标签相匹配, 生成预选标签。最后,用 LDA对用户关注的人及用户的粉丝的微博进行主题分析,对预选标签进行控制生成最终 标签。【结果/结论】实验结果表明,本文以 LDA为基础提出的标签生成方法具有不错的效果,最终生成的标签能够 较为准确地描述用户的微博特征。  相似文献   

19.
唐晓波  郑杜  谭明亮 《情报科学》2019,37(7):118-124
【目的/意义】人工智能技术的飞速发展和广泛应用为企业情报资源的开发与利用提供了良好的条件。大 数据环境下,利用人工智能技术帮助企业从海量信息中智能化地获取情报,对于企业获得和保持竞争优势有着重 要的意义。【方法/过程】回顾和梳理了人工智能技术应用于竞争情报的相关研究,分析和阐述了企业竞争情报系统 对于智能技术的需求,将人工智能技术应用于竞争情报系统的整个流程与环节中。【结果/结论】文章以“事实数据+ 工具方法+专家智慧”的情报方法论为指导,基于人工智能技术构建了企业竞争情报系统模型。该模型由情报采集 子系统、情报分析子系统和情报服务子系统组成。分析了各组成部分的结构与功能。  相似文献   

20.
徐迪 《情报科学》2019,37(3):22-26
【目的/意义】科学准确地对时空范畴的舆情演化态势做出研判是及时防范风险事件、完善危机治理手段的 重要前提。【方法/过程】本文核心在于建构一套基于空间可视化理论和技术的大数据舆情研判体系,该体系以空间 行动视角的互动理论作为基础支撑,利用空间分析技术,抓取海量附加位置标签的舆情信息,存储为短期专项数据 库和长期综合数据库,将时空拟合的计算模型结果映射到可视化舆情监测平台,实现研判过程中的舆情事件空间 可视化。【结果/结论】以期弥补舆情研判的静态处置缺陷,最终达到有效辅助政府决策的目的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号