首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
管雨翔  王娟  张鹏 《情报工程》2023,(6):105-116
[目的/意义]研究涉警网络舆情主题特点及网民情感变化,可以为构建良好的警民关系和警察形象提供参考,具有重要的社会意义和实际价值。[方法/过程]获取微博平台涉警网络舆情数据,使用LDA主题模型及TF-IDF算法对网络舆情数据进行主题发现研究,基于Word2Vec模型构建涉警网络舆情领域情感词典,进而对网民情感进行分析。[局限]在案例选取及分析方面不够全面。[结果/结论]通过LDA主题模型及TF-IDF算法可以使主题划分更为明显,基于领域情感词典的情感分析也较为准确,更好地反映出舆情传播过程中热点话题及网民情感的变化。  相似文献   

2.
针对突发公共卫生事件提出了一套结合利益相关者的网络舆情监控方法。以新冠肺炎微博数据为例,按照疫情中涉及的社会角色划分了11类利益相关者,将LDA (latent Dirichlet allocation)与LDA2vec串行提取文本主题,借助SnowNLP进行情感分类,通过统计话题的绝对关注度和相对关注度得到不同利益相关者的网络舆情演化过程。实证结果表明,利益相关者的关注点在疫情爆发期内比较一致,而在平稳期内比较分散,最终随着疫情的逐步控制再次集中;相同角色的利益相关者具有相似的话题和情感演化过程,但其侧重点仍有差异;绝对关注度反映了主流舆论影响下的关注点,相对关注度反映了与利益相关者自身利益相关的关注点。本研究揭示了突发公共卫生事件中利益相关者的舆论演化特征,为政府精确监控突发公共卫生事件中不同群体的舆论趋势提供了理论依据与决策参考。  相似文献   

3.
[目的/意义] 基于社交媒体,探索突发事件信息生命周期中不同利益相关者的动态分类及其关注主题的演变规律,为更精准的危机信息监测与动态决策提供依据。[方法/过程] 以特定危机事件的事实文本数据为来源,以利益相关者理论和动态主题模型为指导,构建三维动态主题演化模型以对社交媒体危机事件中不同利益相关者的分类与话题关注进行主题挖掘。其中包括时间粒度划分、利益相关者的定量评估、基于时间和主体的危机主题观点识别与刻画,并利用可视化工具对该动态趋势进行表征。[结果/结论] 基于三维动态主题演化模型,利益相关者的组成与分类在不同阶段中具有明显的差异性,同时其关注主题与行为特征也体现出不同的偏好性和动态差异性。危机主体的动态与危机主题的动态有效结合,能够更加全面地表达舆情传播的特点和规律。  相似文献   

4.
[目的/意义]基于时间网络影响力模型,研究微博话题的时变传播特性。[方法/过程]首先构建微博话题影响力网络模型,给出影响力网络的定义、关键因素分析、模型以及网络权值的计算方法,在此基础上,基于时间网络影响力模型研究微博话题时变传播特性,利用新浪微博平台及DATAMALL的最新微博话题数据仿真分析微博话题随时间的动态传播过程以及对用户的影响力强度。[结果/结论]微博话题随时间的动态传播过程以及对用户的影响力强度之仿真分析结果表明:约有93.3%的话题延迟在1-5小时以内,同时微博话题的影响力网络权值越高,相应的转发评论人数越多,微博话题的影响力也越大。最后将本文提出的TNIM模型与传统的影响力网络模型LDA进行对比,结果显示TNIM模型的影响力网络权值的准确性和稳定性都高于LDA模型,验证了TNIM模型的有效性。  相似文献   

5.
为了弥补目前微博平台主题挖掘方法的不足,兼顾到微博信息的稀疏性、多维性、海量性等特点,提出根据微博信息特点进行有针对性的预处理后,使用基于先验概率的潜在语义分析模型LDA(Latent Dirichlet Allocation)进行微博主题挖掘,并在LDA建模的基础上,设计文本增量聚类算法,进一步实现主题结构的识别,从而使用户更好地理解主题及其结构。通过在真实微博数据集上的实验,证明该模型能有效进行主题挖掘和主题结构的识别。  相似文献   

6.
[目的 /意义]聚焦数据开放利用的隐私权益抗争现象,分析隐私权益抗争的基本类型及其引致的治理风险和分层治理策略。[方法 /过程]利用八爪鱼爬虫软件,抓取2018年6月1日至2022年6月1日新浪微博平台发布的429条相关原创推文的文本资料,进行内容分析和话语分析。通过构建“二维四态”的分析框架,对数据开放利用隐私权益抗争的类型展开具体分析。[结果 /结论 ]研究发现:数据开放利用隐私权益抗争包括“利益目的—弱策略”“伦理目的—弱策略”“利益目的—强策略”和“伦理目的—强策略”4种基本类型。网络平台的数据隐私权益抗争行为具有合法性风险、秩序风险和信任感风险。政府应着眼于法规制度健全、组织架构完善和机制策略设计,对数据开放利用的隐私权益抗争进行分层治理。  相似文献   

7.
张培晶  宋蕾 《图书情报工作》2012,56(24):120-126
在介绍概率主题模型发展过程以及概率主题模型的代表性模型LDA基本原理的基础上,分析LDA模型的特征及其用于微博类网络文本挖掘的优势;介绍和评述微博环境下现有的基于LDA模型的文本主题建模方法,并对其扩展方式和建模效果进行总结和比较;最后对微博文本主题建模的发展方向进行展望。  相似文献   

8.
[目的/意义]系统归纳梳理LDA模型的应用过程与应用领域,为图情领域LDA模型研究提供参考。[研究设计/方法]以Web of Science核心集、LISA、Google Scholar、中国知网、维普和万方等为数据源,检索图情领域LDA模型的研究文献,通过内容分析构建了LDA模型应用研究分析框架,从模型应用过程的视角对国内外研究现状进行系统地总结归纳。[结论/发现]LDA主题模型研究已经形成较为成熟的分析流程,已应用在主题探索、知识组织、学术评价、情感分析等很多领域,但是在应对大数据、多模态数据等复杂处理任务,提升建模结果的语义质量,扩展模型应用等方面还亟待加强。[创新/价值]基于LDA模型的应用过程,细致揭示了图情领域LDA模型应用研究存在的问题和发展方向。  相似文献   

9.
[目的/意义]基于大量专利文献数据的核心技术主题识别有助于识别某技术领域的关键技术、分析关键技术的发展方向,是进行技术创新的基础情报工作,对于研究人员、企业乃至国家层面都具有一定的意义。[方法/过程]提出基于Chunk-LDAvis的核心技术主题识别方法,首先基于经典LDA模型进行主题识别,然后利用名词组块对初始LDA主题识别结果进行标注,构建Chunk-LDA主题识别结果,提高其可解读性;然后基于社会网络分析方法构建主题网络,识别核心技术主题;基于R语言的LDAvis工具包绘制可交互的Chunk-LDAvis核心技术主题关联分析图谱,发现核心技术主题的隐含联系,辅助进行核心技术主题识别。[结果/结论]通过对纳米农业领域进行实证研究,验证了本文提出方法的准确性和可行性。  相似文献   

10.
突发公共卫生事件利益相关者的社会网络情感图谱研究   总被引:3,自引:0,他引:3  
安璐  欧孟花 《图书情报工作》2017,61(20):120-130
[目的/意义]构建突发公共卫生事件利益相关者的社会网络情感网络图谱,以可视化的方式分析突发公共卫生事件中各类利益相关者的情感状态和分布,探寻利益相关者之间的情感传播路径,并结合舆情话题综合分析利益相关者的情感演化态势。[方法/过程]以"魏则西事件"为例,通过微博转发关系构建微博用户的社会关系网络,同时标识各用户的利益相关者类型,并计算用户的情感类型及情感强度嵌入社会网络中构建出社会网络情感图谱。[结果/结论]普通群众的情绪更强烈且易受意见领袖影响,在事件爆发期和蔓延期,主流媒体和自媒体对普通群众的情感影响较大,在衰退期,政府人员和医护人员的参与增加且情感影响变大。随着舆情的演化,各类利益相关者的主导情感也随着变化,自媒体和企业在情感传播中起重要的桥梁作用。  相似文献   

11.
赵晓航 《图书情报工作》2016,60(20):104-111
[目的/意义] 旨在通过对突发事件舆情研究,探索危机传播管理中的舆情研判方法,并进一步为政府信息公开提供实操方法的建议。[方法/过程] 在理论研究层面,基于危机传播的基本要点,对信息发布效果和舆情实时反馈进行综合分析;在应用处理层面,以新浪微博中“天津爆炸”事件相关信息为例,爬取新浪微博全量数据,基于危机传播领域知识和信息发布文本构建领域词表,并结合危机传播阶段特征,对全量数据进行主题提取和情感分析。[结果/结论] “后微博”时代,微博用户量下降,但其仍旧是突发事件信息公开和舆情扩散的主要阵地。探求突发事件下政府如何利用微博平台,收集、研判、应对网络舆情,为做好信息发布工作提供科学的分析方法和应对手段。  相似文献   

12.
[目的/意义] 由于传统科技创新主题概率识别方法忽略文本内容语义理解,为了更加准确地识别出主题,科技创新主题语义识别势在必行。[方法/过程] 提出一种基于LDA的科技创新主题语义识别方法,利用语义角色标注技术对科技文献中的科技创新内容进行语义标引,构建LDA主题语义识别模型,根据表征科技创新内容的关键词语义角色对应的上位词的概率识别出科技创新主题。[结果/结论] 通过以3D打印领域数据为对象进行实验,证明该方法能够更加准确地识别出科技创新主题,形成科技创新主题-主题词-科技文献的混合分布聚类集群,减少研究背景等无关数据干扰,避免语义含义相同的科技创新主题词重复统计问题。  相似文献   

13.
[目的/意义] 探究科学数据开放共享中的数据质量问题及其治理对策,以便促进科学数据开放共享的有效实施。[方法/过程] 运用规范分析法和因果分析法,分析当前科学数据开放共享中的数据质量问题和引发问题的根本原因,构建科学数据开放共享数据质量治理模型,并从诱因入手提出4类治理对策。[结果/结论] 科学数据开放共享中的数据质量问题涉及科学数据的准确性、完整性、一致性、及时性、可靠性、关联性、开放可访问性。可以从政策法规、组织管理、技术与平台、利益相关者4个方面制定科学数据质量治理对策,从而解决相关科学数据质量问题,进一步推动科学数据开放共享的实施。  相似文献   

14.
[目的/意义] 探究科学数据开放共享中的数据质量问题及其治理对策,以便促进科学数据开放共享的有效实施。[方法/过程] 运用规范分析法和因果分析法,分析当前科学数据开放共享中的数据质量问题和引发问题的根本原因,构建科学数据开放共享数据质量治理模型,并从诱因入手提出4类治理对策。[结果/结论] 科学数据开放共享中的数据质量问题涉及科学数据的准确性、完整性、一致性、及时性、可靠性、关联性、开放可访问性。可以从政策法规、组织管理、技术与平台、利益相关者4个方面制定科学数据质量治理对策,从而解决相关科学数据质量问题,进一步推动科学数据开放共享的实施。  相似文献   

15.
[目的/意义] 针对我国当前科学数据共享中的隐私问题,探索隐私治理方法和对策以便更好地实现科学数据共享。[方法/过程] 运用文献调查法和建模法,在厘清科学数据共享隐私问题的基础上,提出4项隐私治理原则,构建隐私治理模型,探索科学数据共享中的隐私治理对策。[结果/结论] 可以采用完善隐私保护法律体系、加强隐私保护配套制度建设、采用隐私增强技术、提升利益相关者隐私素养、构建隐私伦理保护规制、加强科学数据流程管理等措施来实施隐私治理,从而有效促进科学数据共享。  相似文献   

16.
[目的/意义] 针对我国当前科学数据共享中的隐私问题,探索隐私治理方法和对策以便更好地实现科学数据共享。[方法/过程] 运用文献调查法和建模法,在厘清科学数据共享隐私问题的基础上,提出4项隐私治理原则,构建隐私治理模型,探索科学数据共享中的隐私治理对策。[结果/结论] 可以采用完善隐私保护法律体系、加强隐私保护配套制度建设、采用隐私增强技术、提升利益相关者隐私素养、构建隐私伦理保护规制、加强科学数据流程管理等措施来实施隐私治理,从而有效促进科学数据共享。  相似文献   

17.
[目的/意义]为全面、客观、高效、直观地掌握科技领域主题的发展规律和演变趋势,提出一种基于多源数据的领域主题演化路径识别和分析框架。[方法/过程]获取不同来源的科技文献数据,利用多维样本有序聚类方法辅助时间切片,基于改进的词袋构建方法,提升LDA模型主题识别效果,借助Louvain社区发现算法在主题层进行多源数据的融合,分析领域主题演化路径。[结果/结论]利用美国太赫兹研究领域基金项目、论文和专利3种来源的数据进行实证研究,结果表明,3种数据源能够清晰划分出4个时间窗口,改进的词袋构建方法能够表征更准确的领域信息内涵,主题社区有助于从多源数据复杂的演化网络中厘清主题演化脉络。  相似文献   

18.
基于主题模型的科技报告文档聚类方法研究   总被引:1,自引:0,他引:1  
[目的/意义]探索实践以科技报告为文献载体形式的融合主题模型的文本聚类方法,拓展基于科技文献进行技术监测服务的新领域,提出基于科技报告进行语义分析的新方法。[方法/过程]以国家科技报告服务系统中的科技报告为数据源,首先基于LDA主题模型对经过文本预处理的科技报告进行主题挖掘,再基于Ward与K-means相结合的聚类算法对包含主题分布信息的文本向量进行聚类分析,尝试提出一种适合科技报告文档聚类的文本挖掘新方法。[结果/结论]实验结果表明,LDA主题模型能有效准确挖掘科技报告中的主题信息,所提出的Ward与K-means相结合的聚类算法对科技报告的聚类效果也优于其它传统聚类算法。  相似文献   

19.
[目的/意义] 为帮助读者从热点事件产生的海量微博报道中快速了解事件的来龙去脉,提高微博事件摘要的准确性和可读性,提出一种基于事件要素的多模型微博热点事件时间轴摘要提取方法。[方法/过程] 针对微博文本特征,结合主题模型(LDA)与互信息最大熵模型(MaRxEnt-MI)的特点提取事件摘要关键词,以微博传播价值和主题相关性为标准筛选微博,以时间-摘要关键词-摘要微博的形式生成时间轴摘要。[结果/结论] 利用人工标注的测试集,与传统的TextRank方法进行对比,F值提高8%-13%,内部测试表明摘要可读性提高明显。实验文本和测试集的数量及事件丰富度需要进一步扩展,应考虑更多的加权策略模型以提高摘要的准确性。实验结果及测试反馈表明,本文的方法能很好满足用户对热点事件摘要信息需求,提高微博摘要提取的准确率。  相似文献   

20.
[目的/意义] 针对当前非正式信息交流主题演化研究在分析层次和测度指标两方面存在的局限,提出一种具有通用性的演化分析方法,从微观和中观层面探究主题演化特征与规律。[方法/过程] 引入会话分析理论,以新浪微博和知乎为例,通过对主题和主题簇运行过程进行分析,从会话内容和讨论方式两个维度揭示非正式信息交流演化特征与规律。同时,设计主题持续性计算判定方法,丰富主题演化的衡量标准。[结果/结论] 主题演化分析结果显示新浪微博和知乎意见群体的发文主题存在明显偏重,且表明了意见群体参与社会焦点事件讨论中观点的主要切入角度;主题簇演化分析发现了新浪微博意见群体在一定范围内发散探索多元主题、知乎意见群体始终关注聚焦核心主题的讨论特点。两个社交媒体中意见群体在会话内容和讨论方式方面的区别,喻示了新浪微博和知乎在网络环境的非正式信息交流中主要承担的角色差异。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号