共查询到20条相似文献,搜索用时 0 毫秒
1.
随着社会经济的不断发展,现代科学技术水平的不断提升,互联网迅速普及,深刻的影响着人们日常生产生活,而随着互联网的不断发展,怎样快速有效地从互联网中获取生产生活中所需的数据信息成为互联网企业及广大网络用户热切关注的重点内容,网络爬虫又被称呼为网络蜘蛛或网络机器人,其实际上是一个程序,能够遵循特定的规范规则以及给定的URL... 相似文献
2.
[目的/意义]研究涉警网络舆情主题特点及网民情感变化,可以为构建良好的警民关系和警察形象提供参考,具有重要的社会意义和实际价值。[方法/过程]获取微博平台涉警网络舆情数据,使用LDA主题模型及TF-IDF算法对网络舆情数据进行主题发现研究,基于Word2Vec模型构建涉警网络舆情领域情感词典,进而对网民情感进行分析。[局限]在案例选取及分析方面不够全面。[结果/结论]通过LDA主题模型及TF-IDF算法可以使主题划分更为明显,基于领域情感词典的情感分析也较为准确,更好地反映出舆情传播过程中热点话题及网民情感的变化。 相似文献
3.
网络爬虫在网络数据收集与分析上发挥了重要的作用.在大数据背景下,依托于Python的网络爬虫技术具有操作简单、应用便捷、第三方库功能齐全以及文本字符串处理效果好等优势.论文利用爬虫技术进行网页抓取具有广度最先、深度最先以及相似最先三种检索方案,包含了URL管理器模块、网页下载器模块与网页解析器模块. 相似文献
4.
5.
以微博、微信、微电影为代表的新媒体技术迅速崛起,使涉军网络舆情的产生、发酵和传播速度大大加快。搞好微时代涉军网络舆情的引导,事关国家政权稳定,事关军队的良好形象,必须加大研究力度,增强涉军网络舆情引导的针对性和实效性。 相似文献
6.
7.
随着新媒体行业不断发展,涉军网络舆情呈逐年递增的趋势,并且在网络意见领袖的参与下无论是正、负面信息,都会夺人眼球、迅速爆燃。因此,新形势下遵循舆论传播规律,正确应对和引导网络意见领袖显得尤为重要。本文通过分析网络意见领袖对涉军舆情的影响,提出了相应的对策建议,即要发挥现有网络意见领袖的积极作用,培养军队网络意见领袖,以及强化对网络意见领袖的约束。 相似文献
8.
融合主题与情感特征的突发事件微博舆情演化分析 总被引:1,自引:0,他引:1
[目的/意义]微博是突发事件网络舆情传播的重要媒介。面向突发事件的微博主题和情感挖掘对掌握突发事件的网络舆情、识别与预测潜在问题及风险等方面具有重要的实践意义。尝试提出一种融合主题与情感特征的突发事件微博舆情演化分析方法。[方法/过程]以寨卡事件为例,通过划分微博舆情演化的生命周期,基于word2vec技术分别提取该事件生命周期各阶段的微博主题,采用基于词典的情感分析方法,引入情感词、表情符号等多情绪源,对不同主题下的评论情感做细粒度划分,并计算情感强度,最终实现微博主题与情感的协同分析。[结果/结论]所提出的微博舆情演化分析方法能够揭示面向特定事件的微博在突发事件生命周期各阶段的主题特征、情感类型与强度,剖析网络舆情主题与情感特征的协同演化规律。 相似文献
9.
基于主题的网络舆情分析模型及其应用 总被引:12,自引:0,他引:12
钱爱兵 《现代图书情报技术》2008,3(4):49-55
网络舆情分析是信息处理领域内的一个新兴且有实用价值的方向。文章分析了网络舆情分析的基本问题,提出了难点以及相关的解决方案,并在此基础上设计了基于主题的网络舆情分析模型。 相似文献
10.
[目的/意义]针对目前从开源网络信息中采集网络恐怖信息难、采集效率低的问题,提出一种回归分析法,以综合语义相关与网页重要性两个因素,从而提高网络恐怖信息的采集效率。[方法/过程]通过分析、比较主题爬虫的特性,结合网络恐怖信息的特点,找出PageRank算法和TF-IDF算法中适用于恐怖信息采集的优点,并结合回归分析法,将恐怖信息的采集策略进行相关度预测,用预测结果反馈调节信息的采集过程。[结果/结论]网络恐怖信息采集要兼顾采集的数量和质量,在传统主题爬虫算法的基础上进行改进,提出针对于开源网络恐怖信息采集的爬虫优化算法,可以提高信息采集效率。 相似文献
11.
当前,网络舆情与网络舆情事件作为一种新的社会现象,正在引起广大媒体及全社会的高度关注。为什么网络舆情能够节节攀升,又为什么能够频频引发网络舆情事件?这其中必有其值得媒体思考和借鉴的地方。本文试图围绕这一命题,从广播等媒体的角度做一分析和探讨,以便开启思路,汲取营养,促进广播的自我改造和提升,使之在面对社会舆情滚滚涌来的新形势下,能够更好地发挥其宣传引导作用。 相似文献
12.
基于语义爬虫的商品信息主题采集研究* 总被引:2,自引:0,他引:2
黄炜张李义 《现代图书情报技术》2010,26(1):3-8
结合网页主题链接分析和网页主题内容语义分析,提出一个以主题爬虫实现采集商品信息的方法。在爬行过程中通过对本体的统计学习,使主题本体参照物不断得到优化。实验结果表明,该方法较其他传统爬行算法更有效,并能防止主题漂移的发生,带来较高的主题收获率。 相似文献
13.
14.
基于P2P的分布式主题爬虫系统的设计与实现 总被引:1,自引:0,他引:1
本文详细叙述了一个用于信息检索的基于P2P的分布式爬虫系统的设计和实现过程.系统基于锚文本上下文进行主题相关性判定,采用P2P式的分布式结构,充分利用其动态增加新结点的特性来动态地扩展系统的规模,提高系统的整体吞吐能力,以满足现在和将来的用户对日益增长的大数据量检索需求.实验结果表明,可根据用户给定的主题对网页链接上下文进行主题相关性判定以引导爬虫的爬行路径,能够有效地获取相关主题信息. 相似文献
15.
16.
互联网在发挥信息共享、舆论监督的同时,其负面作用也不容小觑:一些谣言和杂音肆意泛滥,不时掀起社会剧烈震荡。如何化解涉警网络舆情的窘境并进行有效的引导,使和谐的网络环境为构建社会主义和谐社会发挥重要作用,已成为当前公安信息化工作面临的一个重要课题。 相似文献
17.
图书馆免费开放的舆情分析 总被引:1,自引:0,他引:1
自从免费开放相关政策出台公布以来,我国民众通过报纸、电视、网络、业界各个渠道进行大量的报道与分析。文章通过对这些媒介的免费开放舆情分析,总结了这些舆情报道的特点与启示,以期能对免费开放政策实施以来的舆情变化有一个系统了解与启示。 相似文献
18.
19.
20.
数字化信息服务作为图书馆服务的重要组成部分,优化信息检索技术、提高公共图书馆数字化服务水平是图书馆领域一直探讨的问题。网格信息检索技术是利用网格技术具有的强大计算机优势和资源共享优势,为信息检索提供查询调度以及资源管理的服务。网格技术下主题爬虫依照目标主题进行相关的信息搜集、智能处理和分析、满足用户检索需求。其对于信息收集的精准化、信息处理智能化、信息检索高效化、信息知识共享化等特征,在提高图书馆数字化服务中对于信息获取的查全率、查准率、专业性、以及查询速度等方面发挥优化作用。 相似文献