首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
王彦慈 《情报科学》2017,35(8):23-27
【目的/意义】当前微博已成为重要的舆论场,针对海量微博信息的舆情难以快速获取的问题,提出一种基 于云计算的微博舆情流式快速自聚类方法。【方法/过程】该方法首先设计舆情最小距离聚类算法,包括构建舆情相 似度计算模型,及构建舆情最佳聚类阈值确定方法;然后构建舆情流式自聚类模型,该模型利用云计算和最小距离 聚类算法在横、纵两个方向聚类舆情信息,得到各主题的舆情集合。在横向上,以云计算的多个计算节点为聚类起 始,同步并行聚类分配到其上的舆情信息。在纵向上,多个计算节点协同、流水线式聚类同一起始节点的舆情信 息;最后在纵向上聚类舆情集合,将同主题舆情集合聚为一类。【结果/结论】实验结果表明:该方法能有效加快微博 舆情获取速度,且具有较高的舆情获取准确率。  相似文献   

2.
介绍了网络舆情研究的背景及意义、热点发现的概念以及相关技术,并给出目前文本聚类领域普遍适用的聚类算法,最后探讨了网络舆情热点发现研究存在的问题,并展望了网络舆情热点发现的研究趋势。  相似文献   

3.
分析基于情报研究方法的网络舆情发现与分析的研究现状,在综合情报学有着广泛研究的链接分析法、聚类分析法和内容分析法的基础上,提出基于情报语义关联集成分析ISAIA新方法,在知识技术支持下集成链接分析法、聚类分析法和内容分析法,面向网络舆情处理拓展和深入情报学方法的研究.最后将ISAIA方法运用在智能网络舆情的热点发现与倾向分析研究中,构建和优化网络舆情系统.  相似文献   

4.
基于文本聚类与LDA相融合的微博主题检索模型研究   总被引:1,自引:0,他引:1  
伴随着微博的日趋流行,对微博信息的检索逐渐成为人们获取第一消息的手段.其中文本聚类和主题发现是信息检索领域的有效方法,采用适当的方法是影响微博短文本信息检索质量的关键因素.文章针对文本聚类和LDA主题模型的互补特征,综合考虑了微博特殊文体和短文本聚类效率问题,提出了基于频繁词集的文本聚类和基于类簇的LDA主题挖掘相融合的微博检索方法,给出了针对微博文体的一种新的主题检索模型.实验表明,该方法不仅能有效地划分微博文本,并且能清晰地挖掘类簇中潜在主题.  相似文献   

5.
提出一种基于数据挖掘的微博热门话题预测方法,在对微博词汇进行基于词频的热门分类基础上,通过热点发现、特征提取、发现学术领袖、热点追踪、关注学术领袖和热点分析6个阶段对预测进行分析和处理。通过统计的方法实现热门预测结果输出。采用一组网络词汇进行实际的热门预测仿真分析,结果显示,基于数据挖掘的微博热门话题预测方法能够更好的实现微博热门话题的预测,预测结果聚类特性优于传统预测方法,算法收敛特性好,具有很好的预测使用价值。  相似文献   

6.
微博社区交流网络结构的实证分析   总被引:2,自引:0,他引:2  
微博客是继博客之后迅速发展起来的一种新的网络社区平台。以M yspace9911网站为研究样本,通过核心-边缘分析和聚类分析,探讨微博社区用户交流网络结构,界定核心与边缘区域,描述聚类群组,发现核心区域和聚类群组的联系,为完善微博社区信息交流系统提供借鉴。  相似文献   

7.
微博文本聚类是依据微博主题不同将描述同一类主题的微博文本汇聚到一起的过程。由于微博文本非常短,在使用常规的机器学习方法对微博短文本进行聚类时,常会出现严重的数据稀疏问题,继而对聚类性能产生影响。分析了中文微博文本的数据稀疏特征,并基于这一特征分析比较了几种中文微博文本表示及聚类方法,为中文微博文本聚类分析的难点问题提供了一定的解决途径。  相似文献   

8.
【目的/意义】通过构建数学模型,研究大数据背景下微博舆情热度预测问题。【方法/过程】分析大数据背景 下的微博舆情的首发信息特征,定义首发信息影响系数,建立微博首发信息热度预测方程模型。【结果/结论】利用百 度指数、清博舆情等软件,研究 47个微博舆情实例分析模型特征,并用 6个微博舆情案例验证模型,得出该模型根据 微博首发信息的少量数据而得到较为准确的预测结果。研究成果有利于政府面对复杂微博舆情时做到“心中有 数”, 也为进一步研究大数据背景下微博舆情预测问题提供参考。  相似文献   

9.
李保秀 《科技广场》2012,(4):148-152
在研究微博信息传播模式的基础上,借鉴网络传播中采用的信息空间模型构建了微博舆情的三维空间,对微博舆情的主客体进行分析,建立了微博舆情监测指标体系。该指标体系充分考虑了主客体的不同特点和关系,并提出体系中不同指标的量化方法,为管理者对微博舆情进行疏导提供了决策上的支持。  相似文献   

10.
【目的/意义】通过对政务微博网络舆情信息传播效率进行评价,有利于政务微博的运营和管理。【方法/过程】应用道格拉斯生产函数对政务微博网络舆情信息传播效率评价指标体系的投入和产生指标进行分析,应用DEA模型对政务微博网络舆情信息传播效率进行测算和评价,并利用聚类分析方法对政务微博进行分类,从而对政务微博信息传递指标进行归纳。【结果/结论】政务微博规模效率表现较差的原因是政务微博信息传播效率表现不佳;政务微博信息传递规模效率较低的原因是粉丝数和关注数不足;最后基于投影分析,提出政务微博信息传递效率的改进方案。  相似文献   

11.
王倩倩 《现代情报》2017,37(10):158-164
国内随着2004年网购的兴起,研究在线商品评论的文章开始逐年增多,本研究尝试利用文献计量学的方法对国内在线商品评论的学术文献进行统计分析,以探寻该领域的研究热点。以CNKI期刊全文数据库为数据来源,以BlueMC和SPSS软件为工具,对国内在线评论文献的关键词,通过词云图聚类和共词分析探索研究热点。提炼出在线评论研究的4个基本分析单元:内容、技术、用户、应用;五大研究热点:口碑传播效应、信息服务与使用、口碑传播心理、信息质量评估和知识挖掘与发现;以及三大研究层面:形态层面、受众层面和效果层面,为把握在线评论的研究现状和相关内容的进一步研究奠定了基础。  相似文献   

12.
高劲松  黄梅  付家炜 《现代情报》2021,40(12):130-139
[目的/意义] 能以简洁的可视化来追踪某学科研究热点随时间的变化趋势,对于掌握学科研究热点的动向具有重要意义。词频分析法是学科研究热点分析方法之一,目前存在众多的基于词频分析的可视化工具,但是这些可视化工具能够以简洁的可视化形式清晰地展现年度热点存在局限性。[方法/过程] 因此本文提出通过学科领域年度发文量与学科全部发文量的比值来衡量年度热点关键词对总年度热点关键词贡献率的可视化方法:基于年度贡献率与二八定律设定并调整阈值参数来控制年度高频关键词的呈现数量,将选取的年度高频关键词按照词频大小与年份依次排序以实现研究热点可视化。[结果/结论]以"关联数据"领域为例进行实证研究,通过分析本文方法提取的高频关键词与现有高频词阈值算法的匹配情况,对比本文方法与Citespace共现图谱的可视化呈现效果,对本文方法的可行性进行检验与评价。  相似文献   

13.
何晓萍  黄龙 《现代情报》2015,35(4):46-51
本文以Web of Science为数据源,运用信息可视化软件CiteSpace Ⅲ对所搜集的有关大数据研究的文献进行聚类分析和共引分析。通过CiteSpace Ⅲ生成的知识图谱并结合相关文献的研究内容,从演进路径、研究热点以及研究前沿三方面对大数据研究进行量化分析和解读。6篇关键节点文献很好地展示了大数据研究的演进路径,13个高频关键词和10个突现词表征了大数据的研究热点与研究前沿,得出结论:大数据的研究经历了从大数据的计算模型、具体概念、复杂性科学的理论研究到有关大数据社会科学层面、应用型实践层面研究的历程;大数据处理技术、大数据挖掘及大数据应用是大数据研究的三大热点;对大数据本身的研究、处理技术的研究、数据挖掘、系统、模型和网络的研究以及其绩效评估和数据管理的研究是大数据的研究前沿和发展趋势,文章旨在为现阶段大数据研究工作的深入开展提供参考。  相似文献   

14.
基于模糊向量空间的文本分类方法   总被引:1,自引:0,他引:1  
郑凤萍  刘春雨 《情报科学》2007,25(4):588-591
本文针对文本自动分类问题,提出了一种基于模糊向量空间模型和径向基函数网络的分类方法。网络由输入层、隐层和输出层组成。输入层完成分类样本的输入,隐层提取输入样本所隐含的模式特征,将分类结果在输出层表现出来。该方法在特征提取时充分考虑了特征项在文档中的位置信息,构造出模糊特征向量,使自动分类更接近手工分类方法。以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性。  相似文献   

15.
邓君  宋先智  钟楚依 《现代情报》2019,39(10):154-164
[目的/意义]随着数字人文领域研究热度的逐年升温,探究我国数字人文领域的研究现状有助于反思不足、明晰发展方向,从而为相关研究提供借鉴和参考。[方法/过程]以CNKI收录的2001-2018年的数字人文领域文献为数据来源,运用文献计量学对我国数字人文研究的时间、空间、高被引文献、等进行可视化分析与内容挖掘,识别研究前沿,以全面了解我国数字人文领域研究热点和发展趋势。[结果/结论]目前我国数字人文领域存在四大研究热点|数字人文学科分布呈现以图书情报档案学为中心向其它人文学科蔓延的趋势。  相似文献   

16.
国家重点生态功能区是国家为保护、恢复和提高区域水源涵养、防风固沙、保持水土、调蓄洪水、 保护生物多样性等重要生态功能而划定的需要重点保护和限制开发的区域。分析国家重点生态功能区人类活动空间变化,是环保等相关部门把握国家生态功能区宏观生态环境状况,并对其进行量化监管的重要手段。为此,本文基于面向对象方法提取了国家重点生态功能区510个县2010年、2015年两期的生态环境变化空间分布信息,并在此基础上采用土地利用转移矩阵及核密度法对两期人类活动造成的生态环境变化时空分布进行了分析。研究结果表明:国家重点生态功能区的生态环境变化中,71.77%的变化为耕地、工矿、建设用地的转入,27.53%为植被的转入;核密度提取出5个热点区域,包括燕山地区、吕梁山地区、黄土高原地区、武当山地区、大别山地区,占总变化图斑数的24.64%,黄土高原地区和大别山地区变化主要来自于工矿和建设用地的扩张,燕山地区和吕梁山地区变化主要来自于工矿用地的扩张,武当山地区变化主要来自于建设用地的扩张;以变化面积加权的核密度提取出1个热点区域,即西拉木伦河地区,占总变化面积的20.53%,该地区的变化主要来自于耕地的扩张。  相似文献   

17.
基于量子自组织网络的Web文本自动分类方法   总被引:3,自引:0,他引:3  
针对Web信息挖掘中的文本自动分类问题,提出了一种基于模糊特征向量和量子自组织特征映射网络的分类方法.该方法在特征提取时充分考虑了特征项在文档中的Web位置信息,构造出模糊特征向量,使自动分类原则更接近手工分类方法.  相似文献   

18.
利用双向聚类方法揭示我国医院绩效评价研究的核心作者及其热点研究方向,发现存在的主要问题。以CNKI中医院绩效评价为主题的文献作为研究对象,从作者和关键词两个维度,利用gCLUTO1.0软件进行双向聚类分析。结果显示目前国内医院绩效评价可以划分为5个核心作者群和7个热点主题,研究内容正在不断深入和细化,但在评价对象分级、整体性、内涵、指标设计和信息系统等方面仍然存在着诸多问题。双向聚类方法能够快速捕捉某个领域的主流研究热点及代表人物,分析结果较好地满足了预期目标。  相似文献   

19.
杨晶  罗守贵 《现代情报》2017,37(9):164-170
从EBSCOhost数据库中筛选出239篇文献为源数据,在共词分析法的基础上,利用SATI 2.5提取高频关键词,采用Gephi0.9.1对关键词进行聚类分析。结果表明:2008-2016年国外用户生成内容的研究热点集中在"生成动机"、"传播效应"和"在线社会网络";而以"大数据"和"消费者态度"为代表的商业情报研究从2013年开始逐渐成为新兴的热点问题。最后,结合研究趋势,从生成内容特征、生成内容动因和内容边界管理提出有待探索的问题供后续研究参考。  相似文献   

20.
以SCIE和SSCI数据库中有关海山研究的文献为对象,利用Thomson Data Analyzer、NetDraw和Excel分析软件,结合Pathfinder算法,进行数据挖掘、定量研究与可视化分析,揭示国际海山研究领域中主要国家和机构的发文情况、合作情况与研究热点,从而掌握现今海山领域的研究发展态势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号