首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
出版类数据集作为关联开放数据(LOD)云图中的重要数据集合,成为继社交网络类、政府类数据集之后增速最快的一类,受到了广泛关注.论文旨在通过对LOD云图中出版类数据的深入分析,从已发布的数据集、关联应用、词表使用、元数据信息等最佳实践角度入手,探索国外关联开放数据的服务模式,进而为我国发展关联开放数据提供参考.图4.表7.参考文献19.  相似文献   

2.
本文基于微信平台的虚假健康信息传播现状及其存在的问题,从中寻求治理对策,消除虚假健康信息不良影响,实现精准健康传播,促进健康医疗大数据应用发展。  相似文献   

3.
利用聚类分析工具可以从海量的、日益增长的基因表达数据中解析出其中可能的编码基因及其生理功能,这是生物信息学中一项很有意义的工作。模糊聚类算法是一种常用的基因表达数据聚类分析工具,可以发现重叠的基因簇,它不强制将每个基因归入某个具体的聚类中,而是计算每个基因对各个类的隶属度。本文分析了基因表达数据的模糊聚类分析方法及其重要应用。  相似文献   

4.
在电子商务中,协同推荐技术能够帮助用户发现感兴趣的东西.在协同推荐中,通常采用最近邻居的方法来产生推荐.随着商品数量的增多,协同推荐所需要的数据集也越来越稀疏,可用数据比例越来越少.为了解决这个问题,本文在传统的评分数据的基础上,引入用户的基本信息,对用户的基本信息进行离散化处理,将用户的基本信息转化成一个0、1的向量,在用户的信息的基础上计算最近邻居,根据最近邻居对用户缺失数据进行补充,在补充后的评分数据上进行聚类计算,并根据聚类结果对用户评分进行预测.实验表明引入用户的基本信息,并采用对基本信息离散化的处理方式进行缺失数据补充,在此基础上进行数据的聚类,能够提高预测评分的准确性.  相似文献   

5.
詹骞  赵冰洁 《现代传播》2022,(8):155-161
虚假信息的算法治理往往偏向于中宏观层面的通用性论述,而缺少微观层面的跨学科尝试。针对健康类虚假信息,在梳理了人工神经网络治理的沿革之后,获取了来自权威辟谣平台和科普平台的8972句虚假信息与8464句真实信息,采用长短期记忆网络模型对其进行深度学习和反复检验,发现该模型最终能在真实信息环境中进行较为准确的虚假信息识别。尽管以此为代表的算法治理存在多种限度,但依然会在多主体的协同治理中处于底层核心位置。在人与技术共存共生的格局下,虚假信息的生产与治理形成了独有的算法张力。  相似文献   

6.
XML文档自动聚类研究   总被引:6,自引:4,他引:6  
潘有能 《情报学报》2006,25(2):215-220
本文在文本聚类的基础上对XML文档自动聚类进行了研究,对划分聚类法和层次聚类法进行了改进,使之适合于XML文档聚类;给出了元素比较法、边集比较法和编辑距离法等三种计算文档间相似度的方法,并利用实际数据进行了测试和分析。  相似文献   

7.
社交媒体虚假健康信息特征识别   总被引:1,自引:2,他引:1  
[目的/意义]识别社交媒体虚假健康信息特征,构建社交媒体虚假健康信息特征清单,以期为社交媒体虚假健康信息特征的测度提供一定理论支撑,也为用户和社交媒体平台判别虚假健康信息提供有益参考.[方法/过程]采集1 004条社交媒体健康数据,利用程序化编码抽取社交媒体虚假健康信息的关键特征,运用卡方检验和方差分析揭示社交媒体虚假...  相似文献   

8.
基于信息可视化技术的文本聚类方法研究   总被引:4,自引:0,他引:4  
杨峰  周宁  吴佳鑫 《情报学报》2005,24(6):679-683
信息可视化是信息管理和信息系统的热点研究问题。随着网络技术的发展,充分有效地利用丰富的文本资源成为人们关注的焦点。文本聚类是处理文本的重要方法之一。本文在分析现有文本聚类方法的基础上,结合可视化技术解决该类问题的一般过程,给出了一个基于非线性映射实现的可视化技术进行文本聚类的方法,并通过案例说明该方法的特点,指出它与目前流行方法的不同以及其优势所在。  相似文献   

9.
社交媒体环境下,虚假信息泛滥与信息茧房现象共存,网络用户虚假信息识别能力日益下降,给网络环境治理带来更大困难。文章在分析信息茧房产生的信息窄化、群体极化和过滤气泡三大效应基础上,从个人层面、社会层面和信息层面构建用户虚假信息识别能力的指标体系,并分析信息茧房三大效应对用户虚假信息识别能力的影响与作用。研究发现,信息窄化效应通过个人层面和信息层面直接影响用户虚假信息识别能力,群体极化效应通过个人层面对用户虚假信息识别能力产生直接影响、通过社会层面产生间接影响,过滤气泡效应则通过信息层面对用户虚假信息识别能力产生直接影响、通过社会层面产生间接影响。最后提出了图书馆参与提升用户虚假信息识别能力的相关建议与策略。  相似文献   

10.
基于控制词集的中文信息动态自动聚类研究   总被引:1,自引:0,他引:1  
以专用词典为切分工具,建立以概念为基础的、具有主题分类特点的类目结构是中文信息动态自动聚类的一种适用方式。该文探索了基于控制词集的中文信息动态自动聚类技术,包括专用控制词集的构建,动态有限环境下的自动聚类程序、聚类算法,以及结合控制词集对聚类结果进行优化控制等,最后对实验结果给出了概要评价。  相似文献   

11.
本文介绍了网络环境下的虚假信息及其产生的危害、原因,并提出了一些防范治理及利用的措施。  相似文献   

12.
文章以汤森路透为例,剖析了这一全球领先的知识服务商的商业模式:专业内容为基础,数据库为平台,顶层的信息服务软件和终端设备为问题解决工具.这种金字塔式的服务架构得益于汤森路透的创新基因:数据闭环、信息聚类和个性定制,是汤森路透的差异化竞争优势所在.对国内的数字出版以及信息服务行业来说,更具有独特的借鉴价值.  相似文献   

13.
利用改进的信息增益特征选择的方法,对文本进行了有效的自动聚类。从语料库中抽取了250篇文本,利用向量空间模型和信息增益特征降维方法,构造文本特征向量,并最终利用C-均值方法聚类,聚类结果精度、召回率、F-measure分别达到0.82、0.88、0.83。  相似文献   

14.
查询优化与动态自动聚类系统   总被引:4,自引:0,他引:4  
查询优化在大型检索系统中是十分必要的。查询优化包括静态形式、结合词集的形式和动态自动聚类形式。文章概要分析了AlltheWeb、Teoma、Vivisimo、GuideBeam等动态自动聚类的特点和机制,并提出了建立动态自动聚类系统的一些建议。  相似文献   

15.
一种使用自动聚类思想的自动文摘方法   总被引:5,自引:0,他引:5  
杨建林 《情报学报》2001,20(5):532-536
本文提出了一种使用自动聚类思想的自动文摘方法 ,这种方法是进行自动文摘研究的一种新的有益的尝试。该方法首先利用词频统计方法得到文献的关键词向量、每个段落的关键词向量 ,然后利用自动聚类的方法将文献分为若干个段落类 ,从中选出与文献主题相关的段落类作为候选的用来挑出文摘句的段落类 ,最后从候选段落类中选出文摘句构成文摘  相似文献   

16.
高校图书馆阅览信息资源的聚类导读管理   总被引:2,自引:0,他引:2  
王耘 《图书馆论坛》2005,25(3):159-160
论述阅览室信息资源聚类导读管理方法,提出聚类导读管理应注意的问题。  相似文献   

17.
支持向量聚类(Support Vector Clustering, SVC)算法主要分为两个阶段:训练阶段和聚类分配阶段.由于需要计算邻接矩阵,聚类分配阶段消耗的计算时间远比训练阶段多.本文在计算邻接矩阵前先利用核矩阵对数据进行初始分类,在每个初始类中寻找一个代表点.因为代表点和它所在的初始类拥有相同的簇标号,所以只需计算这些代表点集上的邻接矩阵.给每个代表点分配一个簇标号,代表点所代表的初始类内的数据点也就获得相同的簇标号,这样将有效减少聚类分配的时间.数值实验结果表明,本文提出的改进SVC算法不仅显著改善了SVC算法的时间性能,而且在聚类精度上也有一定程度的提高.  相似文献   

18.
基于凝聚式层次聚类算法的标签聚类研究*   总被引:8,自引:1,他引:8  
对标签、标注、大众分类等概念进行界定,指出现有标签标注系统中存在着标签描述信息的精确度不高、标签检索结果相关度低、标签缺乏有效组织等问题,提出采用凝聚式聚类算法对标签聚类,从而实现对标签的重新组织,为用户提供更好的标签导航、浏览机制。最后通过实验对标签聚类方法进行验证。  相似文献   

19.
网络信息生态中Web虚假信息的传播特征分析   总被引:1,自引:0,他引:1  
面对网络媒体混乱不堪的信息生态状况,互联网信息管理受到各国政府及相关网络组织密切注意,网络信息生态治理已成为目前迫切需要解决的重要课题。文章着重对Web网络虚假信息的传播特征进行分析,目的是为网络生态治理策略的选择提供支持。  相似文献   

20.
潘钧 《东南传播》2023,(1):26-28
近年来,新媒体凭借满足受众个性化需求、表现形式多样、信息实时发布等优势,获得越来越多受众的青睐,促使报刊、电视、广播等传统媒体纷纷拓展新媒体业务,形成强大的矩阵发展模式。可是,为了吸引更多受众眼球,或是把关不严等原因,我国部分新媒体平台出现了与低俗、虚假等内容擦边的情况。本文以江西失踪学生胡某宇事件为例,揭示网络虚假信息对新媒体的影响,由此带来的信息污染,并对其防范措施提出一些思考与建议。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号