首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于主题模型的科技报告文档聚类方法研究   总被引:1,自引:0,他引:1  
[目的/意义]探索实践以科技报告为文献载体形式的融合主题模型的文本聚类方法,拓展基于科技文献进行技术监测服务的新领域,提出基于科技报告进行语义分析的新方法。[方法/过程]以国家科技报告服务系统中的科技报告为数据源,首先基于LDA主题模型对经过文本预处理的科技报告进行主题挖掘,再基于Ward与K-means相结合的聚类算法对包含主题分布信息的文本向量进行聚类分析,尝试提出一种适合科技报告文档聚类的文本挖掘新方法。[结果/结论]实验结果表明,LDA主题模型能有效准确挖掘科技报告中的主题信息,所提出的Ward与K-means相结合的聚类算法对科技报告的聚类效果也优于其它传统聚类算法。  相似文献   

2.
[目的 /意义]算法推荐服务衍生的风险给人们的日常生活造成重大影响,厘清算法推荐服务风险的产生机制以及用户应对算法推荐服务风险的行为特征有助于进一步完善算法推荐服务体系。[方法 /过程]运用扎根理论,采用半结构化的访谈方式,一对一深度访谈30名网络用户,结合防护性行为模型和风险应对行为理论,探索算法推荐服务风险中用户的应对机制、影响因素以及决策路径。[结果 /结论 ]研究发现风险属性、传播渠道、平台特征和用户行为特征对算法推荐服务风险的传播产生影响;在风险传播的基础上,用户形成风险感知、利益相关者感知和防护性行为感知;用户在感知的基础上形成态度和效果评估,并以此为依据制定决策,采取不同的应对行为。最后从算法素养、风险参与和个体学习3个层次提出建议,以应对算法推荐服务风险。  相似文献   

3.
[目的/意义]算法推荐类APP吸引了大量用户使用,提高用户留存率一直是各类应用关注的重点。文章探索了用户流失行为的影响因素,为减少用户流失、提升用户使用体验提供建议和对策。[方法/过程]文章采集算法推荐类APP用户评论9772条,采用扎根理论对数据进行编码,以此厘清用户流失行为影响因素,构建算法推荐类APP用户流失行为影响因素模型。[结果/结论]信息因素、环境因素、系统因素、网络社群通过影响用户的控制感间接影响用户流失行为,用户的信息素养在控制感和用户流失行为中起调节作用。  相似文献   

4.
用户兴趣变化感知的重启动随机游走推荐算法研究   总被引:1,自引:0,他引:1  
针对目前重启动随机游走推荐算法忽略用户兴趣变化的问题,提出一种基于用户兴趣变化的重启动随机游走推荐算法。通过聚类识别用户的兴趣,建立用户兴趣模型,在此基础上,考虑兴趣的时间衰减,计算用户当前兴趣度。最后,根据用户当前兴趣度,形成用户转移概率矩阵,并做出推荐。实验表明提出的算法较传统的重启动随机游走推荐算法可以有效地提高推荐精度。  相似文献   

5.
通过对科研基金名称数据特点和文本数据聚类方法的分析,提出并实现了基于编辑距离算法(Levenshtein Distance)的科研基金名称数据分析方法,该算法首先通过设定相似度方式对科研基金名称数据进行聚类形成数据分组,再对分组数据进行二次聚类计算出组的相似度之和,并据此判定数据聚类中心。该方法已经成功应用于中国医学科学院医学信息研究所的医学文献基金数据处理。  相似文献   

6.
文本软聚类是适应学科发展而逐步兴起的一项文本聚类技术,它更加全面地反映文本的特征信息.本文首先分析了文本软聚类技术的现状,提出了基于惩罚性矩阵分解(PMD)的文本软聚类算法,并应用于文本聚类研究.实验结果表明,本文提出的算法具有较好的聚类结果.  相似文献   

7.
文章以信息生态理论为基础构建高校图书馆智慧服务生态系统,并对系统中的关键影响因素进行识别与分析,进而提出高校图书馆应采取强化数据素养教育,优化数据服务效能;完善供需匹配机制,提升智慧服务精度;以技术推动创新,优化用户服务体验;推动馆内空间再造,营造智慧服务环境等策略提升智慧服务质量。  相似文献   

8.
信息推荐算法个性化、迎合式的信息分配理念与模式,不可避免地减弱了公共性信息的覆盖度,极易引发内容生态失衡以及价值失序。研究发现,信息推荐算法有过度迎合青年娱乐消费的倾向,在传递价值方面表现欠佳,对主流价值内涵阐释和实践示范的影响力不足,影响青年主流价值认同水平。另外,青年“算法成瘾”问题明显,抵御算法机制诱导能力不足,潜藏价值认同风险。本文提出聚焦信息推荐算法价值承载力、提升青年算法素养、落实平台主体责任、应用新兴内容科技、构建价值监管与治理体系等五个方面的治理策略。  相似文献   

9.
[目的/意义]结合当前个性化推荐算法的广泛应用,梳理信息弱势群体在使用短视频平台过程中算法素养的形成机理,识别信息弱势群体算法素养的影响因素,为信息弱势群体算法素养培育工作提供依据。[研究设计/方法]采用扎根理论,利用Nvivo12对访谈资料进行三阶段编码,最终构建信息弱势群体与短视频内容推荐算法交互中算法素养的形成机理与影响因素模型,对信息弱势群体的算法素养展开探索性研究。[结论/发现]信息弱势群体在短视频平台的使用过程中对内容推荐算法的感知主要由与算法的交互、用户兴趣点的变化、使用平台的更换、与他人的比较所触发,同时受用户使用短视频平台的目的以及自主权意识的影响。此外,算法素养的各组成部分之间并不独立:用户对内容推荐算法逻辑的理解水平受其对算法的感知程度影响。理解内容推荐算法较深的用户在使用短视频平台时会保持较为批判的态度,并采取积极的算法调控行为。[创新/价值]深化了短视频平台交互中算法素养的形成机理并提炼了相关影响因素,为信息弱势群体算法素养培育工作提供对策。  相似文献   

10.
本研究试图从技术层面,通过对算法推荐流程的观察与研究,在算法输入数据搜集与审查环节的纰漏、算法模型设计的偏见与偏差、用户权利滥用破坏信息流的互动环境等方面建立分析框架,对聚合类新闻客户端算法偏见的衍生机制进行系统研究,为算法偏见治理、规范算法新闻生产探索新路径。  相似文献   

11.
基于关键词的科技文献聚类研究   总被引:1,自引:0,他引:1  
描述一种基于改进TF IDF特征词加权算法的科技文献聚类方法:首先提取科技文献的特征词;然后根据特征词的词频、所在位置和词性为特征词加权,建立科技文献的向量空间模型;接着使用基于密度的聚类算法对科技文献向量空间模型数据进行聚类分析;最后使用主成分分析法对科技文献聚类的结果进行标识,利用F measure方法对聚类结果进行评价。实验表明,用提出的科技文献聚类方法能够从所检索的科技文献中发现热点研究领域,并能识别具有学科融合性质的研究方向。  相似文献   

12.
基于样本加权的文本聚类算法研究   总被引:3,自引:0,他引:3  
样本加权聚类算法是一种最近才引起人们注意的算法,还存在一些需要解决的问题,例如,聚类对象之间的结构信息对样本加权聚类是否有帮助,如何将结构信息自动转换为样本或对象的权重?针对该问题,本文以学术论文为聚类对象,以K-Means算法为聚类算法基础,利用论文之间的引用关系计算每篇论文的PageRank值,并将其作为权重,提出一种基于样本加权的新的文本聚类算法.实验结果表明,基于论文PageRank值加权的聚类算法能改善文本聚类效果.该算法可推广到网页的聚类中,利用网页的PageRank进行加权聚类,来改善网页的聚类效果.  相似文献   

13.
论文探讨利用R语言工具对图书馆新浪微博数据进行子主题聚类和挖掘,指出:在文本分词、构建词频——文档矩阵的基础上,使用Pamk算法和Kmeans算法进行微博聚类,获取图书馆服务质量评价与建议信息,挖掘图书馆核心微博用户,便于图书馆利用微博数据评估服务效果,改进服务质量。  相似文献   

14.
为了弥补目前微博平台主题挖掘方法的不足,兼顾到微博信息的稀疏性、多维性、海量性等特点,提出根据微博信息特点进行有针对性的预处理后,使用基于先验概率的潜在语义分析模型LDA(Latent Dirichlet Allocation)进行微博主题挖掘,并在LDA建模的基础上,设计文本增量聚类算法,进一步实现主题结构的识别,从而使用户更好地理解主题及其结构。通过在真实微博数据集上的实验,证明该模型能有效进行主题挖掘和主题结构的识别。  相似文献   

15.
[目的/意义] 为解决现有网页文本缺乏起源标注的问题,提出一种借助PROV本体发现相似网页文本起源关系的方法。[方法/过程] 通过聚类算法、自动语义标注和关联数据构建等技术的综合应用,结合PROV-POL溯源模型,检测网页文本实体的演变过程,实现文本级和属性级两级溯源方案。[结果/结论] 实验验证了借助语义网技术和数据溯源模型实现网页文本数据溯源的可行性,但实验过程中聚类算法的召回率有待提高。  相似文献   

16.
对BWP方法进行研究,从嵌入式NSTL个性化推荐的文本聚类需求入手,分析BWP方法的不足,提出一种改进的K-means算法最佳聚类数确定方法。对单一样本类的类内距离计算方法进行优化,扩展BWP方法适用的聚类数范围,使原有局部最优的聚类数优化为全局最优。实验结果可以验证该方法具有良好性能。  相似文献   

17.
在电子商务中,协同推荐技术能够帮助用户发现感兴趣的东西.在协同推荐中,通常采用最近邻居的方法来产生推荐.随着商品数量的增多,协同推荐所需要的数据集也越来越稀疏,可用数据比例越来越少.为了解决这个问题,本文在传统的评分数据的基础上,引入用户的基本信息,对用户的基本信息进行离散化处理,将用户的基本信息转化成一个0、1的向量,在用户的信息的基础上计算最近邻居,根据最近邻居对用户缺失数据进行补充,在补充后的评分数据上进行聚类计算,并根据聚类结果对用户评分进行预测.实验表明引入用户的基本信息,并采用对基本信息离散化的处理方式进行缺失数据补充,在此基础上进行数据的聚类,能够提高预测评分的准确性.  相似文献   

18.
针对传统协同过滤算法依赖单一用户需求形态影响推荐效果的问题,提出一种基于用户多态聚类的数字图书馆个性化推荐方法。该方法以改进的海明距离计算候选邻居集,结合多态相似度进行二次聚类,预测用户的多态需求度并形成推荐。实验表明,使用多态聚类产生的推荐精确度上优于单一聚类产生的推荐。  相似文献   

19.
熊亚光 《新闻战线》2023,(17):75-76
采用算法推荐可有效增强媒体的用户黏性、提升影响力;但算法被滥用,就可能导致信息茧房、舆论分化、报道同质化等,削弱媒体的建设性作用。应强化社会责任,建立科学合理的算法推荐模型、多元算法推荐评估机制、完善的算法推荐监管制度,以多层面的优化有效治理算法推荐乱象。  相似文献   

20.
面向网络问答社区海量问题内容组织的现实需求,针对用户提问的文本特点对其进行多层次主题聚类与图谱构建。通过充分融合Glove和Word2vec算法的优势,对用户提问进行文本特征表示。在此基础上利用不同聚类算法对用户提问进行多层次聚类,并利用TextRank生成聚类标签,然后基于主题间层次结构,利用图模型将不同提问文本的关联关系呈现出来,从而构建网络问答社区用户提问主题聚类图谱,以此提升网络问答社区平台知识资源的组织与利用效率,为知识查询和推荐提供索引。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号