首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
[目的/意义]旨在发现国内用户画像研究领域的研究主题以及这些主题的发展脉络,为图书馆用户画像的构建提供参考。[方法/过程]运用LDA主题模型对国内用户画像研究论文的题目、摘要和关键词等内容进行文本挖掘,按年度对热点主题进行分析并发现各主题的演化趋势。[结果/结论]国内用户画像研究领域大体可划分为8个研究主题:新媒体营销、电商系统与精准营销、推荐算法与推荐系统、健康信息服务、教育教学、金融服务、社交网络与内容分析、高校图书馆与信息服务。研究主题按年度演化趋势可分为上升主题、平稳主题和衰减主题3类。高校图书馆与信息服务是上升幅度最大的主题,这表明研究人员越来越关注用户画像在图书馆及相关领域的应用研究。  相似文献   

2.
田园  宫婷婷 《情报科学》2021,39(9):110-116
【目的/意义】为了进一步提升学生评教信息的使用价值,构建在线教学用户需求指标体系,对在线教学需 求数据进行主题挖掘。【方法/过程】运用数据挖掘理论和LDA主题识别模型,从丰富的在线教学评价内容中挖掘潜 在的在线教学主题,针对教学主题特征向用户需求进行结构映射,最终形成在线教学需求指标体系。【结果/结论】 分析在线教学数据,从教师需求、课程需求、教学成果需求三方面构建在线教学用户需求指标体系,并提出针对性 的教学质量优化策略。【创新/局限】本文通过在线教学需求数据主题挖掘,为高校在线教学评教指标体系的构建与 完善提供了新的途径和方法,但样本数据仅为单一高校数据,未实现全覆盖,对领域研究的整体态势分析还存在一 定的不足。  相似文献   

3.
【目的/意义】随着LDA模型成为微博信息推荐的主要工具,众多的LDA演化模型的使用问题成为研究者 亟待解决地问题。【方法/过程】首先,从演化发展角度对LDA模型运行机理进行了解析,揭示了模型使用的先决条 件和算法内涵;其次,从不同需求的视角揭示了RB-LDA、RT-LDA、C-LDA、MB-LDA等扩展模型对LDA模型的 功能性补充;最后,提出LDA模型的技术演化方向。【结果/结论】结果表明可利用微型本体来提升语义性、利用多种 模型融合来提升精度、利用大数据来提升数据质量是LDA模型未来的演化方向,可使LDA模型信息推荐能力的更 具个性化和精准化。  相似文献   

4.
王婧  武帅 《情报探索》2024,(2):1-11
[目的/意义]现有学科研究主题的梳理多为领域专家的定性分析和学科学者的文献梳理,一定程度会由于研究思维的局限性和获取知识的片面性造成学科研究主题误判,为有效避免漏判误判现象的发生,提出识别模型。[方法/过程]首先,运用传统LDA模型分析主题特征词;其次,结合上下文语义信息进行中文分词,形成学科主题词库;最后,结合隐含位置聚类算法发现潜在社区,提高主题识别效果。[结果/结论]提出的方法一定程度上优化了主题挖掘算法在识别短文本主题的效果,消除主观意愿。由计算机自行分类并实现科学研究前沿主题的预测,揭示前沿领域的研究热点,为致力于研究前沿学科的新兴学者提供参考价值。  相似文献   

5.
随着电子商务迅速发展,商品在线评论服务的重要性日益凸显。评论蕴含了众多消费者对特定产品和相关服务的真实感受,反映出了许多消费者的态度、立场和意见,具有非常宝贵的调研价值。以某电商平台的某款手机产生的评论为实验数据,对其进行了分词、词性标注和评论文本信息的预处理。基于预处理后的用户数据进行客户情感分析,使用LDA主题模型来分析用户评论,了解其潜在目标用户的需求、意见、购买原因,以及产品的优缺点,提出全面改善产品交互体验的相关建议。  相似文献   

6.
7.
基于Kano模型的个性化需求获取方法研究   总被引:7,自引:0,他引:7  
唐中君  龙玉玲 《软科学》2012,26(2):127-131
为平衡大规模定制生产中顾客满意度与产品维护成本之间的矛盾,提出了一种基于Kano模型的个性化需求获取方法。该方法首先运用Kano模型结合模糊聚类方法,对个性化需求进行识别与筛选,构建了产品的个性化需求层次模型;然后运用熵值法结合Kano模型,计算层次模型底层个性化需求项的权重,确定了个性化需求项的重要度排序。最后以手机产品为例,证明了所述方法的可行性和有效性。  相似文献   

8.
[目的/意义]对已有研究成果进行梳理有利于明晰国内科学数据管理研究发展现状。[方法/过程]结合生命周期理论与LDA模型,对1992—2021年国内科学数据管理研究相关文献进行统计分析,以识别我国科学数据管理研究的潜在主题、揭示阶段特征与发展趋势。[结果/结论]依照文献分布特征将我国科学数据管理研究阶段分为萌芽阶段、发展阶段与繁盛阶段。从主题维度来看,国内科学数据管理相关主题围绕科学数据的服务、政策、标准、平台建设与功能拓展、科研用户及科学数据共享而展开。从演进过程来看,国内科学数据管理经历了科学数据存储研究、科学数据共享基础设施建设研究、多主体全方位科学数据管理与服务研究三个阶段的主题演进。从发展趋势来看,科学数据政策、科学数据标准、科研人员以及科学数据共享主题的研究是未来该领域的研究热点。  相似文献   

9.
张亮 《现代情报》2016,36(2):53-56
针对现有的标签推荐方法存在的推荐准确率不高与效果不理想等问题,本文提出了基于LDA主题模型的社会化标签推荐方法。该方法利用LDA主题建模技术将传统的基于对象间关系的推荐方法扩展到融合对象间关系与资源内容特征的统一推荐。实验结果表明,该方法取得了理想的预期效果,能够显著提高标签推荐的质量与效果。  相似文献   

10.
【目的/意义】为微博用户生成质量较高的标签,帮助用户对微博特征进行描述。【方法/过程】首先,分析微 博的特征建立候选标签与候选词表。随后,用 LDA对用户的微博进行主题分析,将用户的微博与预选标签相匹配, 生成预选标签。最后,用 LDA对用户关注的人及用户的粉丝的微博进行主题分析,对预选标签进行控制生成最终 标签。【结果/结论】实验结果表明,本文以 LDA为基础提出的标签生成方法具有不错的效果,最终生成的标签能够 较为准确地描述用户的微博特征。  相似文献   

11.
王博  刘盛博  丁堃  刘则渊 《科研管理》2015,36(3):111-117
主题模型是一种有效提取大规模文本隐含主题的建模方法。本文将Latent Dirichlet Allocation(LDA)主题模型引入专利内容分析领域,实现专利主题划分,解决以往专利主题分类过于粗泛、时效性差、缺乏科学性等问题。并在原有模型基础上构建LDA机构-主题模型,对专利知识主体和客体联合建模,实现专利主题和机构之间内在关系分析。最后,以通信产业LTE技术领域为例,验证该模型可以有效用于专利主题划分,实现各主题下专利知识主体竞争态势测度。  相似文献   

12.
基于主题模型(LDA)的查新辅助分析系统设计研究   总被引:1,自引:0,他引:1  
马林山  郭磊 《现代情报》2018,38(2):111-115
文章概述了主题概率模型(LDA)的计算原理和方法,以及开源R语言中lda程序包采用快速压缩吉普抽样算法分析语料库的处理流程。设计了基于LDA模型的查新辅助分析系统设计功能框架,对其功能、编程实现思路和工作流程做了描述。最后结合课题查新实例,详述了采用LDA模型通过相关文献关键词进行潜在主题挖掘,对比分析课题研究内容,对课题给出客观评价的过程。结果表明,基于主题模型的查新辅助分析系统可以快速有效挖掘相关文献主题,降低查新员对相关文献的分析难度,提高课题评价的客观性,整体辅助分析效果良好。  相似文献   

13.
14.
李子彪  张莉 《科技管理研究》2020,40(24):175-183
为明确钢铁材料及其技术发展态势,实现新科技革命与钢铁产业高质量发展的深度耦合,研究从主题演化角度出发,借助LDA模型全面挖掘钢铁材料领域技术主题,深入考虑主题在强度、内容方面的动态演化过程,最终提炼钢铁材料发展特征及未来发展方向,并结合我国工业化发展阶段绘制相关路线图。研究表明:我国钢铁材料及技术多集中于基础性研究;材料性能将以高性能、长寿命、复合化、低维化、智能化为重点,材料类型呈现出由结构性材料向功能性材料延伸的趋势;未来我国将立足于钢铁材料的需求、研发和应用,分别从市场、技术、资源角度出发,进入钢铁材料智慧设计、智慧生产与智慧服务的新时代。  相似文献   

15.
16.
在概率主题模型中,LDA(Latent Dirichlet Allocation)是最基础也是最重要的模型,本文给出了一个具体的例子来展示LDA模型生成文档的基本过程。  相似文献   

17.
18.
林丽丽  马秀峰 《情报科学》2019,37(12):87-92
【目的/意义】为了解近年来图书情报研究的热门主题及其演化趋势,利用LDA模型进行文本挖掘。【方法/ 过程】选取CNKI作为检索数据库,以2006年至2017年图书情报学领域10本核心期刊中的论文摘要作为研究数 据,借助开源工具JGibbLDA构建LDA模型,运用困惑度来确定模型主题数目,根据主题-词项分布文件进行主题 标识,根据文档-主题分布文件计算主题强度。【结果/结论】2006年至2017年图书情报学领域有20个研究主题,其 中比较热门的主题有7个; 8个主题的强度呈上升趋势, 9个主题的强度呈下降趋势, 3个主题的强度变化幅度较小。  相似文献   

19.
基于Kano模型的政府数据开放平台用户体验要素分类研究   总被引:1,自引:0,他引:1  
朱红灿  胡新  李顺利 《现代情报》2018,38(12):13-21
以经典用户体验模型为基础,建立了政府数据开放平台用户体验的要素体系,运用Kano模型的问卷处理方法、传统分类和Better-Worse分类方法对每个用户体验要素进行了归类,并精确识别出当改善某特定用户体验要素时对提高用户满意度和防止用户不满意度的影响。结果显示,在45个要素中,7个属于魅力因子,26个属于一维因子,6个属于必备因子,4个属于无差异因子,2个属于反向因子。此外,通过敏感度排序得出需改进要素36个,并筛选出"建议反馈功能"等7个要素为关键因素,以期为政府数据开放平台合理分配资源以改善服务质量提供参考。  相似文献   

20.
【 目的/意义】研究从用户群体的角度出发,依据用户特征对社区用户进行群体划分,以了解不同用户群体的 主题差异,从而更加全面清晰的了解社区主题,更好的为社区用户推荐资源。【方法/过程】研究利用社会网络分析 和Topsis算法对用户群体进行划分,再利用LDA模型分别对不同用户进行主题挖掘,最后采用谱聚类实现主题优 化。【结果/结论】科学网情报学社区的核心用户与一般用户群体主题有相同的部分,也存在差异,核心用户群体的 主题专指性较强,一般用户群体的主题较为广泛。基于虚拟学术社区用户群体主题挖掘模型,可以更加全面展示 社区用户关注的主题,更好地为社区用户推荐资源。【创新/局限】研究从用户群体的视角出发,提出了虚拟学术社 区用户群体主题挖掘模型,更好的为社区用户推荐资源,但本研究在数据量、主题模型以及社会网络分析指标的选 取等方面还需要拓展与延伸。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号