首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 28 毫秒
1.
主题模型在机器学习领域已成为研究的一大热点问题.本文系统阐述LDA(Latent Dirichlet Allocation)主题模型参数估计和Gibbs抽样算法,介绍常见的LDA改进和扩展模型,最后分析LDA模型在文本挖掘领域的应用情况.  相似文献   

2.
3.
结合用户兴趣与新闻时效性的特点,对传统推荐算法和标准LDA主题模型进行思考,提出一种基于LDA(Latent Dirichlet Allocation)的文档-主题-词的三层贝叶斯概率模型结合时间函数的推荐算法,采用Gibbs Sampling进行超参数推导,提升推荐效果.实验结果表明,该算法在适当参数设定下的推荐结果...  相似文献   

4.
领域驱动设计是一种基于模型驱动开发思想的崭新的开发方式,其核心是领域模型,相较之前基于数据库驱动的开发方法,更强调领域的概念,且架构清晰、对象职责明确、可复用性好。基于领域驱动设计对专利申报系统进行架构设计,让申报系统在实现时对专利申报系统业务过程准确建模并根据其业务过程而调整,使得整个系统层次分明,具有良好的可扩展性、可移植性。  相似文献   

5.
教育元宇宙作为元宇宙的教育应用前景广阔,对相关文献进行系统分析有助于推进其应用向纵深发展。基于LDA主题模型和人工内容分析对关于教育元宇宙的130篇核心期刊文献进行系统梳理后发现,我国教育元宇宙研究主要围绕基本理论、批判审视、思政教育应用、学习赋能、场景创设、技术支撑、模型构建等7个主题展开,为教育元宇宙建构学理支撑、凝聚理性共识、铺筑可为进路、筑牢技术基座和汇聚多维创想积淀了丰硕成果。基于此,未来教育元宇宙还应从顶层设计、关系廓清、伦理规约、技术向善、场景拓展等5个方面着力:探赜教育元宇宙顶层设计研究,统筹教育元宇宙系统构建;完善教育数字化转型与教育元宇宙逻辑关系研究,驱动两大领域协同演进;深入教育元宇宙伦理规范研究,促进教育元宇宙健康发展;夯实教育元宇宙意识形态属性研究,保障教育元宇宙向善属性;拓展教育元宇宙应用场景研究,牵引教育元宇宙实践落地。  相似文献   

6.
在短文本聚类模型中,传统LDA模型没有考虑文本与主题之间的联系.提出一种具有判别学习能力的LDA模型,在LDA-λ模型中将二项分布引入LDA基础模型,增加词项的判别能力.对模型进行理论分析与对比试验,结果表明,基于改进的LDA模型精确度(ACC)、归一化互信息(NMI)和成对F测度值(PWF)比较高,分别达到0.738...  相似文献   

7.
大数据时代信息量急剧增长,伴随而来的是大量冗余信息的出现。为快速、准确、全面搜索到所需信息,提出一种LDA主题模型与TextRank算法相结合的算法。首先通过对预处理后的文档建立主题模型,得到句子的概率模型即文档中句子的重要性,然后考虑运算节点权重时的主题概率,得到新的迭代公式,通过对同一主题下的多篇新闻报道进行处理得到这些文档的文摘。实验结果表明,该方法生成的文摘较单一算法效果显著。  相似文献   

8.
9.
构建切实有效的产业创新生态系统,对国家创新能力建设具有重要的实践意义。文章以“产业创新生态系统”作为关键词在知网上检索,以2005—2021年作为研究区间,运用LDA主题模型抽取文献中隐藏的主题结构,计算主题强度值,在此基础之上绘制主题热度图和主题强度演化折线图,最后结合国内产业创新生态系统研究的实际情况和相关政策,进行主题语义深度挖掘,分析该领域未来研究趋势。研究发现:1.协同创新成为国内产业创新生态系统研究的热点主题;2.产业创新生态系统研究逐渐从理论维度向应用维度转移;3.生态学理论与模型相结合的实证分析成为新的研究方向。研究结论对于国内产业创新生态系统相关研究具有一定的参考价值。  相似文献   

10.
为改善传统个性化推荐算法精准度不高的问题,使用评论数据作为数据集,先对评论数据作文本预处理和特征提取,然后使用LDA主题模型对文本特征数据建模,得到主题词分布,将其作为标签,同时使用LSTM网络作文本分类,通过计算得到好评率。最后把用户需求和标签利用潜在语义标引计算相似度,根据相似度和好评率大小向用户推荐结果。实验结果表明,该方法能够向用户推荐符合其兴趣的个性化需求信息,且准确率高于96%,证明了该推荐算法的有效性。  相似文献   

11.
评论文本中的词符合幂律分布,使LDA模型词的分布偏向高频词,导致主题相似度大,表达能力下降。提出幂函数加权LDA(Latent Dirichlet Allocation)模型以提高低频词的表达能力。使用iForest算法,选择出与众不同且具有价值的评论集合。实验结果表明,选择的评论子集特征覆盖率较高,且有较高的平均信息量。  相似文献   

12.
提出了潜在狄利赫雷分布模型与自然语言信息处理相关技术相结合的一种挖掘Twitter中中文微博的热点主题词组的方法.选取了20923条中文Tweets作为样本,获取了相关热点的主题词组,与预期的效果基本吻合,表明该模型具有较好的热点识别效果和对主题进行描述的能力.  相似文献   

13.
采用用户历史查询词构建用户画像时,现有向量空间模型存在特征稀疏和上下文依赖性强的问题。针对该问题,通过引入 LDA 主题模型,首先提取查询词潜在主题,得到查询词对应的主题分布;然后将概率最大的主题对应的词扩充到原始特征空间中,丰富用户特征;最后采用 SVM 分类算法对用户基本属性进行分类,构建用户画像。实验表明,利用 LDA 模型对用户特征进行扩展比传统向量空间模型用户画像精度提高了 1.6%。  相似文献   

14.
随着互联网的迅速发展,网络招聘成为主流招聘途径.大数据时代有价值的网络招聘信息往往隐藏在招聘文本中不易被发现,导致利用率不高.为了挖掘出招聘信息背后的价值,使招聘厂商对应聘者信息更方便地进行检索、分类和管理,提出基于招聘文本信息的技能标签生成算法.通过招聘词库提取关键词生成候选标签,然后将获得的文本信息进行LDA主题挖...  相似文献   

15.
高等学校具有人口密度大、社会关注度高、突发事件发生风险高的特点,这对突发事件处置背景下的高校管理决策提出了新的要求。以新冠肺炎疫情为例,文章通过网络爬虫技术爬取N大学新闻网上的疫情相关文本,利用LDA主题模型挖掘出文本数据的9个锚点——师生投身抗疫、服务学生、心理健康保障、国内外学术交流、反馈社会、高校智库、学科建设和学术研究、线上线下融合教学、组织建设,分析突发公共卫生事件处置背景下每个锚点的现状和演化趋势,并据此勾勒出面向突发事件的高校管理体系,这对于提升高校突发事件应对管理水平具有重要意义。  相似文献   

16.
随着互联网中网页数量的激增,网页自动分类已经成为互联网技术中亟待解决的问题。提出一种领域向量模型的设计与构建方法,设计并实现一种针对新闻网页的基于领域向量模型的网页分类TSC(Topic Sensitive Classify)算法,从新的角度解决网页自动分类问题。首先,对大量的新闻网页URL进行分析,提取新闻网页的URL特征;然后,设计一个领域向量模型,对特定领域的新闻网页内容特征进行提取;最后,结合新闻网页URL特征和内容特征对新闻网页进行自动分类。实验结果表明,TSC算法分类效果比传统SVM和ID3等文本分类算法更优。  相似文献   

17.
文章系统梳理我国养老模式研究演进历程,运用文献计量学对相关文献数据进行统计分析、挖掘研究热点,探讨未来养老模式研究方向。研究发现:养老模式具有多元化的发展趋势;养老模式相关研究可分为三个阶段,发文存在明显的周期规律;根据研究内容,相关文献大致可分为三个研究主题。从现阶段热点问题研究可知,未来研究会重点探索资源的有效整合方式,推进养老模式的高质量发展。  相似文献   

18.
推进国家中小学智慧教育平台协同优质建设,是实施教育数字化战略行动的重要举措,也是构建优质均衡基本公共教育服务体系的有力抓手。专家工作室作为各省推进国家中小学智慧教育平台应用推广的重要载体,承担着平台应用推广和指导的重要职责。为深入探究国家中小学智慧教育平台协同建设的内在机理,总结提炼一线教师的平台应用的优秀经验,研究以国家中小学智慧教育平台中的专家工作室已有实践为数据基础,综合运用LDA主题模型和扎根理论方法,对专家工作室助力平台协同建设的要素和逻辑进行了分析。研究发现,专家工作室的实践主要聚焦在一线教师的课堂教学实践层面,同时也涉及教师的专业发展和学生的课后服务,但对平台在家校交流、区域管理等场景的应用探索相对较弱。在此基础上,研究从目标指引、生态共建、协同机制等方面提出了国家中小学智慧教育平台建设的实践路径,旨在为智慧教育平台的发展和创新提供借鉴和启示。  相似文献   

19.
领域驱动设计(Domain-Driven Design)是以敏捷开发为手段,以模型驱动设计为根基,以软件领域为着眼点。应用领域驱动设计可以快速应对软件开发中的变化。领域驱动设计核心是建立一个单一的既符合软件所处领域本身又适合软件分析开发需要的领域模型,着重介绍了领域驱动设计的相关概念以及开发流程。  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号