排序方式: 共有89条查询结果,搜索用时 140 毫秒
81.
[目的/意义] 探索一种融入数据驱动思维的人文社科专题数据库建设主题选择方法,为相关主体在建库主题的遴选、比较和确定等工作提供决策参考。[方法/过程] 从政策、用户两个维度出发,提出基于政策文本与检索数据的人文社科专题数据库主题筛选框架。以Fulink平台为例,基于政策文本LDA主题分类建模和检索数据的词频统计归类,确定专题数据库建设备选主题,最后通过比对筛选将主题进行分类。[结果/结论] 本文构建的主题选择框架,能够有效提升相关主题选择工作的全面性、准确性、科学性,为人文社科专题数据库建设的项目规划等提供了良好的思路。 相似文献
82.
83.
大数据环境下信息与通讯技术的发展, 使越来越多的用户进入了社交媒介建构的虚拟网络空间之中, 社交媒体的影响力也在不断增强。本文从信息内容和网络结构两个层面综述了国外计算机科学等相关领域的社交媒体研究, 指出了基于内容的主题提取, 信息传播的流行度分析, 社交媒体中的网络结构分析以及社区发掘等重要的研究领域;具体阐释了一部分具有基础性或典型性的模型、算法、以及相应的研究成果比较, 同时也提出了未来的研究领域和研究方法的可能发展方向。最后, 本文讨论了国外社交媒体影响力研究对基于国内语境之研究的启示。 相似文献
84.
鉴于在目前的技术机会识别中存在研判的创新路径往往较为抽象和模糊,并在很多情况下需领域专家参与解读的问题,以冷库技术为例,研究构建基于文本挖掘、机器学习算法及多维空间专利地图的技术创新路径识别模型。首先,构建技术创新路径识别框架对相关专利文献进行分词、清洗等预处理并建立知识图谱;其次,采用融合词频-逆文档频率(TF-IDF)文本挖掘方法对专利文档提取关键词,继而采用隐含狄利克雷分布(LDA)算法对主题聚类降维并萃取创新维度;再次,依据目标技术问题和目标优选创新法则耦合变换于多维空间专利地图并具象出具有现实意义、有价值前景的创新路径;最后,利用可拓学计算各创新路径综合关联度评级优选。以期减少创新成本、提高创新效率,为企业精准开展技术创新、不断提升核心竞争力提供决策参考。 相似文献
85.
针对现有的标签推荐方法存在的推荐准确率不高与效果不理想等问题,本文提出了基于LDA主题模型的社会化标签推荐方法。该方法利用LDA主题建模技术将传统的基于对象间关系的推荐方法扩展到融合对象间关系与资源内容特征的统一推荐。实验结果表明,该方法取得了理想的预期效果,能够显著提高标签推荐的质量与效果。 相似文献
86.
基于LDA模型和微博热度的热点挖掘 总被引:3,自引:0,他引:3
分析传统LDA模型在进行微博热点挖掘时所得概率结果抽象且难以结合实际解释的缺点;考虑到微博本身的数据特点和信息论中信息量的观点,提出微博热度的概念,并将其引入到LDA模型的热点挖掘研究中,构建基于微博热度的LDA模型;通过API采集微博数据上的实验,证明新方法与旧方法具有相同的性能,而且能得到更直观的微博热度表,并得出更具有说服力的挖掘结论。 相似文献
87.
为了弥补目前微博平台主题挖掘方法的不足,兼顾到微博信息的稀疏性、多维性、海量性等特点,提出根据微博信息特点进行有针对性的预处理后,使用基于先验概率的潜在语义分析模型LDA(Latent Dirichlet Allocation)进行微博主题挖掘,并在LDA建模的基础上,设计文本增量聚类算法,进一步实现主题结构的识别,从而使用户更好地理解主题及其结构。通过在真实微博数据集上的实验,证明该模型能有效进行主题挖掘和主题结构的识别。 相似文献
88.
在介绍概率主题模型发展过程以及概率主题模型的代表性模型LDA基本原理的基础上,分析LDA模型的特征及其用于微博类网络文本挖掘的优势;介绍和评述微博环境下现有的基于LDA模型的文本主题建模方法,并对其扩展方式和建模效果进行总结和比较;最后对微博文本主题建模的发展方向进行展望。 相似文献
89.
提出一种基于企业技术同心多元化进行研发合作伙伴识别与选择的框架与方法,从企业现有技术能力、研发资源及其发展需求出发,为其定制可发展的技术方向和确定可开展合作研发的最佳伙伴。首先利用关联规则挖掘目标企业的同心多元化技术领域,然后利用LDA主题建模对候选研发合作伙伴的专利内容进行文本挖掘并划分为不同的技术主题,最后构建包括专业能力和合作能力两个维度的专利评价体系对候选合作伙伴进行评估,以确定每个技术主题下的最佳合作伙伴。进一步以天士力控股集团有限公司作为目标企业进行实证分析,研究表明上述框架与方法适用、有效。 相似文献