基于文本聚类与LDA相融合的微博主题检索模型研究 |
| |
引用本文: | 唐晓波,房小可.基于文本聚类与LDA相融合的微博主题检索模型研究[J].情报理论与实践,2013,36(8). |
| |
作者姓名: | 唐晓波 房小可 |
| |
作者单位: | 武汉大学 信息资源研究中心,湖北 武汉,430072 |
| |
基金项目: | 国家自然科学基金项目"社会化媒体集成检索与语义分析方法研究"的成果;项目 |
| |
摘 要: | 伴随着微博的日趋流行,对微博信息的检索逐渐成为人们获取第一消息的手段.其中文本聚类和主题发现是信息检索领域的有效方法,采用适当的方法是影响微博短文本信息检索质量的关键因素.文章针对文本聚类和LDA主题模型的互补特征,综合考虑了微博特殊文体和短文本聚类效率问题,提出了基于频繁词集的文本聚类和基于类簇的LDA主题挖掘相融合的微博检索方法,给出了针对微博文体的一种新的主题检索模型.实验表明,该方法不仅能有效地划分微博文本,并且能清晰地挖掘类簇中潜在主题.
|
关 键 词: | 文本聚类 主题检索 微博 |
本文献已被 万方数据 等数据库收录! |
|