基于隐含空间模型降维和LDA模型的学科主题识别研究 |
| |
引用本文: | 王婧,武帅.基于隐含空间模型降维和LDA模型的学科主题识别研究[J].情报探索,2024(2):1-11. |
| |
作者姓名: | 王婧 武帅 |
| |
作者单位: | 1. 上海大学文化遗产与信息管理学院;2. 南京农业大学信息管理学院 |
| |
基金项目: | 贵州省科技计划项目“基于大数据及图像识别的水族文献及濒危水书抢救性整理研究”(项目编号:[2020]1Y279); |
| |
摘 要: | 目的/意义]现有学科研究主题的梳理多为领域专家的定性分析和学科学者的文献梳理,一定程度会由于研究思维的局限性和获取知识的片面性造成学科研究主题误判,为有效避免漏判误判现象的发生,提出识别模型。方法/过程]首先,运用传统LDA模型分析主题特征词;其次,结合上下文语义信息进行中文分词,形成学科主题词库;最后,结合隐含位置聚类算法发现潜在社区,提高主题识别效果。结果/结论]提出的方法一定程度上优化了主题挖掘算法在识别短文本主题的效果,消除主观意愿。由计算机自行分类并实现科学研究前沿主题的预测,揭示前沿领域的研究热点,为致力于研究前沿学科的新兴学者提供参考价值。
|
关 键 词: | 学科主题识别 LDA主题挖掘 图书情报与档案管理学科词库 隐含位置聚类模型 共词网络 |
|