数字人文视域下秦汉简牍文本挖掘研究——以里耶秦简牍(一、二卷)为例 |
| |
引用本文: | 朱琳,冯慧敏,刘铭,张鹏雷,唐杰,陈镱文.数字人文视域下秦汉简牍文本挖掘研究——以里耶秦简牍(一、二卷)为例[J].渭南师范学院学报,2022(6):86-93. |
| |
作者姓名: | 朱琳 冯慧敏 刘铭 张鹏雷 唐杰 陈镱文 |
| |
作者单位: | 西北大学科学史高等研究院 |
| |
基金项目: | 陕西省重点研发计划项目:数字化文化资源平台的智能分析与利用研究(2019ZDLGY17-03); |
| |
摘 要: | 近年来出土的秦简牍材料,为研究战国晚期至秦代的历史提供了丰富而可靠的资源。文章以目前已经校读出版的里耶秦简一、二卷为语料来源,通过特征词提取、词频统计、文本摘要及主题模型等文本挖掘技术,从词频、事件、主题三个维度对简牍内容进行挖掘与分析。实验表明,一、二卷中主要为官府文书,内容涉及文书邮传、债务、粮食、徒簿、案件、刑徒管理等内容,能够较好地反映里耶一、二卷的大体内容,并且与校释第一卷中给出的主题内容大体一致。为简牍材料的研究提供了新思路,证实了可借助文本挖掘方法来理解、诠释中国丰富的文化遗产。
|
关 键 词: | 里耶秦简 文本挖掘 文本摘要 主题建模 |
|
|