首页 | 本学科首页   官方微博 | 高级检索  
     检索      

政府网站开放公文主题分类自动标注方法北大核心CSSCI
引用本文:卢小宾鲁国轩杨冠灿祁天娇.政府网站开放公文主题分类自动标注方法北大核心CSSCI[J].档案学通讯,2022(5):19-27.
作者姓名:卢小宾鲁国轩杨冠灿祁天娇
作者单位:1.中国人民大学信息资源管理学院100872;
基金项目:国家社会科学基金重点项目“新时期产业技术情报分析方法体系研究”(21ATQ008)。
摘    要:当前,政府从各层面采取了一系列措施推进政务信息公开,已经取得了阶段性成果。实践工作中,政府网站平台发布的开放公文缺少主题分类、标注不一致间题成为阻碍政务信息开放利用的技术瓶颈。如何精准地、一致地对现有政府平台的海量政务公文进行主题分类标注,使其能为深度检索、推荐服务提供支撑,是函待解决的关键问题。在深入调研的基础上,一套自动化的针对政府开放公文的主题分类方法被提出,该方法以CNN-LSTM模型为基础,融合预训练BERT模型的语义特征,能精准的对政府开放公文进行主题分类。模型针对主题分类预测的整体准确度(Accuracy)为63.52%,最佳的F1-value可达到63.59%,为解决政务公文主题分类标注缺失问题提供了可行方案。该方法可以与信息检索、推荐结合,为公众提供更具精准度的政府公文服务。

关 键 词:政策文本  主题分类  预训练BERT模型  标注方法
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号