摘 要: | [目的/意义]随着生成式人工智能的快速发展和广泛应用,信息空间结构也随之发生深刻的变革。以往以用户生成内容(UGC)为主的信息空间开始逐渐被生成式人工智能生成内容(AIGC)所影响,生成式人工智能治理的重要性愈发凸显。文章旨在从主题视角比较AIGC与UGC,揭示两者在内容与结构特征上的差异,并为生成式人工智能治理提供创新参考。[方法/过程]收集了金融、法律、医疗和开放问答4个领域的多个在线平台上的问题和用户回答,并借助gpt-turbo-3.5模型生成每个问题的人工智能回答,最终构建了包含65260条问答数据的语料集,并采用BERTopic主题模型分别对AIGC与UGC进行主题提取,并从主题间关系、主题与文档关系以及主题与主题词关系3个角度对两者进行综合对比。[结果/结论]研究结果揭示了AIGC和UGC在主题分布、主题内文档一致性和主题词权重结构等方面的差异。通过深入了解两者之间的特征差异,能够更好地观察生成式人工智能的行为规律,并为AIGC的治理策略完善提供参考。
|