首页 | 本学科首页   官方微博 | 高级检索  
     

汉字字频统计方法的改进
引用本文:李国英,周晓文. 汉字字频统计方法的改进[J]. 北京师范大学学报(社会科学版), 2011, 0(6)
作者姓名:李国英  周晓文
作者单位:北京师范大学民俗典藉文字研究中心、中国文字整理与规范研究中心,北京,100875
基金项目:北京师范大学文学院"211"三期工程项目资助;北京师范大学创新团队支持计划资助
摘    要:字频统计是研究实际使用中汉字价值的一种重要方法。以往的字频统计取得了重要的成果,对汉字规范、汉字教学、汉字字典编纂、汉字信息处理以及汉字理论研究都起了重要作用。但也存在基于语料库统计字频造成字频统计结果失真;统计缺乏统一而明确的统计单位,统计结果不科学等问题。解决问题的关键在于建立满足文字统计要求的字料库,必须明确界定统计单位,划分不同层级的汉字统计单位,根据不同需要对其进行分类分层的字频统计。以印刷楷书为例,可以从描写、规定两个方面区分汉字单位。字的单位确定了,字频统计则可以根据不同的统计目的规定统计单位,便于统计数据的使用以及不同统计数据的比较,使得字频统计的科学性得到保障。

关 键 词:字频  字料库  字单位

Improvement in Statistic Method to Chinese Character Frequency Study
LI Guo-ying,ZHOU Xiao-wen. Improvement in Statistic Method to Chinese Character Frequency Study[J]. Journal of Beijing Normal University(Social Science Edition), 2011, 0(6)
Authors:LI Guo-ying  ZHOU Xiao-wen
Abstract:The statistic method in Chinese character frequency study is an important method on measuring the value of Chinese characters.It is also applicable to the standardization of Chinese characters,the Chinese language teaching,the relevant dictionary compiling,the information management in Chinese,and the development of Chinese character theory.However,we have problems in the traditional method:the lack of statistic unit made the outcome difficult to explain,and the corpus error caused it unreasonable.This article hence heads to solve these problems by building up a proper Chinese character form database and a statistical unit system.
Keywords:Chinese character frequency study  Chinese character form database  Chinese character unit
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号