Unicode藏文分词系统的设计 |
| |
作者姓名: | 才华 普布卓玛 |
| |
作者单位: | 西藏大学图书馆,西藏拉萨,850000 |
| |
摘 要: | 微软公司以叠置引擎和OpenType字库技术为基础,于2007年推出了基于藏文国际标准编码Unicode字符动态组合的藏文系统。该系统支持与藏文书写方式相一致的输入法,并能解决国内其他藏文系统普遍存在的缺字问题,其发展趋势很强,已成为藏文资源及藏文应用软件开发的主流平台。藏文分词作为信息处理的基础性工作之一,在藏文信息检索、自动校对、机器翻译等领域有着广泛的应用,所以很有必要对Unicode藏文文本进行分词研究。
|
关 键 词: | 藏文信息处理 分词 hash表 逐字二分法 |
本文献已被 CNKI 万方数据 等数据库收录! |
|