共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
全文数字化是信息资源建设的方向,研究型资源的全文化检索尤其重要.计算器现有系统能处理的汉字,对于中文古籍、辞书、人名地名系统、报刊出版远不够用.几年前,国际标准ISO/IEC 106462003(即Unicode 4.0)编码汉字字符集已经拥有7万余汉字,但其中有4万2千多个汉字是4字节编码,在应用领域的处理方面有一定难度.文章介绍中易公司处理4字节编码汉字的技术成果,并结合在古籍数字化项目中的实际应用,着重说明用自行开发的7万汉字的应用系统,支持数字化工程和全文检索发布的技术特点,强调超大字符集、XML开放数据等标准技术的应用等.通过实践,总结出一套基于支持超大字符集4字节编码汉字的数字化的应用技术,以及信息全文检索发布的可行方法,解决了古籍和文献的数字化工程中的技术难点. 相似文献
3.
朱岩 《现代图书情报技术》1993,9(1):3-7
本文着重论述了文献工作中对多文种(尤其汉字)的需求情况,各国(地区)字符集的现状和世界通用字符集产生的必要性。确定了国际通用字符集标准的东方汉字(中、日、朝)统一编码字表。 ISO10646将成为一个真正的集成的多文种信息处理系统。 相似文献
4.
手机短信服务:主要是GSM网和CDMA网提供的一种服务,这种服务通过GSM或CDMA网络传输信息。通常每次传输信息的长度为70个汉字(16Bits编码)或160个英文字符(7Bits编码),这样的消息长度很短,称之为短信息或短 相似文献
5.
本文对Internet上常用的汉字编码及其显示和转换进行了论述。Internet上常用的汉字编码有国际码、HZ码和大五码三种,这三种汉字编码可利用Internet上的一些转换软件来相互转换。在使用Internet上不同编码的汉字信息资源时应启动不同的汉字操作系统,双桥、UnionWay等Windows中文平台则可用来对多种汉字编码进行显示 相似文献
6.
文学人类学派提出文化理论和方法论,将先于汉字的华夏文化作为大传统,神圣玉礼器为文化符号的原编码;将甲骨文以来的汉字书写视为华夏文明的文化再编码。依据此原理,重新认识中国文化需要从原编码探寻再编码的所以然。本文以《周礼》记录周代玉礼器"六器"说为虚假陈述,根据七千年来的玉礼器发生发展的实物情况,依据考古新发现的玉器实物重建新的"六器"演变谱系。 相似文献
7.
<正> 我国汉字编码标准的发展 汉字编码其实就是给汉字编号,给每一个汉字编一个特定的号。参加编号的汉字有一个范围,这些汉字的集合就构成了汉字编码字符集。如果大家遵守同一编码标准,这样,在信息交换时,只要给出汉字编码,就可以按编码表找出所对应的汉字。 相似文献
8.
9.
<正> 由中国中文信息研究会和联合国教科文组织联合召开的一九八三年中文信息处理国际研讨会于10月12日至14日在北京举行.来自14个国家和地区的60多名专家、学者和我国一百多名同行就汉字信息处理系统、汉字计算机输入输出技术、汉字文字识别和汉字语音识别、汉字输入编码以及有关基础理论等方面的学术问题进行了研讨.中国中文信息研究会理事长、一九八三年中文信息处理国际研讨会主席钱伟长教授在开幕词中说,中文信息处理技术及汉字计算机,作为一个新兴学科在世界各国迅速发 相似文献
10.
电视讲座教材《五笔字型》质疑云南大学成人教育学院张在云(四)某些汉字的拆分和编码不符合国家文字规范或有错误这样的实际例子不胜枚举,这里仅就新教材中的实际例子举些以资说明。(1)瓦,“五笔字型”拆分和编为:“一乙、乙,11,51,41,51,GNYN,... 相似文献
11.
12.
随着报刊激光照排新技术的普及,汉字的录入方式也不断增多。汉字经过几千年的提炼,字的组成有严格的规范,人们对它的结构都比较熟悉,目前各报刊大多采用全角五笔字型输入法录入汉字稿件。据介绍,经过五笔字型输入法培训的录入员,每分钟可录入160多个汉字。 五笔字型输入法录入汉字的速度取决于汉字的书写工整规范。因为五笔字型输入法基于汉字结构的基本笔画,在汉字结构中相对不变的部分称为字根,输入微机时由前三个字根和最后一个字根组成一个编码,输入这个编码即成一个字。如“渴”字,只要输入前三个字根氵日勹和最后一个字根L,摁下IJQN四键,屏幕上就会显出一个“渴”字。因此,正确找出字根是录入成功及快慢的关键。记者、编辑和通讯员写稿时应按规范书写汉字,要笔画工整清晰。时下有些文稿字迹很潦草,让人难以辨清字的结构。不但影响到录入人员的正常录入,编辑见了也头痛,数千字的长文,如要重抄一遍,实在是件苦差事。因此,强调作者为文把字写得工整些,是十分必要的。 相似文献
13.
拟订“汉字频度构词字库”原则和方法张学涛汉字和汉语存在看使用的规律。汉字频度反映了流字的使用规律,也反映了汉字的构词规律。我们建立字库利用计算机处理汉字,也应尊重汉字的使用规律,根据汉字的使用规律建立字库,不能破坏和割裂汉字的使用规律,搞简单的形式主... 相似文献
14.
15.
吴明曦 《现代图书情报技术》1991,7(1):2-9
通过考察汉字的结构、字频等特点,用数理统计的方法对汉字缩微成象辨读质量进行了分析,找出了汉字影象辨读质量与q值参数之间的概率分布函数关系,揭示了汉字细部结构密度的概率分布规律,为评价缩微、光盘等汉字信息处理系统的汉字质量提供了一个定量分析参考标准.此外,还对细微还原系统的分辨能力进行了数学分析。 相似文献
16.
谈日文图书字顺目录的组织韩成富(辽宁省图书馆)日文是由汉字、国字(日本人根据中国汉字创造的文字,形同汉字,又称“日文汉字”)及假名组成的,属表意文字。因此,不能象西文、斯拉夫各语文等方使地用于排检。日文的书名和著者的姓名是用汉字与假名混合标印的,都是... 相似文献
17.
构词词典是一种汉字轮排词典,可从任何一个汉字出发,查出包含该汉字的全部词组、成语、熟语,对文章修辞、语文教学、诗词写作、翻译工作等都有参考作用。 相似文献
18.
以实现中文本体三元组的快速索引和更新为目的,首先分析中文本体的知识结构,并通过OWL建模语言将其内部的各种知识单元转换成关系三元组和属性三元组构成的知识网络;然后利用《通用规范汉字表》对体现实体间语义信息的关系三元组进行编码,形成主语前缀和宾语前缀索引表,同时对描述实体特征的属性三元组进行编码,形成主语前缀和主语后缀索引表;接下来详细论述关系和属性三元组的更新方法;最后选取多个本体文件对三元组的汉字索引和更新方法进行测试和分析.结果表明,单字索引能够有效地减少本体三元组的更新和检索时间. 相似文献
19.
国家新闻出版总署和国家语言学工作委员会颁发的《出版物汉字使用管理规定》的第五条说:“报纸、期刊、图书、音像制品等出版物的报头(名)、刊名、封皮(包括封面、封底、书脊等)、包装装饰物、广告宣传品等用字,必须使用规范汉字,禁止使用不规范汉字。出版物的内(包括正、内容提要。目录以及版权记录项目等辅),必须使用规范汉字,禁止使用不规范汉字。” 相似文献
20.
析五笔字型“汉字字根总表”张学涛目前,在出版印刷界、在出版和报版印刷中,利用“五笔字型”录入文稿比较普遍。但是《汉字字根总表》(见王永民著,中国科学技术出版社1993年版,161页)违反汉字规范,有悖汉字基本常识和笔顺,表现了作者不遵从科学规律的主观... 相似文献