首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
藏文被称作“写在世界屋脊上的文字”,创始于吐蕃王朝立国之君松赞干布时期,记载和传承着藏民族悠久的文化,是世界上最古老的文字之一,也是藏民族至今最基本的交流工具。随着信息化时代的到来,藏文电子化成为必然需求。为了传承、保护、发展民族优秀文化,西藏大学依托计算机应用技术和藏语言文学两个自治区重点学科,于2006年成立了藏文信息技术研究中心,2007年被批准为“藏文信息技术教育部工程研究中心”,2011年被批准为“藏文信息技术国家地方联合工程研究中心”。在西藏大学藏文信息技术研究中心全体研究人员的努力下,这种古老文字正焕发着全新的生命力。  相似文献   

2.
主要介绍了基于Tesseract-ocr的藏文脱机识别训练的方法,从box文件生成、文字校正、文字特征文件生成、定义字体特征、聚集字体特征、生成训练字库特征库文件这六个方面详细介绍了具体的训练方法,然后通过训练之后的字库特征文件成功识别了图片上的藏文,实现了藏文的脱机识别。  相似文献   

3.
少数民族文字档案是中华民族的瑰宝,其信息化建设是现代化发展的必然要求。本文以满文档案为例,根据少数民族文字档案信息化建设存在的共同问题,为其信息化建设提供策略,以期少数民族文字档案信息化建设平稳、快速发展。  相似文献   

4.
BM算法是最经典的单模式匹配算法之一,但该算法并没有考虑藏文文字特征,故使滑动距离受限。在藏文中该匹配算法有进一步改进的空间,文章提出一种改进的针对藏文编码的BMT(BoyerMooreTibet)模式匹配算法。BMT针对藏文unicode编码以及藏文音节特征,修改并优化了算法匹配过程,在执行精确匹配时消除了冗余匹配,增大了单次精确匹配后的滑动距离。该算法性能优异,算法能够获得较少的比较次数以及增大跳跃距离。  相似文献   

5.
科技期刊出版事业的发展从一个侧面反映了一个国家或地区经济和科技发展的水平,是一个国家或地区科技自主创新水平的重要标志之一。目前,我国少数民族文字科技期刊受地区经济文化发展水平、民族众多等因素的影响,在发展中面临着人口少、语种多、出版物市场小、出版发行渠道不畅、行业整体发展水平低等诸多困难。在新疆公开出版发行的科技期刊目前已有61种,其中,用少数民族语言文字公开出版的科技类期刊有27种,就语种结构而言,有维吾尔文18种,占66.7%;哈萨克文8种,占29.6%;蒙古文1种,占3.7%。本文在结合2010年自治区科技期刊审读工作所了解和掌握的资料基础上,分析新疆少数民族文字科技期刊存在的问题,提出新疆少数民族文字科技期刊发展对策:从讲政治高度重视少数民族文字科技期刊发展,择优支持、重点扶持,促使民族文字精品期刊的产生,加强少数民族文字科技期刊编辑队伍建设,充分发挥期刊协会的作用等。  相似文献   

6.
文章认为社会主义市场经济日益发达的今天,少数民族出版业遇到了前所未有的生存、发展困境。少数民族文字出版物市场的严重萎缩是其主要原因,并指出加快促进少数民族地区经济社会的全面发展,稳步提高少数民族群众的科学文化素质是少数民族出版业摆脱困境的根本出路。  相似文献   

7.
藏文文献是藏民族最宝贵的文化遗产,是藏学研究藏民族古老文明、社会历史形态、生产生活的重要依据。随着现代化网络信息技术的不断发展,藏文也在计算机信息化处理方面取得了显著成绩,本课题研发的藏文文献管理系统,实现对藏文文献资料进行编目、整理、维护、检索、借阅等功能。本文阐述了藏文文献管理系统的主要功能及系统实现。  相似文献   

8.
李莉 《百科知识》2005,(6X):55-55
浙江省仙居县发现春秋战国时期的摩崖石刻奇异古文字,经专家鉴定,此为古越族文字,这一发现是中国文字学上的一次重要发现。越族是我国古代的一个少数民族,根据史书记载,越族应该有自己的语言与文字,但越族文字一直没有被发现。这里发现的文字,与出土的越国王室青铜礼器、  相似文献   

9.
社科文摘     
我国有多少种民族文字? 我国有56个民族,但是我国的民族语言并不是56种,而是多达80种以上。在我国境内的56个民族中,汉、回、满族和另外一些少数民族通用汉字:蒙古、藏、维吾尔、哈萨克、柯尔克孜、朝鲜、彝、傣、拉祜、景颇,锡伯、俄罗斯12个民族各有自己的文字。现在使用的共有40种文字。历史上曾经使用过而后来停止使用的近20种民族古文字,它们是于阒文、突厥文、回鹘文、察合台文、西夏文、契丹文、女真文、古藏文、古蒙文、八思巴文、东巴文、哥巴文、水书、满文。  相似文献   

10.
苏联国立列宁图书馆目前藏书量达3,700多万册,其中汉文书籍12万册,现刊800余种,报纸约200种。此外,还收藏了大量中国其他少数民族文字如藏文、蒙古文、维吾尔文、哈萨克文、满文等文种的书籍。在苏联、列宁图书馆是收藏中文书刊最多的一家。列宁图书馆最早收集到的汉籍,是十九世纪中叶在中国任职的俄罗斯著名汉学家K.A.斯卡奇科夫(1812~1883)收集到的约2,000册雕版印刷物。这成为列宁图书馆  相似文献   

11.
近几年来在我国政府和有关部委的大力支持下,藏文信息处理技术得到了空前的发展,基于国际国家标准的藏文应用软件相继研发成功.本文就围绕国内外第一款基于藏文编码字符集(基本集、扩充集A和B准)国际国家标准的中标普华藏文办公软件,重点论述了在藏文办公软件中解决藏文文本自动断行的问题和藏文自动排版技术的实现方法.  相似文献   

12.
藏文是一种拼音文字,在其独特且深厚的文化底蕴中,展现出独具特色的艺术性.纵观藏文的改革发展,其历程曲折,在藏文的规范与统一性上出现了不少问题:藏文印刷字体的问题,藏文动词拼写及口语虚词厘定上的问题以及藏汉双语教学的问题等.这些问题的存在使藏文的发展与传播并不一帆风顺,这些问题便是我们当下及未来需要解决的.  相似文献   

13.
通过对当前流行的各种识别技术进行分析比较,在对藏文手写体特征展开深入研究的基础上,考虑到将来的研究趋势及可扩展性,提出了一套基于手写藏文识别的技术方法,即基于GA—BP神经网络的藏文识别方案,并着重对手写藏文识别中的特征提取和分类器设计进行了分析,提出了藏文识别领域今后的发展方向。  相似文献   

14.
文章根据西藏民族语言文字的立法规定,结合博物馆研究、收藏和教育的职能特性,对西藏自然科学博物馆动物标本藏文名称的规范化工作进行探讨。  相似文献   

15.
藏文自动分词是藏文信息处理中一项不可缺少的基础性工作,是藏文搜索引擎、语法信息词典建设、机器翻译、语音合成、文本自动分类、自动摘要、自动校对等等研究的基础工作。藏文自动分词中歧义消除也是关键技术,本文提出了藏文交集型歧义的切分方法即双向扫描识别和最大概率分词算法进行处理的方法。  相似文献   

16.
随着自然语言处理技术的快速发展,藏文信息处理技术也取得了较大进展。其中,藏文舆情分析作为藏族地区社会舆情分析的重要技术,受到广泛关注。但是,现有的藏文文本情感分析研究由于起步较晚,还存在很大提升空间。本文提出基于深度集成学习的藏文文本情感分析算法。并通过建立藏文情感数据集进行实验,本文算法在三类情感(正向、负向、中性)中精确率平均提升1.65%,召回率提升1.63%,F1分数提升1.96%。实验结果表明,本文采用的深度集成学习有效地提高了文本情感分类的性能。  相似文献   

17.
文章针对当前主流藏文搜索引擎的情况进行了介绍,对其中关键技术进行了分析,并对藏文搜索引擎的发展进行了展望。  相似文献   

18.
德萨 《西藏科技》2014,(9):77-80
现今的民族地区图书馆或收藏藏文文献的机构,若想顺应信息化、数字化、网络化时代发展的步伐,与时俱进,谋求发展,使藏文文献资源的建设、管理、利用尽快实现信息化,就必须依靠特色数据库及特色服务、将藏文文献相关数据建立产权属于自己的数据库,它是网络化时代藏文文献资源共享的基础。鉴于目前藏文文献数据库建设中存在诸多问题的现状,对藏文文献数据库建设与调查研究就显得尤为重要。文章通过对国内外藏文文献数据库建设的理论与实践研究现状进行概括性述评,阐述藏文文献数据库建设实证调查研究的必要性及其价值与意义,以期为藏文文献数据库的建设与研究者提供参考。  相似文献   

19.
虽然现代藏文自动校对技术研究是藏文信息处理技术中一项具有广阔前景和极具挑战性的研究课题,但目前对藏文自动校对技术的研究主要是集中在自动侦错上,对自动纠错的研究要滞后得多,鲜见有专门的研究。文章主要对国内开展藏文自动校对研究的相关工作进行了介绍和评价,在此基础上对现代藏文自动校对的进一步发展进行了展望。  相似文献   

20.
黏着语是在藏文文字发展过程中,由于发音或者语法需求而产生的。文章在了解藏语语法、黏着语产生背景和意义的基础上,依据黏着语的特点设计了基于词典库的黏着语处理算法,该算法基本能正确处理文本中的黏着语,正确率达到了98.01%。错误的部分是由于一些新词语在词典库中未收录,所以未能正确处理。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号