共查询到20条相似文献,搜索用时 210 毫秒
1.
古籍数字化规范的建设是一个复杂的过程,同时也是一个不断变革的领域。针对目前古籍数字化存在的问题,文章以哈佛燕京图书馆中文古籍数字化项目为研究实例,通过其数字化加工方式、数字化过程、参数选择等方面的具体实践,重点对图像和元数据的数字化建设和组织进行了分析和探讨,为古籍数字化标准规范的建设提供借鉴和参考。 相似文献
2.
我国古籍书目数据库建设标准规范探讨 总被引:1,自引:0,他引:1
古籍数字化相关标准是建设古籍书目数据库的基础。目前我国古籍书目数据库建设存在着著录标准规范、分类法和字库应用不统一等问题。古籍书目数据库建设应以实现古籍资源的共建共享为基本目的,主要方法有修订和完善古籍数字化著录标准、规范古籍书目数据库的分类标准、建立古籍数字化规范数据库、规范古籍书目数据库的字库、实行古籍与普通图书及音像制品统一建库。 相似文献
3.
数字统一是“全球数字化”背景下文化遗产领域的新概念。当前不断消亡的流散珍本古籍在资源联合研究、开发与应用上有着种种现实困境,梳理数字统一语境下的古籍建设经验对促进我国古籍保护有着重大意义。文章运用文献调查法和网络调研法对国际数字统一古籍项目展开调研,将其梳理为保护、运行、法律与教育四个维度,归纳出数字统一古籍建设的数字采集、元数据描述、网页浏览、数字展览四大项目框架。研究发现,国际数字统一项目对我国古籍再生性建设具有参考价值,我国应健全数字化标准,建设本土数字统一古籍项目完整保存文化遗产,并创新古籍数字展览传播方式,同时还需要加强文化遗产保护理念、拓展全球化视野。 相似文献
4.
毛建军 《福建图书馆理论与实践》2006,(3):60-61,56
1台湾地区早期的古籍数字化实践
与大陆相比,台湾地区在古籍数字化方面起步较早。在古籍数字化实践的初期,台湾的中文古籍数字化工作一直处于领先地位。古藉数字化与计算机信息技术的发展密切相关。由于台湾地区的计算机事业发展较早,20世纪70年代台湾地区就开始了计算机用于古籍整理实践的探索。1971年台湾马志钦教授提议利用计算机做中文资料处理研究。不久几乎所有大学和电子研究机构都全力投入了这一极具潜力的领域。 相似文献
5.
江西省图书馆2015年实施了江西省珍贵古籍数字化项目,建设成果是"江西珍贵古籍数字资源库"。文章将"江西珍贵古籍数字资源库"的建设作为案例进行分析,提出江西省古籍文献数字化建设存在的问题和对策,以期能为未来我国公共图书馆古籍文献数字化工作提供借鉴和参考。 相似文献
6.
全文数字化是信息资源建设的方向,研究型资源的全文化检索尤其重要.计算器现有系统能处理的汉字,对于中文古籍、辞书、人名地名系统、报刊出版远不够用.几年前,国际标准ISO/IEC 106462003(即Unicode 4.0)编码汉字字符集已经拥有7万余汉字,但其中有4万2千多个汉字是4字节编码,在应用领域的处理方面有一定难度.文章介绍中易公司处理4字节编码汉字的技术成果,并结合在古籍数字化项目中的实际应用,着重说明用自行开发的7万汉字的应用系统,支持数字化工程和全文检索发布的技术特点,强调超大字符集、XML开放数据等标准技术的应用等.通过实践,总结出一套基于支持超大字符集4字节编码汉字的数字化的应用技术,以及信息全文检索发布的可行方法,解决了古籍和文献的数字化工程中的技术难点. 相似文献
7.
8.
9.
古籍的CNMARC格式著录探讨 总被引:4,自引:1,他引:4
通过对古籍、古籍著录项目的认识和分析,提出了古籍CNMARC格式著录(以ILAS环境为例)的意见,为古籍资源共享和古籍数字化提供技术支持。 相似文献
10.
美国典藏机构收藏有大量的中文古籍,且十分重视中文古籍的整理、编目和数字化工作。随着文献数字化工作进程的开展,美国各典藏机构开始将中文古籍进行数字化处理,开发建置了大量中文古籍数字化资源。 相似文献
11.
[目的/意义] 随着古文数字化、智能处理和相关人文计算研究的迅速发展,对这一领域的整体研究状况进行梳理,不仅有助于从以往的研究当中总结相应的规律,而且在一定程度上有益于后续探究的展开。[方法/过程] 厘定古文信息处理的概念,分析古文信息处理的研究现状,给出古文信息处理研究的整体概貌。同时,在统计分析的基础上,对古文数字化、智能处理和人文计算这3个方面的研究内容进行总结、回顾和研究趋势的展望。[结果/结论] 在古文信息处理研究中,古文数字化所取得的成就最大,古文智能处理在词汇级的探究上取得了一定的成效,而对于人文计算来说,与古文相关的研究则才刚刚起步。 相似文献
12.
13.
朱岩 《现代图书情报技术》1993,9(1):3-7
本文着重论述了文献工作中对多文种(尤其汉字)的需求情况,各国(地区)字符集的现状和世界通用字符集产生的必要性。确定了国际通用字符集标准的东方汉字(中、日、朝)统一编码字表。 ISO10646将成为一个真正的集成的多文种信息处理系统。 相似文献
14.
粗糙集理论是处理不精确、不准确数据的有效方法,但是通过粗糙集方法获得的决策规则对于不完整的信息承统和随机数据也是不确定的。本文描述了一个用于决策规则的可靠性评价方法。该方法独立于任何专用引申规则方法,并且参数能够被调整以适应不同的信息系统。 相似文献
15.
单汉字标引方法的改进研究 总被引:2,自引:1,他引:1
本文根据信息论中的交互信息,给出了相邻汉字相关度的测量方法,在此基础上提出了基于字串预分割的单汉字标引检索方法,对当前具有代表性的单汉字标引方法进行了改进研究。试验证明本文提出的方法具有较好的性能 相似文献
16.
陈少鸿 《现代图书情报技术》2000,16(1):57-60
图书馆面临多文种信息处理的要求。本文阐述了用维吾尔文计算机编目的必要性。分析了中/维文国内国际字符集标准和发展中的维吾尔文操作系统和维吾尔文机读目录的结构和特点。介绍了在ILA S5. 0 编目子系统上自建维吾尔文机读目录的经验。同时对图书馆建立维吾尔文献数据库提出了建议。 相似文献
17.
沈艺 《现代图书情报技术》1996,12(5):44-47
本文通过分析中国机读目录格式中有关字段对字符集引用所作的规定, 以及汉字字符集的国家标准体系和国际标准体系, 提出中文机读目录字符集不完整的原因, 并找出解决办法。 相似文献
18.
[目的/意义]针对中文语言表达特点,提出一种含分词标签的字粒度词语特征提取方法,有效提升了中文临床病历命名实体识别任务的F1值,同时该方法可以为其他中文序列标注模型所借鉴。[方法/过程]选取汉语词语的词性标注、关键词权值、依存句法分析三个特征,构筑字粒度序列标注模型的临床病历训练文本,语料来源CCKS2017:Task2。在不同特征组合方式下,采用条件随机场算法验证两种字粒度词语特征提取方案Method1与Method2。[结果/结论]在四种不同词语特征组合下,Method2相对于Method1在临床病历命名实体识别任务中性能均有所提升,四折交叉测试中F1值平均提升了0.23%。实验表明在中文分词技术日趋成熟的环境下,Method2相对Method1能够获得更好的词语特征表示,对中文字粒度序列标注模型的处理性能具有提升作用。 相似文献
20.
大学图书馆与素质教育初探 总被引:43,自引:1,他引:42
大学图书馆与素质教育的方方面面有着诸多密切的联系,并且一所良好的大学图书馆在大学的素质教育中能够发挥独特而重要的作用,笔者对上述论点作了较为详尽的论述,且对改善大学图书馆的工作以更好的服务于大学的素质都得出了若干建议。 相似文献