共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
3.
刘洋;许乾坤;刘畅;王东波 《情报资料工作》2025,46(2):82-90
[目的/意义]大语言模型的指令遵循、思维链及推理能力为古籍文本的自动词性标注任务提供了新的契机,有利于促进古籍智能信息处理研究工作的开展。[方法/过程]以人工校验的《二十四史》古现词性标注语料为基础,运用LoRA方法对主流中文大语言模型进行高效监督微调,并测试SFT模型的零样本(Zero-shot)和单样本(One-shot)学习能力,以比较其在古现文本分词与词性标注上的性能。[结果/结论]经过微调后的Xunzi-Baichuan模型整体表现最优,古文本的分词和词性标注F1得分分别为92.293%和85.75%,现代汉语的分词和词性标注F1得分为91.993%和86.344%。 相似文献
4.
5.
[目的/意义] 先秦典籍在古代典籍中的地位极为重要。本文提出对先秦典籍进行词性自动标注的解决方法,以便更加准确地挖掘先秦典籍中的潜在知识。[方法/过程] 通过条件随机场模型,结合统计方法确定组合特征模板,并最终得到针对先秦典籍的词性自动标注算法模型。[结果/结论] 在先秦典籍自动分词的整个流程基础上,得到简单特征模板、组合特征模板下的词性自动标注模型,基于组合特征模板的词性标注模型调和平均值F达到94.79%,具有较强的推广和应用价值。在构建词性自动标注模型的过程中,通过融入字词结构、词语拼音和字词长度的特征知识,使得模型的精确率和召回率得到有效提升。 相似文献
6.
7.
古籍数字化整理是推动我国汉语古籍数据库建设及相关资源整合和利用的基础性工作。作为关键的技术环节之一,面向古籍命名实体的自动化抽取备受国内外学界和业界的关注。但是一些制约汉语古籍实体抽取方法的“卡脖子”问题仍未得到有效解决,包括少样本学习问题、标注成本管理问题和数据质量控制问题。本研究提出了一个面向古籍资源命名实体自动化抽取的通用框架——HanNER,包括“基于规则的实体预标注”“基于深度主动学习的迭代实体抽取”以及“人机交互模式下的标注决策”三个主要部分。多组实验比较证明了HanNER的可行性和优势,包括基于深度主动学习模型CNN-BiLSTM-CRF+margin的优势、多功能标注模块“标注查询”与“自动推荐”的积极作用以及ZenCrowd-II算法的优势。最后,本研究基于优化后的BERT-CNN-BiLSTM-CRF模型开发了在线的汉语古籍的实体自动抽取系统。HanNER的提出有利于推进汉语古籍实体抽取工作及相关任务在方法与技术上的发展,而且从工程化角度为古籍实体抽取产品的落地提供了借鉴和启发。 相似文献
8.
本文针对超文本系统建立过程中的难点和使用中存在的问题,综合运用新型和传统的检索技术,讨论了超文本系统的建立方式,包括手工方式、半自动方式和自动方式.同时,探讨了改进超文本系统的查询方法,提出了基于信息分类的检索模式和基于似然推理的检索模式. 相似文献
9.
超文本检索技术的发展 总被引:7,自引:0,他引:7
谭晓冬 《现代图书情报技术》1994,10(3):29-35
本文讨论了将超文本技术用于信息检索的优越性, 介绍并分析了基于导引浏览和基于提问的两种超文本检索系统中一些有代表性的模型及其检索方法, 认为超文本检索系统必须将超文本技术和传统的检索方法结合起来, 并向智能化方向发展。 相似文献
10.
超文本全文检索系统的研究 总被引:1,自引:3,他引:1
全文检索和超文本技术的结合是情报检索领域的一个发展方向, 但目前已有的全文检索系统都缺乏超文本能力, 而超文本系统也缺乏全文检索功能。本文提出了一个超文本全文检索系统的模型, 并介绍了一个基于该模型的试验系统HFTRS (Hypertext Full Text Retrieval System) , 试图就超文本技术和全文检索技术的结合作一探讨。 相似文献
11.
中国古代书目是结合“当下”具体文献的整序系统,其类名总是和具体文献紧密相关,离不开具体文献的映衬和烘托,它不是一个形式逻辑意义上的抽象概念,而是一个与主观认知有关的感性范畴。这种固融通了意义成份而不再求之于形态的分类观,对于解决现代知识管理中词汇人工化和用户基于自然语言的习惯性提间之间的二律背反具有一定的启发意义。 相似文献
12.
13.
主要针对《中图法》(第四版)关于中国古代史文献分类中出现的某些问题进行了探讨。尤其在史料类目、历史事件与农民起义的关系、古代分裂时期的文献分类、中国学、汉学以及普及读物的类目设置方面发表了作者的看法。 相似文献
14.
15.
“域外汉籍”指的是周内不见或少见的汉文古籍文献,文章介绍了汉语史上8部重要的域外汉籍的发现及整理研究情况,认为这类文献对于汉语史研究,特别是对近代汉语研究有不可替代的价值,值得加以重视。 相似文献
16.
古代文献保护方法的现实价值研究综述 总被引:1,自引:0,他引:1
我国古代发明了系统化的书籍保护技术,积累了丰富经验,这些技术在今天仍然有借鉴价值。文章从图书馆建筑、图书防蠹、防霉和装帧修裱等方面综述了近30年来我国关于古代文献保护方法的现实价值的研究成果。 相似文献
17.
版本源流考订是古代文献整理的优良传统。通过对单种文献历代同书异本传承关系的考察,可以从存本中发现和推荐与祖本关系密切的善本。对古籍数字化而言,版本源流考订有助于选择精良的底本,还可将前代版本源流考订成果随同文献正文一起数字化,并进行数据加工。文章以宋代梅尧臣《宛陵集》为例,利用OWL本体描述语言完成面向专业研究人员的古籍版本源流知识库的结构设计,基于本体开发工具Protégé完成以RDF资源描述框架为基础的本体建模,利用On?toGraf插件功能将该书的版本源流以可视化的形式直观呈现出来。 相似文献
18.
19.
陈垣在古籍整理中,保护与整理了大批珍贵的文献档案资料,并做了大量的编目工作,使我国古典文献学逐步走上科学化的发展道路,开辟和规整了目录学新的编撰体式,建立了科学完整的校勘学理论与方法论。 相似文献
20.
分析江西省县级图书馆现存古籍的保护现状及存在问题,从古籍保护人才、古籍保存条件、专项资金三个方面提出县级图书馆古籍保护工作相应的对策,以期更加有力地推动县级图书馆古籍保护工作。 相似文献