首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
期刊文献标题与文献长度的关系研究   总被引:2,自引:1,他引:1  
通过对相关数据的统计,对中文文献标题的信息量与文献长度的关系进行深入的比较研究。  相似文献   

2.
标准文献的MARC格式著录方法探讨   总被引:1,自引:0,他引:1  
标准文献是中文书目数据中最易出错的文献之一,本文用大量的实例论述了标准文献在CNMARC格式著录中所特有的一些处理方法。  相似文献   

3.
标准文献的CNMARC著录   总被引:1,自引:0,他引:1  
随着行业标准化、规范化要求的提高,标准文献不断增加,标准文献的类型也更加细化。而标准文献是中文书目数据的著录中最复杂著录的文献之一。本文用实例探讨了标准文献在CNMARGC格式中较为规范、合理的著录。  相似文献   

4.
闭合式非相关文献知识发现方法在中文文献中的验证   总被引:3,自引:0,他引:3  
在基于Swanson的闭合式与开放式知识发现法具体算法过程的基础上,以中国期刊网医药卫生大类的数据为测试集,采用的闭合式和知识发现方法,在中文科技文献中重现了"雷诺氏病和鱼油"、"偏头痛"和"镁缺乏"两对概念的知识发现过程,验证了Swanson的基于非相关文献的知识方法中的闭合式方法在中文文献中同样可行。  相似文献   

5.
基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表示方法,融合了深度学习方法得到的概念语义特征和上下文的时间序列词频。进一步结合了AP聚类、Prim算法和Web搜索引擎的查询数据,提出了基于规则推理的本体概念层次关系抽取算法(RROCHE),实现了半自动化概念层次关系抽取。最后,基于中文分词领域的中文学术文献数据,通过数值实验方法讨论了方法的可行性和有效性。本文提出的框架方法也非常容易推广并应用到各领域本体层次关系任务中。  相似文献   

6.
沈立力  姜鹏  王静 《图书馆杂志》2022,(5):109-118+135
Google AI团队发布的BERT模型在多项自然语言处理任务中取得了研究成果,但在中文文献自动分类领域尚有待探索。本文旨在探索BERTbase中文基础模型在中文社科、科技期刊文献分类上的实际分类效果,指出模型在实际应用中存在的问题并提出解决方法。本文选取R大类(医药、卫生)、TG大类(金属学与金属工艺)、F大类(经济)、J大类(艺术)共1 745 000条数据作为训练语料,并以另外9 610条数据作为测试样本,利用BERT模型分别对社科、科技期刊文献进行分类研究。测试结果表明BERT模型在社科文献中的四级准确率为76.95%,科技文献为68.55%。之后引入惩罚策略,为实际工作中免检数据阈值的设定提供参考。BERTbase模型在《全国报刊索引》实际分类标引工作中有一定可行性,基本满足当前网络环境下中文文献自动分类的需求。  相似文献   

7.
孙清玉 《图书馆学研究》2007,(1):99-100,F0003,85
信息素质作为高校图书馆的一项重要职能,已得到越来越多人的认可和研究。文章以中文科技期刊数据库收录文献为研究对象,运用文献计量学方法并结合文献内容,从文献增长情况、文献著者、文献主题等方面,分析国内高校图书馆进行信息素质教育的研究状况,并提出几点建议。  相似文献   

8.
针对中文学术文献,提出一种新的自动标引方法,该方法基于文献之间的引用关系,利用被引文献的标引词,对遗传算法进行改进,实现自动标引,避免利用文献正文、标题等内部文本特征进行自动标引的局限性。通过在大规模真实测试集(中文学术文献)上进行实验,验证该方法的有效性。  相似文献   

9.
通过对中文文献编排组织方法的分析,提出了用现代化手段来实现中文有序化的方案。以设计的中文有序化软件系统为例,指出要实现中文有序化的三个条件。最后阐述了该系统的设计思想并对其运行效果作了评价。  相似文献   

10.
中文期刊三大数据库图书情报专业文献收录比较研究   总被引:6,自引:0,他引:6  
抽查了中文期刊数据库、中文社科报刊篇名数据库、学术期刊(光盘)数据库等国内三大中文数据库图书专业文献收录情况,对各上数据库文献加工质量进行了评价。  相似文献   

11.
中文文献自动分类研究   总被引:13,自引:1,他引:12  
本文对作者开发的两个中文文献自动分类系统的工作原理、方法、数学模型和实现技术进行了比较全面的介绍。  相似文献   

12.
近五年图书馆知识服务研究文献定量分析   总被引:12,自引:0,他引:12  
取《中国期刊网》与《中文维普科技全文数据库》作为检索工具,以2000-2004年5年间所发表的关于“图书馆知识服务研究”的194篇文献为分析数据,采用文献定量分析方法进行统计,从时间分布、空间分布、著者分布、内容分布和引文分布5个角度来分析我国图书馆知识服务研究的状况。  相似文献   

13.
本文依据CALIS联合目录提出的文献标引宗旨和方式,针对中文文献书目数据主题标引中的选词、增词、组配以及主标题的确定、单主题和多主题文献的标引进行探讨,并结合实例加以分析。  相似文献   

14.
中文期刊文献数字对象唯一标识符的研究   总被引:1,自引:0,他引:1  
本文在分析比较国外数字对象唯一标识符前沿研究的基础上,结合中文期刊文献数字对象的实际情况,建立了中文期刊文献数字对象唯一标识符(CSICI)的结构框架,包括期刊标识段、文献内容标识段和控制段三部分.同时,针对中文期刊文献的特点,就题目特征项的抽取方法和汉字的标识方案,设计了10种比较试验方案,并建立了包含26万余条中文期刊文献题录的试验性数据库.通过对比分析各种方法,表明提取题目前10个汉字的拼音首字母方法最优,选定为CSICI的实际编码生成方案.  相似文献   

15.
第四次中文文献资源共建共享合作会议综述   总被引:1,自引:0,他引:1  
中文文献资源作为中华文化的载体,散布于世界各地,是一个无比丰富、有待进一步开发利用的文化宝库,“中文文献资源共建共享合作会议”是迄今为止世界各地中文图书馆界最广泛的盛会。会议的主旨是研讨全球范围内的中文文献资源共建共享问题,意在通过具体的合作项目带动中文文献资源共建共享的逐步实施,推动全球中文资源收藏与研究机构间的交流合作。  相似文献   

16.
刘婧  华薇娜 《国外情报科学》2004,22(5):610-615,620
本文根据中文期刊数据库与中国期刊全文数据库检索到有关精算方面的文献114篇,通过对这些文献多方面地整理、归类,并结合相关定量、定性分析以及一系列技术分析后加以总结与说明。  相似文献   

17.
谈地方版文献联合采编协作网建设   总被引:5,自引:0,他引:5  
20 0 0年 6月 ,由深圳图书馆、福建省图书馆、湖南图书馆、天津市图书馆、辽宁省图书馆和上海地区中文新书联合目录数据库编辑部共同建立了“地方版文献联合采编协作网 (简称CRL Net)。”此网的建立保障了联机联合编目的开展 ,形成了开放、完整、集中的中文文献资源实体 ,并提供了高效、便捷、实时的馆际互借应用环境。参考文献 2。  相似文献   

18.
在对目前各种作者重名消解方法进行总结的基础上, 针对中文文献题录数据特征, 将重名消解问题转换为同名作者文献的分类问题, 提出一种基于规则和相似度的重名消解框架模型, 并对其中的分解规则和合并规则进行详细的算法描述, 最后选取3个学科的重名作者数据集进行实验, 实验结果表明该模型能有效提高作者重名消解的准确率.  相似文献   

19.
杨昭  任娟 《图书情报工作》2020,64(4):95-102
[目的/意义] 大数据时代,机构名称数据呈现海量性、动态性、多样性等新特征,机构名称归一化可改善大数据环境下科研管理、学科评价、学科服务中的数据可靠性,提升基于机构名称的数据检索质量和应用效果。[方法/过程] 从语言学角度和模型构建层面研究机构名称归一化,构建基于共现关系和相似度的机构名称归一化框架模型,提出机构名称实体边界识别方法,编制机构多层级词表,提出机构名称归一化方法,最后选取2008-2018年中文文献题录数据进行实验。[结果/结论] 实验结果验证了模型的有效性,对其他类型机构名称归一化有一定的启发。  相似文献   

20.
以中文社会科学引文索引(CSSCI)数据库为数据来源,对2001~2010年有关图书馆数字资源方面研究的论文进行统计,用文献计量学方法分析其时间分布、作者分布、期刊分布及主题分布等,探讨十年来我国数字资源研究领域的特点和缺失。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号