首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 715 毫秒
1.
倒排文档是信息检索系统中最普遍使用的索引机制,而索引文件的压缩能大大提高检索速度和节约磁盘空间。倒排文件压缩的传统做法是文档(标识号)间距法(d-gaps)。然而,剧烈变化的间距值并不能被著名的前缀自由代码有效编码压缩。为了使间距值得到有效的压缩,本文设计了一个文档标识号重置法。模拟试验表明能更有效压缩d-gaps倒排文档。  相似文献   

2.
档案检索工具的新成员──《数据库主题词词典》毛海帆我馆单机上使用的档案管理软件是国家档案局科研所研制的“动态型通用档案管理系统”。对在此软件上建立的数据库做倒排操作后,会自动生成一个《数据库主题词词典》(以下简称《词典》)。《词典》含序号。主题词(关...  相似文献   

3.
林菊 《海南档案》2007,(2):21-22
电子文件(Elecironic Records/Documentsl指在数字设备及环境中生成,以数码形式存储于磁带、磁盘、光盘等载体,依赖计算机等数字设备阅读、处理,并可在通信网络上传送的文件。归档电子文件(ArchivalElectronicRecords)指:具有参考和利用价值并作为档案保存的电子文件。我国1994年出版的《档案学词典》把电子文件解释为“由应用软件控制处理、进行编辑或输出信息的计算机文件。  相似文献   

4.
人们常常需要查检英语单词的后缀,却没有简捷的方法,现在,一部可以方便地查找后缀的词典问世了,那就是(《英汉倒排词典》(李学金主编,广西教育出版社出版)。这是一部崭新的、具有独特功能的英语教学工具书。  相似文献   

5.
提出一种基于WordNet自动构建语义分布词典的方法。在介绍WordNet系统和Semcor语料库的基础上,设计语义分布词典的结构。分析Sense.idx文件和Taglist文件内容,详细描述以它们为基础自动构建语义分布词典的过程。  相似文献   

6.
可以输入EvetaKeylog、Aatonbase或FLEx文件、抗锯齿PICT、PICS、PICT画面序列、QulCkTime和OMF交换文件。审查节目时可使用Avid的MediaRaeader选项将主记灵时间线或胶片长度计数转入数字剪辑中。AVid深知电影负片是用户最重要的资产,它提出的FilmCompser可以输出业界最精确可靠的负片剪辑清单(依据不同的键号KeyNununber)、墨水编号(InkNumber)和预演代码(PreviewNumber)、修改清单、光学效果清单和EDL。重新定义的“玩”多媒体PC机的巨大成功以及功能强大的下一代三维游戏平台的出现,术语“玩”在电子游戏中有了…  相似文献   

7.
保护商业秘密是确保企业具有竞争优势的重要方面。近年来企业商业秘密纠纷日益增加。由于文件是企业商业秘密的主要载体,有不少纠纷就因文件管理问题而引发。这里的文件管理特指基于文件的计划、组织、指挥、协调、控制等活动的总和。下文谈谈在文件管理中加强商业秘密保护的客体判定、体系控制和其它相关策略。一、商业秘密文件的范围——客体判定策略界定文件中商业秘密的范围就是明确文件管理中商业秘密保护的客体,是进行有效的文件管理的基础。在美国,公司一般都明文规定属于公司商业秘密的范围,并开列清单,定期评价商业秘密的清单…  相似文献   

8.
针对信息检索角度的XML的结构化检索问题,利用基于倒排文件的方法,使用NEXI作为检索语言,在基于XML的数字图书馆检索实验系统WHU-XML上对其进行实现,并具体分析查询语言的解析方法以及所采用的结构化检索算法。  相似文献   

9.
彭哲 《图书情报工作》2008,52(6):110-110
全文检索系统由三大功能模块组成:索引模块、检索模块和存储模块。本文着重分析系统组成和XML数据库的设计、建立倒排索引文件、中文分词等技术难点。同时在此基础之上建立基于Lucene/XML的期刊文献全文检索系统。  相似文献   

10.
本文提出分离重复字段和实现快速检索的方法,讨论两种倒排文档的时空效益及互相转换问题,在DBASEⅢ上用过波兰变换和横式集合算法实现重复字段倒排文档的检索。  相似文献   

11.
This article describes methods and tools for the implementation of a dictionary (inverse file) as an intrinsic element of an information-retrieval system that is designed for on-line user searches. The methods and tools for increasing the IRS efficiency as a whole and the dictionary in particular are described. The authors discuss the principles of the compilation of stop-word lists and algorithmic verification of vocabulary while generating a dictionary.  相似文献   

12.
���ⷨ�е����ƹ淶��   总被引:1,自引:0,他引:1  
王绍平 《图书情报工作》1997,41(8):30-33,23
分析影响名称主题词规范化的因素,并以《汉语主题词表》与《普通图书著录规则》为依据,提出了中文主题目录名称规范的初步方案  相似文献   

13.
宋明亮 《图书情报工作》1994,38(5):16-18,63
通过控制提高检索效率是情报语言学研究的根本目的。在计算机化的“自然语言检索系统”中,控制的手段、方法和技术发生了变化,这些变化开辟了情报语言学研究的新领域:主题词词典、类主题词典、后控词表和术语等。  相似文献   

14.
关于词典标引与著录中应注意的问题   总被引:1,自引:0,他引:1  
邓福泉 《图书馆论坛》2005,25(3):170-171
探讨了对词典进行分类标引、主题标引和CNMARC著录时应注意的问题。  相似文献   

15.
在将一份关于“印尼政府高级官员及其商业活动”方面的英文资料翻译为中文的信息服务过程中,利用Internet较好解决社会科学信息翻译中的专业术语翻译、专有名词翻译及事件翻译中存在的困难,切身体会到Internet是社会科学信息翻译中的活辞典。  相似文献   

16.
《资料收集管理》2013,38(4):11-24
Bibliographic information and cited references from source articles by members of the Emory University Physics Department were downloaded as an ASCII file from ISI's SCISEARCH (Science Citation Index) on DIALOG. This file was loaded into a word processing program for editing and then into a spreadsheet program for analysis. Information about format, subject and location of each cited reference was added to the spreadsheet. Analysis of the citations and added information can be useful in making collection management decisions.  相似文献   

17.
基于长度递减与串频统计的文本切分算法   总被引:5,自引:4,他引:5  
提出了一种基于汉字串频度及串长度递减的中文文本自动切分算法。采用长串优先匹配法,不需要词典,不需要事先估计字之间的搭配概率,不需要建立字索引,利用串频信息可以自动切分出文本中有意义的汉字串。该算法能够有效地切分出文本中新涌现的通用词、专业术语及专有名词,并且能够有效避免具有包含关系的长、短汉字串中的短汉字串的错误统计。实验表明,在无需语料库学习的情况下,该算法能够快速、准确地切分出中文文档中出现频率大于等于支持度阈值的汉字串。  相似文献   

18.
整体情报检索语言中含有重要的术语因素,术语是介于主题检索语言与自然语言之间,并融合于两者本身当中的初步规范化了的自然语词,以术语词典代替主题词表是可行的。  相似文献   

19.
郝瑜鑫 《出版科学》2016,24(4):33-38
以我国不同文化水平在校学生为被试,从学生对词典的了解、使用、评价等方面深入探讨新形势下我国学生对汉语词典的使用、需求情况。研究结论认为,我国学生词典种类使用单一;文化水平因素对学生使用词典有较大影响;在校学生普遍缺乏词典的基本知识和使用技能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号