首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 578 毫秒
1.
对基于短语结构索引的自然语言检索中的有关问题进行了研究。首先探讨了自然语言检索过程中针对源文本的各类索引形式,分析了这些索引的特征和形式。在对支持自然语言检索的有效性和生成难度判断的基础上,提出了使用短语结构索引进行检索的方案。论文分析了短语结构索引的三种表示方法,给出了短语结构索引的结构,并说明了针对短语结构索引的检索过程。  相似文献   

2.
现代索引理论与方法概述   总被引:1,自引:1,他引:0  
本文从现代索引法、计算机在索引编制中的应用入手,概括了国内外自动标引、索引生成理论与方法,并对中、英文各种机助索引系统进行了论述.  相似文献   

3.
基于混合索引的中文全文检索系统研究   总被引:1,自引:0,他引:1  
在中文全文检索系统中引入了混合索引,建立了混合索引之Hash索引,给出了Hash索引在内存中的存储结构,并给出了这种索引下的检索算法。这种索引既能保证索引的全面性,又能提高系统检索效率。通过实际构建系统,探讨了基于混合索引的中文全文检索系统的实现。  相似文献   

4.
钱亚新先生为我国现代索引事业做出了巨大的贡献,他走上索引研究这条路除了受知友王君提问的启发以外,与早年的学习兴趣、社会环境的感染以及恩师杜定友先生的影响也有着密切的关系。钱亚新先生将自己的索引思想贯穿于相应的索引基本理论、索引史研究、索引实践、索引人才与索引教育之中。  相似文献   

5.
古籍索引编制与一般索引编制有所不同。在古籍索引编制的过程中,古籍版本的选择是需要处理的首要技术问题,而款目内容的选择则是索引编制的重点所在。因为人名、地名、职官名、书名等实体名称在不同时期有所不同,因此人名、书名、物产名称的选择及其限定词的使用在古籍索引编制中各具特色,参照系统的编制应占有相当大的份量。同时,古籍索引的排序方法及出处表达同样不能被忽视。  相似文献   

6.
中国古籍索引编制软件概述   总被引:1,自引:0,他引:1  
黄建年 《图书馆学研究》2011,(19):65-68,101
我国利用计算机编制古籍索引始于上个世纪80年代中叶,出现了一些试验性的古籍索引编辑系统。上个世纪90年代以后,古籍索引编辑系统逐渐成熟,一些大型古籍索引编辑系统相继出现,四川大学研制的"中文索引编制系统"以及广西大学研制的"类书索引编制系统"为其中的杰出代表。  相似文献   

7.
张琪玉 《中国索引》2007,5(4):36-37
阐述报纸新闻索引和数据库编制中,在标题处理、出处表示、标引方法、索引数据库设计诸方面的特殊性。  相似文献   

8.
景月亲 《中国索引》2004,2(4):30-33
本文以索引学的视角,审视作为特色音乐文献的乐谱文献工作,如号码索引之于作曲家的作品的整理研究、版本对照索引之于乐谱版本现象与研究、旋律索引之于音乐主题类工具书排检系统的设置以及曲目索引之于馆藏乐谱文献资源的开发利用等等,指出存在问题,呼吁索引学界关注包括乐谱文献在内的特色文献索引的编制与研究。  相似文献   

9.
基于传统文本检索系统的XML索引实现研究   总被引:3,自引:0,他引:3  
陆伟 《情报学报》2006,25(6):679-685
作为重要的信息交换与存储标准,XML得到学者们越来越多的重视。作为XML检索研究的重要组成部分,XML索引机制与实现的研究已经取得了一定的研究成果。然而,大部分研究都是基于数据库及专门的半结构化管理器之上的。本文提出了如何在传统文本检索系统Okapi的基础上构建XML索引的方法。首先介绍了Okapi的索引结构,在此基础上,深入探讨了XML索引的存储结构及实现,并对索引的性能进行了评价。  相似文献   

10.
作者以为,明确提出“检索情报源的索引”和“直接检索事实情报的索引”两个概念作为索引的两大基本类型,对索引学的深入研究具有重大指导意义。并从10个方面比较了两大类型索引的差异,探讨了两大类型索引的命名问题,最后根据两大类型索引的差异,提出关于索引教材内容安排的建议。  相似文献   

11.
跨语言信息检索中的词语转换方法   总被引:1,自引:1,他引:1  
耿骞  王洋 《图书情报工作》2004,48(10):81-83
讨论跨语言信息检索的相关技术和有关内容,重点讨论跨语言信息检索系统所要解决的问题,并针对其中最常用的一种跨语言信息检索方法,即用户提问转换法中的关键问题--词语转换问题及其实现方法进行讨论。这些方法有基于词典的实现方法、基于索引辞典的实现方法和基于语料库的实现方法。  相似文献   

12.
曹梅 《图书情报工作》2012,56(9):120-119
为了解中文网络检索情境下图像检索需求表达方面的行为规律,设计用户图像搜索实验来采集网络图像检索过程中的提问式进行小规模实证研究,一方面获得图像检索提问式的构造和语言语法方面的一般特征;另一方面通过对高效图像检索过程中提问式的专门分析,揭示高效图像提问式的个性特征。最后结合研究结果讨论提出图像检索需求表达规律和图像检索策略。  相似文献   

13.
基于中文自然语言理解的知识检索模型   总被引:6,自引:0,他引:6  
基于中文自然语言理解的知识检索模型的设计思路是:通过对用户提问及Web文档信息进行语义层次的自然语言处理,构建概念和概念网络,针对用户真实查询需求与概念网络及其映射的源文档进行推理匹配,然后对检索结果进行排序处理,提交给用户。图2。参考文献5。  相似文献   

14.
15.
Both English and Chinese ad-hoc information retrieval were investigated in this Tipster 3 project. Part of our objectives is to study the use of various term level and phrasal level evidence to improve retrieval accuracy. For short queries, we studied five term level techniques that together can lead to good improvements over standard ad-hoc 2-stage retrieval for TREC5-8 experiments. For long queries, we studied the use of linguistic phrases to re-rank retrieval lists. Its effect is small but consistently positive.For Chinese IR, we investigated three simple representations for documents and queries: short-words, bigrams and characters. Both approximate short-word segmentation or bigrams, augmented with characters, give highly effective results. Accurate word segmentation appears not crucial for overall result of a query set. Character indexing by itself is not competitive. Additional improvements may be obtained using collection enrichment and combination of retrieval lists.Our PIRCS document-focused retrieval is also shown to have similarity with a simple language model approach to IR.  相似文献   

16.
中文信息检索系统中的自然语言理解技术研究   总被引:2,自引:0,他引:2  
分析自然语言理解技术在信息检索中的应用及其对信息检索系统的影响,指出自然语言理解技术对信息检索技术的研发有支撑作用;介绍国内外在自然语言理解方面所开展的“理性主义”与“经验主义”研究,重点论述中文自然语言理解研究的三个流派及其各自的核心技术和不足之处,指出该技术面临的发展困境,并提出目前可采取的解决办法。  相似文献   

17.
基于潜语义标引的自然语言检索   总被引:3,自引:0,他引:3  
在信息检索中, 向量空间模型是最有效的数学工具之一。由于自然语言检索的特殊性, 以及传统信息检索模型受到同义词、多义词的影响, 检索的查准率不高。为了提高自然语言检索的查准率, 我们对基于概念的信息检索模型——
潜语义标引(LS I) 模型进行了探讨, 并分析了基于LS I 的两个实例。  相似文献   

18.
19.
This study examines the use of an ontology as a search tool. Sixteen subjects created queries using Concept-based Information Retrieval Interface (CIRI) and a regular baseline IR interface. The simulated work task method was used to make the searching situations realistic. Subjects’ search experiences, queries and search results were examined. The numbers of search concepts and keys, as well as their overlap in the queries were investigated. The effectiveness of the CIRI and baseline queries was compared. An Ontology Index (OI) was calculated for all search tasks and the correlation between the OI and the overlap of search concepts and keys in queries was investigated. The number of search keys and concepts was higher in CIRI queries than in baseline interface queries. Also the overlap of search keys was higher among CIRI users than among baseline users. These both findings are due to CIRI’s expansion feature. There was no clear correlation between OI and overlap of search concepts and keys. The search results were evaluated with generalised precision and recall, and relevance scores based on individual relevance assessments. The baseline interface queries performed better in all comparisons, but the difference was statistically significant only in relevance scores based on individual relevance assessments.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号