首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 734 毫秒
1.
语义检索能克服传统的基于关键词匹配检索的缺点,是信息检索的发展趋势。本文主要探讨两种实现语义检索的索引:潜语义索引和其修正形式。首先介绍了潜语义索引的基本思想和检索过程,并在分析潜语义索引的不足的基础上,介绍了其修正形式———残差迭代变换。  相似文献   

2.
搜索引擎的工作机制与Web信息检索技术   总被引:6,自引:0,他引:6  
陈振宇  赵继海 《情报杂志》2001,20(11):57-58
论述了搜索引擎的工作机制,包括索引系统、关键词检索与概念检索的区别、复合检索、检索结果的相关性排名情况以及搜索引擎如何利用网页文档中的META标记来做索引;还涉及了如何让用户的网站在检索结果中排名靠前的诀窍;同时对如何更简单、有效地检索信息提出了自己的观点。  相似文献   

3.
单汉字索引是中文全文检索索引技术中一个主要方法,此方法在索引的空问和检索的效率方面都存在不足。本文引入单元词索引,并分析试验数据,表明引入单元词索引后,索引的空间效率和检索的时间效率均有提高。  相似文献   

4.
一种智能型的信息检索方法:隐含语义索引法   总被引:3,自引:0,他引:3  
陶蕾 《情报理论与实践》2004,27(3):308-309,301
介绍了一种新的自动索引和检索方法——隐含语义索引法。隐含语义索引法是一种全自动的智能索引方法,通过挖掘文本与词汇之间的隐含关系来达到提高检索效率的目的。  相似文献   

5.
王苗  罗小平 《情报杂志》2003,22(2):82-84
地方文献因为具有地方特点的关键词众多而成为自动索引编制的难点。通过方志索引编制的一个实例,探讨了在没有现成关键词表的前提下,根据地方文献的特点和索引编制的规范,实现地方文献索引计算机辅助编制的方法,并详细阐述了系统的设计思路和系统功能。  相似文献   

6.
贾花萍 《内江科技》2010,31(5):139-139
信息检索技术是数字图书馆的一个关键技术。传统的检索方法主要借助于目录、索引和关键词等方法来实现的,其优点是简单、快捷;缺点是无法挖掘信息之间的内在联系,检索的结果不能准确、全面地反映用户的需求:在数字图书馆建设中,将Agents技术引入信息检索中,可以改善传统的检索方法,提高信息查找的命中率.  相似文献   

7.
以“知识管理”为关键词,对中国社会科学引文索引(CSSCI)数据库进行检索,采用CiteSpaceⅡ分析工具,对检索出的引文数据进行转换、分析和处理,以知识图谱的方式梳理了知识管理研究的脉络.  相似文献   

8.
结合ISI和Dialog,组织高效的SCI引文索引   总被引:3,自引:0,他引:3  
顾震宇  袁蕾  林鹤  路炜 《情报杂志》2003,22(2):68-71
由于ISI的Web of Science和Dialog的SCI数据库所使用的检索软件平台不相同,导致仅使用其中一个检索系统进行SCI引文索引过程中可能出现种种不如人意的地方。通过对两系统检索功能的比较研究。总结出充分利用了两大系统各自的优点,避免各自的不足,进行SCI引文索引的方法;并摸索出提高查全率和降低检索费用的方法,成功组织了令人满意的引文索引。  相似文献   

9.
高维索引技术是基于内容的图像检索中的一项关键技术。本文分析了图像检索中索引技术的研究现状,对现有的索引方法进行了分类、比较和评价,最后对存在的问题和发展方向进行了探讨。  相似文献   

10.
洪拓夷 《现代情报》2004,24(10):204-205
本文指出了美国化学文摘化学物质索引的检索难点和使用技能。通过检索实例分析以及检索策略优化,以最大限度提高化学物质索引的检索效率。  相似文献   

11.
论数据库检索系统用于文献计量分析   总被引:6,自引:1,他引:5  
陈光祚 《情报科学》1998,16(2):122-127
笔者自建了一个CDS/ISIS软件支持的、包括6万多篇文献记录的图书馆学、情报学、文献学、档案学的书目数据库,该库不仅收录期刊论文,而且也收录专著、教材、工具书、会议文献、学位论文以及大型手册、教材中的部分篇章子目,使之形成包含多种类型文献的综合性数据库,并开发利用检索软件中固有的功能,例如建立子库法、编辑倒排文件法、关键词标引与题名中单汉字检索相结合以增强检索语言性能的方法、后控词表(ANY词表)法、对文献发表年代的数值字段函数检索法等等,就80年代以来我国图书情报学科群的文献进行了各种指标的文献计量分析。笔者认为,基于包含多种类型文献、时间跨度较长的数据库检索系统,并应用各种软件功能的文献计量方法,是我国文献计量分析的发展方向。  相似文献   

12.
基于Lucene的信息检索的研究与应用   总被引:6,自引:0,他引:6  
快速有效地索引企业累积的大量的信息资源,是提供高质量检索服务的基础。Lucene是一个用Java写的全文索引引擎工具包,访问索引时间快,支持多用户访问,可以跨平台使用。本文研究了Lucene和中文切分词技术,分析了Lucene的索引原理,实现了一个基于kene并支持中英文文档检索的应用实例。  相似文献   

13.
刘继昌 《情报科学》1992,13(1):19-22
本文从构字、书写、词语结构、构词方法和使用等5个方面阐述了汉字的性质与特点,并说明以此为基础实现单汉字全标引情报检索系统的可能。从已开发的一些系统来看,这种系统能显著地提高情报检索系统的总体效率,与西文检索软件相比,在检索效率、一致性匹配、书写适应性、响应时间、用户接口、空间开销等方面表现出许多优点和独特的检索风格,是一种发扬我国民族语言特色的高效率的情报检索系统。  相似文献   

14.
中国专利数据库标引质量测评   总被引:1,自引:0,他引:1  
李宏芳  邹小筑 《现代情报》2010,30(12):58-61
专利信息资源的建设,对进行创新型国家的建设起着重要的作用。专利数据库的标引工作,对专利信息的情报挖掘起着基础性的作用。通过对检索的相关主题数据进行分析,对专利标引的深度、非题名关键词、先组度、一致性、相对等同率进行探讨,对专利数据库标引现状进行测评,为我国专利数据库建设提供了依据。  相似文献   

15.
徐震 《现代情报》2006,26(10):149-150,175
本文首先分析了传统主题检索系统的弊端,然后提出了针对这些弊端的优化技术,包括全文主题词标引、概念标引、检索式语义分析、模式匹配等相关技术,使用这些技术可以发挥主题检索语言和自然语言检索各自的优点,使传统主题检索系统成为智能化,高层次的检索系统.  相似文献   

16.
自然语言检索中的中文分词技术研究进展及应用   总被引:1,自引:0,他引:1  
何莘  王琬芜 《情报科学》2008,26(5):787-791
中文分词技术是实现自然语言检索的重要基础,是信息检索领域研究的关键课题,无论是专业信息检索系统还是搜索引擎都依赖于分词技术的研究成果。本文通过在国内外著名数据库中进行相关检索,分析了研究中文分词技术及其在著名搜索引擎中的应用。  相似文献   

17.
The Defense Documentation Center (DDC), a field activity of the Defense Supply Agency, implemented an automated indexing procedure in October 1973. This Machine-Aided Indexing (MAI) System [1] had been under development since 1969. The following is a report of several comparisons designed to measure the retrieval effectiveness of MAI and manual indexing procedures under normal operational conditions.Several definitions are required in order to clarify the MAI process as it pertains to these investigations. The MAI routines scan unedited text in the form of titles and abstracts. The output of these routines is called Candidate Index Terms. These word strings are matched by computer against an internal file of manually screened and cross-referenced terms called a Natural Language Data Base (NLDB). The NLDB differs from a standard thesaurus in that there is no related term category. Word strings which match the NLDB are accepted as valid MAI output. The mismatches are manually screened for suitability. Those accepted are added to the NLDB. If now, the original set of Candidate Index Terms is matched against the updated NLDB, the matched output is unedited MAI. If both the unedited matches and mismatches are further structured in accession order and sent to technical analysts for review, the output of that process is called edited MAI.The tests were designed to (a) compare unedited MAI with manual indexing, holding the indexing language and the retrieval technique constant; (b) compare edited MAI with unedited MAI, holding both the indexing and the retrieval technique constant; and (c) compare two different retrieval techniques, called simple and complex, while holding the indexing constant.  相似文献   

18.
The Defense Documentation Center (DDC), a field activity of the Defense Supply Agency, implemented an automated indexing procedure in October 1973. This Machine-Aided Indexing (MAI) System [1] had been under development since 1969. The following is a report of several comparisons designed to measure the retrieval effectiveness of MAI and manual indexing procedures under normal operational conditions.Several definitions are required in order to clarify the MAI process as it pertains to these investigations. The MAI routines scan unedited text in the form of titles and abstracts. The output of these routines is called Candidate Index Terms. These word strings are matched by computer against an internal file of manually screened and cross-referenced terms called a Natural Language Data Base (NLDB). The NLDB differs from a standard thesaurus in that there is no related term category. Word strings which match the NLDB are accepted as valid MAI output. The mismatches are manually screened for suitability. Those accepted are added to the NLDB. If now, the original set of Candidate Index Terms is matched against the updated NLDB, the matched output is unedited MAI. If both the unedited matches and mismatches are further structured in accession order and sent to technical analysts for review, the output of that process is called edited MAI.The tests were designed to (a) compare unedited MAI with manual indexing, holding the indexing language and the retrieval technique constant; (b) compare edited MAI with unedited MAI, holding both the indexing and the retrieval technique constant; and (c) compare two different retrieval techniques, called simple and complex, while holding the indexing constant.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号