首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
全文检索搜索引擎中文信息处理技术研究   总被引:2,自引:0,他引:2  
唐培丽  胡明  解飞  刘钢 《情报科学》2006,24(6):895-899,909
本文深入分析了全文检索中文搜索引擎的关键技术,提出了一种适用于全文检索搜索引擎的中文分词方案,既提高了分词的准确性,又能识别文中的未登录词。针对向量空间信息检索模型,本文设计了一个综合考虑中文词在Web文本中的位置、长度以及频率等重要因素的词条权重计算函数,并且用量化的方法表示出其重要性,能够较准确地反映出词条在Web文档中的重要程度。最后对分词算法进行了测试,测试表明该方法能够提高分词准确度满足实用的要求。  相似文献   

2.
随着手机、平板电脑等移动智能设备的快速发展,曾经在PC上运行的各种应用系统需要同时在移动智能设备上实现,从而带动了移动智能设备上的数据存储、数据检索等方面的需求。SQLite作为轻量的嵌入型数据库具有更好的实时性、系统开销小、底层控制能力强等优点。探讨并实现了使用SQLite作为数据存储方案并实现中文全文检索的原理与实现方案,为在移动智能设备上基于SQLite的中文信息检索应用探索了一条新途径。  相似文献   

3.
浅谈数字图书馆与全文检索技术   总被引:6,自引:0,他引:6  
牟有静  侯丽梅 《情报科学》2002,20(5):535-537
本文从数字图书馆的起源、发展,以及特点和功能等方面,简要阐述了全文检索技术。  相似文献   

4.
王武霞 《今日科苑》2006,(9):118-118
互连网上信息浩瀚无限,各种搜索引擎是人们获得信息常用的工具,但是它的可用性和易用性还有待进步提高。为了更有效的获得用自然语言提问的问题的答案,本文提出了运用中文分词技术在获取的搜索网页的基础上进行全文检索和进行问题答案匹配,获得对应的答案列表的一种实现方法  相似文献   

5.
对全文检索倒排表技术作了较细致的研究。对全文检索的基本原理和技术进行了深入的探讨。对中文分词方法作了重点研究和总结,并对词典分词法中的最大匹配法加以改进,使用C++设计了一个程序,真正实现了最大匹配法。  相似文献   

6.
赵新民 《情报杂志》2001,20(7):28-29
介绍了全文检索的特点、功能及应用,论述了全文检索的发展趋势及应注意的问题。  相似文献   

7.
Web搜索引擎与全文检索技术   总被引:6,自引:0,他引:6  
李玮  李利 《情报科学》2003,21(5):558-560
本文主要阐述了全文检索技术在Web搜索引擎中的应用。对国内Web搜索引擎的全文检索技术中的不足进行了分析和思考并提出解决办法,同时对web搜索引擎中的全文检索技术的发展提出了自己的观点。  相似文献   

8.
国内中文分词技术研究新进展   总被引:13,自引:1,他引:13  
冯书晓  徐新  杨春梅 《情报杂志》2002,21(11):29-30
就开发中文搜索引警在汉语语言方面的关键技术之一,即中文分词技术进行综述。  相似文献   

9.
中文全文检索系统主题词标引   总被引:1,自引:0,他引:1  
吴春玉 《情报科学》2004,22(6):720-722,727
本文介绍了在中文全文检索系统中实现主题词标引的思路及具体实现过程、各种词表的构造及更新方法和措施,基于主题词标引的优化检索功能等。  相似文献   

10.
垂直搜索引擎系统的设计与实现   总被引:1,自引:0,他引:1  
面对日益专业和个性化的信息检索需求,通用搜索引擎存在的问题暴露无遗。垂直搜索技术作为搜索引擎发展的一个主要方向,正在受到越来越多的关注。在给出一个垂直搜索引擎总体结构的基础上,详细分析了所涉及的关键技术:网页抓取、中文分词、文本分类等。并将分词和分类算法加入到Nutch中,实现了系统原型。实验证明,该系统主题相关度达到94%以上。  相似文献   

11.
网络文本数据搜索引擎与搜索技术   总被引:3,自引:0,他引:3  
This paper describes the functions, characteristics and operating principles of search engines based on Web text, and the searching and data mining technologies for Web-based text information. Methods of computer-aided text clustering and abstacting are also given. Finally, it gives some guidelines for the assessment of searching quality.  相似文献   

12.
电子信息资源的整合与全文检索系统   总被引:22,自引:1,他引:22  
汪宗怡  曹芸  范超英 《情报科学》2002,20(4):389-392
本文介绍了在网络环境下,图书馆进行电子信息资源整合与管理的意义,电子信息资源整合的方法,以及电子信息资源管理的工具--全文检索系统。  相似文献   

13.
元搜索引擎的原理与设计   总被引:10,自引:0,他引:10  
郭少友 《情报科学》2005,23(2):245-248
本文首先简单介绍了元搜索引擎的原理,然后比较详细地介绍了元搜索引擎设计的三个要点,最后列出了设计基于ASPHTP组件的元搜索引擎的几个具体步骤。  相似文献   

14.
随着甲骨文数字化研究地不断深入,需要处理的甲骨文信息变得越来越多,对甲骨文信息地提取变得非常困难。本课题就是要研究利用基于java的全文检索工具包Luence,建立甲骨文全文检索系统,使之能够在本地硬盘完成对甲骨文的全文检索,完成全文匹配。本文通过对目标文件夹建立索引,输入关键词后,能够检索到包含该关键词的目标文件的详细信息。  相似文献   

15.
白晓玲 《现代情报》2009,29(3):134-138
由于世界上不同地区使用的汉字编码技术不同,要想通过中文搜索引擎来充分挖掘和利用网上的这些中文信息资源,就需要对计算机的信息处理和汉字编码及其转换技术有所了解。本文从汉字内码转换原理、汉字内码类型、中文搜索引擎的内码转换特点分析了汉字编码及其转换的处理方法。  相似文献   

16.
文本挖掘与中文文本挖掘模型研究   总被引:9,自引:0,他引:9  
谌志群  张国煊 《情报科学》2007,25(7):1046-1051
文本挖掘,又称为文本数据挖掘或文本知识发现,是指在大规模的文本中发现隐含的、以前未知的、潜在有用的模式的过程。本文首先对文本挖掘进行了概述,给出了文本挖掘的定义、特点和研究现状。然后对国内中文文本挖掘的研究现状进行了分析,指出了当前中文文本挖掘研究中存在的主要问题和主要研究方向。最后提出了一个统一的中文文本挖掘模型——UCTMF。该模型具有层次性、开放性和可扩展性,为中文文本挖掘系统提供了基本体系框架。  相似文献   

17.
吉向东 《现代情报》2010,30(6):125-127
本文构建了一个基于搜索引擎技术的中文歧义词收集系统。该系统从Internet上抓取网页内容,清除掉HTML标记及其他脚本后,得到网页内容的纯文本形式,然后采用双向扫描法找出歧义词位置并保存,接着做进一步的分析处理,得到包含歧义词的句子及歧义词在句中的相对位置。该结果可以供分词消岐算法研究人员使用,能够有效解决分词消歧研究中测试语料难以获取和不同消歧算法的结果难以对比的问题。  相似文献   

18.
针对目前主题搜索引擎检索结果的主题相关度不能满足专业用户需求的问题,以图情博客为切入点并以开源搜索引擎Nutch为技术框架尝试构建图情博客搜索引擎,为以上问题提供解决方案。  相似文献   

19.
周雅翠 《现代情报》2009,29(5):20-22
随着科学研究的深入发展,人们对文献需求越来越广泛,对搜索引擎理论的研究正在朝着多元化、专业化方向发展。特别是新型文献载体的出现,开阔了搜索引擎理论研究的新视野。本文从搜索引擎的组成,搜索引擎的分类,如何识别搜索引擎的优劣,搜索引擎的未来发展动向等方面对搜索引擎技术做介绍。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号