共查询到19条相似文献,搜索用时 78 毫秒
1.
2.
随着手机、平板电脑等移动智能设备的快速发展,曾经在PC上运行的各种应用系统需要同时在移动智能设备上实现,从而带动了移动智能设备上的数据存储、数据检索等方面的需求。SQLite作为轻量的嵌入型数据库具有更好的实时性、系统开销小、底层控制能力强等优点。探讨并实现了使用SQLite作为数据存储方案并实现中文全文检索的原理与实现方案,为在移动智能设备上基于SQLite的中文信息检索应用探索了一条新途径。 相似文献
3.
4.
互连网上信息浩瀚无限,各种搜索引擎是人们获得信息常用的工具,但是它的可用性和易用性还有待进步提高。为了更有效的获得用自然语言提问的问题的答案,本文提出了运用中文分词技术在获取的搜索网页的基础上进行全文检索和进行问题答案匹配,获得对应的答案列表的一种实现方法 相似文献
5.
对全文检索倒排表技术作了较细致的研究。对全文检索的基本原理和技术进行了深入的探讨。对中文分词方法作了重点研究和总结,并对词典分词法中的最大匹配法加以改进,使用C++设计了一个程序,真正实现了最大匹配法。 相似文献
7.
Web搜索引擎与全文检索技术 总被引:6,自引:0,他引:6
本文主要阐述了全文检索技术在Web搜索引擎中的应用。对国内Web搜索引擎的全文检索技术中的不足进行了分析和思考并提出解决办法,同时对web搜索引擎中的全文检索技术的发展提出了自己的观点。 相似文献
8.
9.
中文全文检索系统主题词标引 总被引:1,自引:0,他引:1
本文介绍了在中文全文检索系统中实现主题词标引的思路及具体实现过程、各种词表的构造及更新方法和措施,基于主题词标引的优化检索功能等。 相似文献
10.
垂直搜索引擎系统的设计与实现 总被引:1,自引:0,他引:1
面对日益专业和个性化的信息检索需求,通用搜索引擎存在的问题暴露无遗。垂直搜索技术作为搜索引擎发展的一个主要方向,正在受到越来越多的关注。在给出一个垂直搜索引擎总体结构的基础上,详细分析了所涉及的关键技术:网页抓取、中文分词、文本分类等。并将分词和分类算法加入到Nutch中,实现了系统原型。实验证明,该系统主题相关度达到94%以上。 相似文献
11.
网络文本数据搜索引擎与搜索技术 总被引:3,自引:0,他引:3
This paper describes the functions, characteristics and operating principles of search engines based on Web text, and the searching and data mining technologies for Web-based text information. Methods of computer-aided text clustering and abstacting are also given. Finally, it gives some guidelines for the assessment of searching quality. 相似文献
12.
13.
元搜索引擎的原理与设计 总被引:10,自引:0,他引:10
本文首先简单介绍了元搜索引擎的原理,然后比较详细地介绍了元搜索引擎设计的三个要点,最后列出了设计基于ASPHTP组件的元搜索引擎的几个具体步骤。 相似文献
14.
15.
由于世界上不同地区使用的汉字编码技术不同,要想通过中文搜索引擎来充分挖掘和利用网上的这些中文信息资源,就需要对计算机的信息处理和汉字编码及其转换技术有所了解。本文从汉字内码转换原理、汉字内码类型、中文搜索引擎的内码转换特点分析了汉字编码及其转换的处理方法。 相似文献
16.
文本挖掘与中文文本挖掘模型研究 总被引:9,自引:0,他引:9
文本挖掘,又称为文本数据挖掘或文本知识发现,是指在大规模的文本中发现隐含的、以前未知的、潜在有用的模式的过程。本文首先对文本挖掘进行了概述,给出了文本挖掘的定义、特点和研究现状。然后对国内中文文本挖掘的研究现状进行了分析,指出了当前中文文本挖掘研究中存在的主要问题和主要研究方向。最后提出了一个统一的中文文本挖掘模型——UCTMF。该模型具有层次性、开放性和可扩展性,为中文文本挖掘系统提供了基本体系框架。 相似文献
17.
本文构建了一个基于搜索引擎技术的中文歧义词收集系统。该系统从Internet上抓取网页内容,清除掉HTML标记及其他脚本后,得到网页内容的纯文本形式,然后采用双向扫描法找出歧义词位置并保存,接着做进一步的分析处理,得到包含歧义词的句子及歧义词在句中的相对位置。该结果可以供分词消岐算法研究人员使用,能够有效解决分词消歧研究中测试语料难以获取和不同消歧算法的结果难以对比的问题。 相似文献
18.
针对目前主题搜索引擎检索结果的主题相关度不能满足专业用户需求的问题,以图情博客为切入点并以开源搜索引擎Nutch为技术框架尝试构建图情博客搜索引擎,为以上问题提供解决方案。 相似文献
19.
随着科学研究的深入发展,人们对文献需求越来越广泛,对搜索引擎理论的研究正在朝着多元化、专业化方向发展。特别是新型文献载体的出现,开阔了搜索引擎理论研究的新视野。本文从搜索引擎的组成,搜索引擎的分类,如何识别搜索引擎的优劣,搜索引擎的未来发展动向等方面对搜索引擎技术做介绍。 相似文献