首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
中文自动标引是图书馆学情报学界多年研究的问题并取得了一定成果,其在信息检索数据库研究领域不可或缺。随着全文检索和中文搜索引擎的盛行,中文信息处理有多个学科涉及。中文自动标引、全文检索和中文搜索引擎是什么关系有必要加以明确,以确定其在中文信息处理领域的地位。经探讨认为,全文检索利用了中文自动标引的各种方式,搜索引擎利用了全文检索,因此搜索引擎利用了中文自动标引。中文自动标引、全文检索及中文搜索引擎三者关系是中文自动标引被利用和在技术发展方面相互促进的关系。  相似文献   

2.
通过分析动态数据在其Web 页面中的展示特点,提出一个新的自动化、结构化数据抽取方法。首先基于DOM利用算法实现快速定位数据区,从而避免处理大量噪音数据;其次引入最小DFS编码来表示DOM子树,通过聚类对记录数据区进行区分;最后对少量样本页面训练学习生成抽取规则用于数据抽取。利用原型系统针对实际网站中的页面进行数据抽取,实验结果显示其拥有较高的准确性和效率。  相似文献   

3.
中文搜索引擎的比较研究   总被引:5,自引:0,他引:5  
通过对典型中文搜索引擎的比较分析,指出中文搜索引擎目前存在信息量不足、查询方式单一、采用技术落后、多媒体信息量不足、专题性中文搜索引擎较少和数据库更新不及时等问题,提出了中文搜索引擎的元搜索引擎、智能化检索和多媒体检索等发展趋势和发展对策。  相似文献   

4.
中文搜索引擎发展趋势   总被引:5,自引:0,他引:5  
通过分析中文搜索引擎发展现状与特点,探讨了中文搜索引擎的发展趋势。  相似文献   

5.
结合《中文期刊数据库》Web版全文检索系统的安装、应用的实践经验,对其检索方法与技巧、系统安装以及存放全文数据设备的选择等方面加以论述。  相似文献   

6.
中文搜索引擎社区化的背景是互联网发展到Web2.0阶段,社区化的产品有互动问答平台、维基产品、贴吧和社会化书签等。搜索引擎社区化的意义在于,可以提高用户体验、促进知识共享。  相似文献   

7.
浅议中文搜索引擎的发展特征   总被引:1,自引:0,他引:1  
论述了中文搜索引擎的主要发展特征,并初步分析这些特征的成因。  相似文献   

8.
Web信息检索的关键技术   总被引:6,自引:0,他引:6  
Web上大量的、分布的、动态的信息造成了“信息过载”,如何在传统信息检索技术的基础上开展检索工作已经成为一项重要的研究课题。本文简要对Web检索技术进行了介绍,总结了其现存的缺陷,并且阐述了目前基于Web信息检索的一些关键技术。  相似文献   

9.
一种Web多维分析模型及应用   总被引:1,自引:0,他引:1  
朱家稷  闫宏飞 《情报学报》2004,23(5):553-560
Web上的网页正以惊人的速度增长和变化 ,给传统搜索引擎的效率和质量带来了许多新的问题和挑战。我们迫切需要一种研究方法 ,能够对搜索引擎收集来的海量网页进行有效的分析 ,以便对Web保持完整清晰的认识来指导搜索引擎进行更有效的服务。本文提出一种基于时间、空间和内容的三维Web分析模型 ,通过它可以对海量的网页数据进行多维度、多层次的分析工作 ,为我们认识Web提供一种全新的视角。在实验中我们简单地实现了该模型 ,并通过对 3批网页数据进行分析 ,得到网页变化率、网页空间分布、复制强度大的网页特点等数据 ,以及Internet作为“第四媒体”在信息传播上的一些特点。  相似文献   

10.
中文WWW搜索引擎比较研究   总被引:21,自引:0,他引:21  
通过上网实验测试了几种中文WWW 搜索引擎的检索功能,并分析实验数据得出结论,旨在对中文WWW 搜索引擎的建立和完善有所启示。  相似文献   

11.
网络信息检索展望   总被引:34,自引:3,他引:31  
概括性地分析了目前一些新兴的网络检索摸式, 综合性地介绍了一些资深网络服务和技术专家的观点, 从而对网络检索未来进行了一定程度的描绘和预测。  相似文献   

12.
Web信息主题采集技术研究   总被引:9,自引:0,他引:9  
李春旺 《图书情报工作》2005,49(4):77-80,70
简单介绍主题信息采集系统;从5个方面对其核心技术进行深入研究,包括种子页面生成、主题表示、相关度计算策略、爬行策略以及结束搜索策略等;详细讨论种子页面生成的人工方式、自动方式及混合方式,基于关键词的主题表示与基于Ontology的主题表示,多种相关度计算启发式策略比较,基本爬行策略与隧道技术以及结束爬行的多种情形等;在分析相关技术的算法、特点与应用情况的同时,针对主题信息采集特点提出相应的改进意见。  相似文献   

13.
汉语分词对中文搜索引擎检索性能的影响   总被引:3,自引:0,他引:3  
金澎  刘毅  王树梅 《情报学报》2006,25(1):21-24
针对中文网页的特点,研究了汉语分词对中文搜索引擎检索性能的影响。首先介绍中文分词在搜索引擎中的作用,然后介绍常用的分词算法。作者利用网页特征,提出一个简单的“带启发性规则的双向匹配分词策略”。最后,在10G的语料库中,就各种分词算法对查全率和查准率的影响进行了实验比较,结果表明分词性能和检索性能没有正比关系。  相似文献   

14.
知识搜索引擎是在Web2.0环境下产生的新一代互动式知识搜索系统,其组织体系主要有两大特点:在知识组织过程中重视"人"的因素,在主题检索机制中引入分类组织的思想。这两点在国内三大知识搜索引擎——百度"知道"、新浪"爱问知识人"、雅虎"知识堂"都有不同程度的体现。  相似文献   

15.
通过计算网络影响因子对站点进行评价,着重介绍网络影响因子(WIF)在网络计量学中的具体应用。利用搜索引擎AltaVista对中国知名大学网站WIF的测评及其改进进行分析,并就网络影响因子作为网站评价工具的客观性问题进行了探讨。最后介绍了几种增加WIF可靠性的方法。  相似文献   

16.
通过计算网络影响因子对站点进行评价,着重介绍网络影响因子(WIF)在网络计量学中的具体应用。利用搜索引擎AltaVista对中国知名大学网站WIF的测评及其改进进行分析,并就网络影响因子作为网站评价工具的客观性问题进行了探讨。最后介绍了几种增加WIF可靠性的方法。  相似文献   

17.
用Delphi和Google Web API开发自己的搜索引擎   总被引:1,自引:0,他引:1  
简述Delphi是Google Web API提供的一种Web服务,允许开发人员选择自己喜爱的编程语言开发应用程序,通过基于XML的SOAP信息交换协议与远程的Google服务器连接来调用Google的Web服务;通过实例详细介绍用Delphi和GoogleWeb API开发搜索引擎的方法和步骤。  相似文献   

18.
在现有相关研究的基础上,对基于通用搜索引擎的深层网络表面化方法的基本原理进行分析,对表单域取值范围的确定、查询处理、查询结果的超链接设置等与深层网络表面化相关的若干关键问题进行探讨。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号