首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
搜索引擎系统中的Web个性化信息推荐技术   总被引:1,自引:0,他引:1  
Web个性化推荐技术在现代互联网中有着广泛的应用,它能将Web网络信息按照用户的个性化需求主动地向用户提供服务。但是由于现代搜索引擎通常缺乏用户的相关登录信息和网页访问路径信息,所以传统的Web个性化推荐服务并不完全适用于搜索引擎。由于用户在访问搜索引擎时会产生大量的关键词访问序列,而这种关键词访问序列蕴含着丰富的用户个性化信息,基于此,提出了一种利用搜索引擎访问日志中的关键词访问序列来进行Web个性化推荐服务的方法,并分析了相关技术特点和实现细节。  相似文献   

2.
搜索引擎将网络信息进行有效的组织,从而使庞杂的网络信息变得有序化,通过搜索引擎能够快速准确地获取所需信息。搜索引擎通过采用网页评级的方式,按照级别由大到小地将检索结果展现给用户。显然,级别高的网页必定会被优先浏览。因此,对于网络建设者来说,提高网页级别是十分重要的。文章从PageRank算法着手,对影响网站排名的因素如:网站内部的链接模式、外部链接和外向链接进行计算分析,最终得出有效的链接模式。  相似文献   

3.
人类社会已经进入大数据时代了,随着互联网的迅猛发展,种类繁多,数量庞大的数据随之产生,作为辅助人们检索信息工具的搜索引擎也存在着一定的局限性,如:不同领域,背景的用户往往具有不同的检索目的和需求,通用搜索引擎所返回的结果包含大量用户不关心的网页。为了解决这个问题,网络爬虫系统应运而生。众所周知,搜索引擎从互联网中靶向性筛选出有用信息,而网络爬虫又是搜索引擎的基础构件之一。本文实现了一个基于python语言的聚焦网络爬虫,利用关键字匹配技术对目标网站进行扫描,得到所需数据并抓取。  相似文献   

4.
杨志 《现代情报》2007,27(9):134-137
随着网络信息量的急剧增长,人们习惯运用各种搜索引擎在海量互联网信息资源中来查找所需的信息,但查寻的结果往往不尽人意。本文通过利用不同主题范围的检索词在中英文搜索引擎检索的结果,对元数据标签Keywords在网页中的应用情况进行了调查和分析。并就提高搜索引擎的检索效率提出自己的一些建议。  相似文献   

5.
在现代不管是社会的发展还是经济的发展,都会用到我们不断丰富和发展的网络信息资源,因为我们的网络信息资源是不断丰富和发展的。许多用户在面对纷扰杂乱的信息资源,在这时,人们为了方便,并且为了让用户迅速准确的找到自己想要的信息资源,就有很多人发明了网络检索工具,这样,就诞生了大量搜索引擎工具,搜索引擎是不可缺少的搜索工具之一,因为它可以帮助我们检索到大亮点网络信息资源。但是,像那种简单网页检索已经满足不了用户者的要求了。近几年来,我们急速发展的搜索引擎进入新一轮的快速发展时期,为了满足广大用户者的各种各样的需求,我们需要进一步提升我们快速发展的搜索引擎,将我们的搜索引擎作为我们互联网的入口,提升搜索引擎的地位,由于广大用户者的急切需求,国内各种各样的搜索引擎研发商的服务呈现更加多元化的发展趋势。例如文档搜索引擎正是可以满足我们广大用户者的需求,这一搜索引擎可以满足用户多元化需求的重要的应用之一。  相似文献   

6.
曹淑华 《内江科技》2009,30(7):116-116,149
网页的数据采集是网络信息搜索引擎中对于相关信息与链接的获取过程。本文通过剖析网络搜索引擎中数据采集的基本方法和运行机制,并通过程序设计实现数据采集。  相似文献   

7.
不同内容网络信息资源的半衰期比较研究   总被引:1,自引:0,他引:1  
比较不同内容网络信息资源半衰期,有利于进一步研究网络信息资源的老化规律,使信息价值最大化.以delicious网站一天中更新的80 622条书签为研究对象,根据用户标注的标签进行内容分类,测度其被引半衰期并进行比较分析,验证了不同内容网络信息资源半衰期不同:社会和生活类网页的半衰期较长,而以计算机技术和娱乐的相关网页半衰期较短.最后,提出了此研究在网络广告和挖掘网页价值中的应用.  相似文献   

8.
杨倩晨 《大众科技》2009,(5):41-42,61
互联网不断发展的今天,其开放、共享的特性使得越来越来的用户在网上寻找信息。从搜索引擎的概念、分类入手,介绍了搜索引擎的系统架构和运行机制。对搜索引擎的三个子系统:网页数据搜集子系统、网页数据整理子系统和查询服务子系统进行了深入的分析。.  相似文献   

9.
研究以满足用户的效用信息需求为目的,构建搜索引擎优化模型,该模型包括网络用户行为分析模块,网站知识信息组织模块和搜索引擎自身模块三部分。在评析三者关系基础之上,作者对搜索引擎优化模型进行了评价,指出搜索引擎优化模型能有效地解决日益增长的网络信息资源与用户效用信息需求之间的矛盾。  相似文献   

10.
基于个性化信息推荐服务的Web搜索引擎技术综述   总被引:3,自引:0,他引:3  
李树青  崔北亮 《情报杂志》2007,26(8):98-101
现代互联网的高速发展给Web搜索引擎带来了新的挑战,改善用户的查询体验以便于用户从海量的网络信息资源中得到自己所需的内容,正在成为当代搜索引擎的主要发展方向.基于个性化信息推荐服务的搜索引擎正在快速得到人们的广泛关注.经过近几年来的不断研究,现在已经形成了四种主要的形式,分别依托于查询改进、个性化网页权重、个性化多元搜索引擎和个性化信息采集等技术.在对此综合介绍的基础上,指出了未来改进的方向.  相似文献   

11.
第二代搜索引擎模式探析   总被引:17,自引:0,他引:17  
习惯上,人们认为网络搜索引擎是查询网站或网页信息的站点或工具,这是一种狭义的定义。广义地说,搜索引擎是指在互联网上或通过互联网能够响应用户提交的搜索请求,返回相应查询结果的信息技术和系统,这里所说……  相似文献   

12.
本文针对我国网络安全的实际情况,给出获取、利用Web网络中关键信息的系统模型。通过对Web网页搜索引擎、机器翻译、语料数据库自动建立等技术的研究,讨论构建基于机器翻译的跨语言网络信息安全主动防御模型。通过该模型获取、利用其他国家网络中关键信息,从而能够争取信息的获取权、控制权和使用权。  相似文献   

13.
互联网带给人们的是海量信息,而这并没有给用户带来十足的方便,人们反而因为这些海量信息而不知道怎样找到对自己有用的信息。搜索引擎的出现,给了人们一个不错的工具。但用户的最终信息需求能否满足,要看用户能否利用这些工具找到有效的信息。因此,用户就是对于网页评价的最终主体,也只有建立在用户基础上的网页评价才最有价值。本文试图从用户的角度出发,建立一套基于用户信息需求的网页相关性评价方法,用于评价网页信息内容与用户需求的相关性。  相似文献   

14.
用户网络信息查询需求研究   总被引:6,自引:0,他引:6  
曹树金  马利霞  郑敏 《情报科学》2006,24(6):876-883
阐述了用户网络信息查询需求调查结果中与网络信息组织相关的主要结果,论述了它对网络信息组织的三个启示:增强关键词检索功能是一项长期的任务,网络学术分类法和大众分类法应该并存,应加强对网页分类问题的研究。  相似文献   

15.
网络技术推动了传统信息服务业的发展,搜索引擎技术在信息服务业中有着越来越广泛的应用。本文首先对各行各业搜索引擎技术应用于信息服务业的现状进行了抽样调查,列出了部分有代表性的用户的应用实际情况;然后总结出了不同领域对搜索引擎的要求,和应用中存在的问题。进而通过对需求和存在问题的分析引出了个性化搜索引擎的概念,提出信息服务业与个性化搜索引擎相结合的道路,探索了搜索引擎技术应用于信息服务业的未来发展方向。  相似文献   

16.
基于RSS的分布式博客搜索引擎的研究   总被引:2,自引:0,他引:2  
针对传统搜索引擎对频繁更新的博客网站实时性搜索较差的问题,提出一种基于RSS的分布式博客搜索引擎的系统框架,通过划分网络区域,采取分布式的思想采集和索引博客网页的RSS结构化数据,从而达到了对频繁更新站点的实时性搜索,也降低了搜索引擎的存储成本和数据冗余程度.  相似文献   

17.
[目的/意义]智能创作时代,探索人工智能生成内容(AIGC)环境下用户信息行为,对进一步优化、发展与普及人工智能信息服务具有积极意义。[方法/过程]通过对话式搜索引擎的产品试用实验,对被试用户的访谈数据进行扎根分析,以构建对话式搜索引擎的用户信息行为模型。[结果/结论]用户信息行为包括信息查寻、信息选择和信息利用三个阶段。其中,信息查寻过程中用户的使用态度受技术特征影响,经由人机交互感知与技术需求匹配双重作用形成;信息选择过程中人智对比和知智对比是进行信息评估、影响用户决策的关键;同时信息利用过程中对话式搜索引擎的技术特征也会影响用户对服务失败的归因与使用体验。  相似文献   

18.
随着互联网技术的不断发展,用户收集和分析与特定主题相关的网页显得越来越困难.该文提出了面向主题的WWW信息的分类系统(WICS),该系统可以高效地收集网页,然后进行分类,最后将搜索结果呈现给用户.该文在分析典型的搜索引擎的基础上,介绍了Web文本挖掘,并将其应用到系统中.原型系统中使用了文本预处理、索引、倒排文件和向量空间距离测度等枝术、算法.初始实验表明,用原型系统进行Web信息分类,为用户获取信息提供了很大的方便,提高了搜索结果的相关性和精确度.  相似文献   

19.
专题搜索引擎也称垂直搜索引擎,主要用来满足特定领域的用户需求。Heritrix是开源的网络爬虫,Heritrix的WebUI启动方式并不易用于广大用户。本文改变了往常对Heritrix用法,摒弃了Heritrix的WebUI启动方式,对Heritrix源码进行修改,将Lucene整合到Heritrix中,构建成一个完整的搜索引擎,并通过监听器监听搜索引擎状态,使搜索引擎能够进行自动爬取和数据更新。同时,本文添加了网页过滤模块以及对查询结果排序算法进行了改进,提高了搜索引擎的易用性和查询的准确率。  相似文献   

20.
主要介绍了主题搜索引擎、网络爬虫的基本概念和Heritrix系统的体系结构,分析了Heritrix的工作流程,在Heritrix框架的基础上进行扩展和优化。通过一个实例,实现了对京东网图书信息的抓取,为建立面向图书信息的垂直搜索引擎提供了网页信息资源。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号