共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
网络爬虫是一种自动下载网络资源的程序,是搜索引擎的基础构件之一,它的性能直接决定了在庞大的互联网上进行网页信息采集的质量.文章对网络爬虫相关技术以及聚焦网络爬虫的特点进行了分析和探讨. 相似文献
3.
对P2P网络中的搜索算法进行分析,重点对广度优先搜索做了深入的研究和探讨,在广度优先搜索(BFS)机制的基础上,将智能搜索技术应用于P2P网络资源搜索中,得到了一种基于智能广度优先搜索算法的思路。对BFS算法进行了改进,得出了智能BFS(I-BFS)算法框架,最后对I-BFS进行仿真实验。实验结果表明:智能广度优先搜索算法和广度优先算法相比,避免了向所有接点发送,减少了网络中的路由消息,降低了网络的负载,提高了资源搜索的成功率。 相似文献
4.
针对地震、飓风等自然或者人为灾害条件下大规模路网疏散的交通管理问题进行了研究。在考虑逆向通行的情形下,建立应急疏散路线的规划模型,并得出基于广度优先搜索的遗传算法。在研究中将该模型应用于秦山核电站,并对其疏散效果进行综合分析。 相似文献
5.
针对八数码问题的求解,给出了深度优先搜索、广度优先搜索和启发式搜索(譬如A*算法)之间的算法比较,通过实验验证各种算法并得出结论:在通常情况下,采用启发式搜索算法来进行状态空间的搜索更为方便、高效。 相似文献
6.
网络舆情引导是网络舆情生态治理中不容忽视的一方面,也是新时代国家意识形态安全和主流新闻舆论传播的重要课题。文章聚焦分析大数据和人工智能技术给网络舆情引导带来的机遇和挑战,并在此基础上提出新背景下网络舆情引导的策略建议。 相似文献
7.
8.
高校人才培养方案改革是多主体参与的复杂问题,根据人才培养流程,首先构建了大数据背景下人才培养超网络模型,然后深入研究岗位、能力、知识和课程网络之间的相互映射关系,最后探讨了人才培养超网络模型在高校人才培养改革方案中的应用,以期为大数据背景下高校人才培养方案改革提供帮助。 相似文献
9.
10.
11.
网络爬虫对网页的抓取与优化策略直接影响到网页采集的广度、深度,以及网页预处理的数量和搜索引擎的质量。搜索引擎的设计应在充分考虑网页遍历策略的同时,还应加强对网络爬虫优化策略的研究。本文从主题、优先采集、不重复采集、网页重访、分布式抓取等方面提出了网络爬虫的五大优化策略,对网络爬虫的设计有一定的指导和启迪作用。 相似文献
12.
本文从搜索引擎的相关概念和构成出发,介绍了网络爬虫的相关概念,并阐述了网络爬虫的搜索策略,同时给出了现在比较流行的Googlc 的搜索具体实现,文章最后对未来进行了展望. 相似文献
13.
14.
15.
大数据时代的到来,将数据和信息分析提升到前所未有的高度。探讨了大数据背景下情报分析面临的新环境:数据流分析倍受关注、信息粒度更为细小、情报问题动态复杂、分析技术丰富多样;进一步提出情报分析的发展趋势:注重情境研究,开展协同分析,分析实时数据;最后指出在新环境下情报分析需要注意的两个问题:大数据的陷阱和待构建的指标。 相似文献
16.
大数据时代已经到来,在面向大数据系统综合解决方案中,存储系统是最基础的支撑,相对于传统的基础上,分析归纳了大数据对存储系统的技术要求。高校是信息化应用的前沿,文章提出了宏观层面大数据时代存储系统构建的基础架构,用以科学合理指导高校面向大数据的存储基础设施建设。 相似文献
17.
随着互联网技术和应用的发展,网络舆情在数据体量、复杂性和产生速度等方面发生巨大变化。网络舆情分析方法已超出了现有常用的分析框架,必须在大数据分析的思维下有所创新。本文概述了常用的网络舆情分析方法,归纳了当前网络舆情的大数据特征和分类,提出了网络舆情分析创新要向大数据分析方向发展的观点,并概述了4种新思路新方法,对需要注意的相关问题进行了总结,对未来网络舆情分析创新进行了展望。 相似文献
18.
李艳 《内蒙古科技与经济》2016,(5):159-161
分析了图书馆基于大数据技术开展用户信息服务的必要性,指出图书馆应以大数据为手段转变信息服务理念,以资源共享为途径加强信息传播,优化整合流程拓宽信息服务范围,引入慕课(MOOC)开展创新服务等策略提升服务质量。 相似文献
19.
本文介绍了网络爬虫的基本架构、工作原理,设计了网络视频爬虫网络视频爬虫的基本架构、详细讨论了如何有效的避免重复遍历网页和如何快速的更新网站新内容的两个关键问题和网络视频爬虫下载视频和抓取网页的工作方式。 相似文献
20.
文章设计了一种根据简单关键词从电商平台获取同类商品基本信息及其评论的爬虫模型,基于Python语言丰富而强大的标准库和第三方库,通过多种爬虫技术相互配合,从爬取技术、爬取流程、反爬机制3个方面综述了该模型的实现过程。 相似文献