网络爬虫技术专利现状 |
| |
引用本文: | 唐文俊,曹勇,刘宝俊.网络爬虫技术专利现状[J].中国科技信息,2024(8):17-19. |
| |
作者姓名: | 唐文俊 曹勇 刘宝俊 |
| |
作者单位: | 1. 国家知识产权局专利局专利审查协作四川中心;2. 重庆金山医疗机器人有限公司;3. 浪潮电子信息产业股份有限公司 |
| |
摘 要: | <正>网络爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本,其又被称为网页蜘蛛。由于万维网的快速发展以及数据的爆炸式增长,对大规模数据的网络进行数据爬取是在2001年进行的,使用了网络爬虫并采用广度优先策略对万维网3.28亿个网页进行研究。而伴随着万维网网络爬虫技术的快速发展,与网络爬虫技术相关的专利申请也与之对应进入了快速的发展阶段。本文的数据是基于网络爬虫相关中英文关键词在智慧芽数据库进行检索后获取到的数据,本文的分析是基于上述获取的数据进行的。
|
|
|