首页 | 本学科首页   官方微博 | 高级检索  
     检索      

中文Deep Web的大小、质量及分布
引用本文:藕军,任明仑,左春荣,章成志.中文Deep Web的大小、质量及分布[J].情报学报,2008,27(2):256-260.
作者姓名:藕军  任明仑  左春荣  章成志
作者单位:1. 合肥工业大学计算机网络研究所,合肥,230009
2. 南京大学信息管理系,南京,210093
摘    要:Deep Web中包含着大量高质量内容,当前的搜索引擎技术还不能对其进行搜索,研究Deep Web的大小、质量及分布情况将有助于找到对其进行有效搜索的方法和技术.以网络蜘蛛采集的2006年10月的数据为样本,利用统计、概率等定量方法和定性方法,首次对中文Deep Web的大小、质量及分布情况进行调查,得出概况如下:① Deep Web大小比Surface Web 的大240倍以上;②包含的文件总数量和总存储量分别为507亿、11 700TB;③可搜索数据库数量超过3万个;④内容质量较高;⑤内容主题分布不均匀.

关 键 词:Deep  Web  中文Web  搜索引擎
修稿时间:2007年1月15日

Deep Web in Chinese:Size,Quality,Distribution
Ou Jun,Ren Minglun,Zuo Chunrong,Zhang Chengzhi.Deep Web in Chinese:Size,Quality,Distribution[J].Journal of the China Society for Scientific andTechnical Information,2008,27(2):256-260.
Authors:Ou Jun  Ren Minglun  Zuo Chunrong  Zhang Chengzhi
Institution:Ou Jun~1 Ren Minglun~1 Zuo Chunrong~1 Zhang Chengzhi~2 (1.Institute of Computer Network of Hefei University of technology,Hefie 230009,2.Department of Information Management,Nanjing University,Nanjing 210093)
Abstract:
Keywords:deep Web  Web in Chinese  search engine  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号