首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   2篇
  免费   0篇
  国内免费   1篇
教育   2篇
信息传播   1篇
  2015年   1篇
  2009年   1篇
  2008年   1篇
排序方式: 共有3条查询结果,搜索用时 15 毫秒
1
1.
基于Nutch的Web网站定向采集系统   总被引:3,自引:0,他引:3  
在对目前具有代表性的开源网络抓取软件Nutch、Heritrix、WCT、Web-Harvest进行比较分析的基础上,提出基于Nutch的Web网站定向采集系统,并对种子站点的选取、抓取过程管理、网页去噪、新种子站点的发现等关键问题进行重点探讨。  相似文献   
2.
对web文本聚类中的数据预处理、聚类算法及结果评估等进行了分析研究.在由lucene和nutch构建的搜索引擎的基础上,提出基于k—means聚类算法web页聚类系统设计方案,并论述了各模块的设计与实现方法.  相似文献   
3.
《考试周刊》2015,(51):128-129
作业是检验教学效果的一种重要手段,但是不可避免存在作业抄袭的现象。随着网络的进一步发展,学生作业的抄袭从简单的同学间抄袭延伸到从网络抄袭,如何从几十亿网页中找到抄袭的源头成了亟待解决的问题。文章结合Map Reduce及Nutch提出在大数据环境下作业抄袭检测的设计方案。  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号