这次主要介绍下nutch2.1和mysql和elasticsearch的整合,是在单机上运行,并不是分布式部署。
1、下载nutch2.1 2、配置nutch使用mysql作为数据存储  3、修改conf的nutch-site.xml 
4、使用ant编译源码。 5、设置待抓取的网站 6、创建数据库和表 7、执行爬行操作
8、执行索引操作