Nutch的发展历程(转)

2002年8月由Doug Cutting发起,托管于Sourceforge,之后发布了0.4、0.5、0.6三个版本

2004年9月Oregon State University(俄勒冈州立大学)采用Nutch

2004年9月Creative Commons(知识共享)推出基于Nutch的搜索服务

2005年1月加入Apache的孵化器

2005年6月孵化结束成为Lucene的子项目

2005年8月发布版本0.7( Apache Lucene sub-project)

2005年10月发布版本0.7.1

2006年3月发布版本0.7.2

2006年7月发布版本0.8(全新的架构,基于Hadoop 0.4 ,Hadoop诞生)

2006年9月发布版本0.8.1

2007年4月发布版本0.9

2009年3月发布版本1.0(Tika诞生,0.1-incubating)

2010年4月Nutch成为Apache顶级项目

2010年6月发布版本1.1

2010年9月发布版本1.2

2011年6月发布版本1.3( 从搜索引擎到网络爬虫)

2011年11月发布版本1.4

2012年6月发布版本1.5

2012年7月发布版本2.0( 2.X  Gora诞生,table-based architecture )

2012年7月发布版本1.5.1

2012年8月Nutch诞生十周年

2012年10月发布版本2.1( 2.X开始支持elastic search )

2012年12月发布版本1.6

2013年6月发布版本2.2(crawler-commons 诞生)

2013年6月发布版本1.7(crawler-commons 诞生)

2013年7月发布版本2.2.1

posted @ 2016-07-05 18:01  dy9776  阅读(225)  评论(0编辑  收藏  举报