摘要: Hadoop序列化:Long 和Int---变长编码的方法: 如果整数在[ -112, 127] ,所需字节数为1,即第一个字节数就表示该值。 如果大于127,则第一个字节数在[-120,-113]之内,正数字节数为(-112-第一个字节)---最多八个字节。 如果小于-112,则第一个字节数在[-128,-121]之内,负数字节数为(-120-第一个字节)---最多八个字节。... 阅读全文
posted @ 2014-12-19 16:18 dorothychai 阅读(200) 评论(0) 推荐(0) 编辑
摘要: Doug Cutting Lucene(索引引擎)---Nutch(搜索Data抓取)---Hadoop 1997:Lucene 2003:GFS 2004:NDFS\MapReduce\Nutch 2006: (Yahoo! Facebook NewYorkTimes) Hadoop 2008: HBase Zookeeper Mahout 2009: Pig\ Hive Hadoop... 阅读全文
posted @ 2014-12-19 15:07 dorothychai 阅读(198) 评论(0) 推荐(0) 编辑