上一页 1 2 3 4 5 6 7 ··· 48 下一页
摘要: public InputSplit[] getSplits(JobConf job, int numSplits) throws IOException { StopWatch sw = new StopWatch().start(); // 得到文件列表 输入源 FileStatus[] file 阅读全文
posted @ 2019-07-23 23:07 十七楼的羊 阅读(395) 评论(0) 推荐(0) 编辑
摘要: hbase 常见操作: # 新建表 fs与 fs2 为列族 create 's1','fs','fs2' ''' BLOCKCACHE : 读缓存 BLOCKSIZE : 缓存块大小 INMEMORY: 是否在缓存在内存 ''' 常见表操作 # 添加 s1 表中 rowkey 为 '11111', 的... 阅读全文
posted @ 2019-07-20 12:20 十七楼的羊 阅读(214) 评论(0) 推荐(0) 编辑
摘要: 一,HBASE 数据库 1,非关系型数据库 2,hadoop databases 简称 hbase ,是一个高可靠性,高性能,面向列(按照列,在添加数据时候,进行创建表结构),可伸缩,实时读写的分布式数据库 3,主要是用来存储非结构化和半结构化的松散模型二,数据模型 Row Key: 1,row k 阅读全文
posted @ 2019-07-19 00:06 十七楼的羊 阅读(313) 评论(0) 推荐(0) 编辑
摘要: ################################################################################ # Licensed to the Apache Software Foundation (ASF) under one # or mor 阅读全文
posted @ 2019-07-16 00:07 十七楼的羊 阅读(240) 评论(0) 推荐(0) 编辑
摘要: CDH 简介与优点: 1,像 linux 发行版一样, 将 大数据 大部分技术,挑选合适的版本号打成的包. 2,提供了大数据技术的整合,解决了技术之间的版本依赖问题 3,只需要web页面点击,就可以完成部署(hadoop,spark等) 4,可以监控集群的健康状况 5, 版本划分清晰,版本更新速度快 阅读全文
posted @ 2019-07-09 23:18 十七楼的羊 阅读(1462) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 48 下一页