随笔分类 -  大数据

Terraform 多云管理工具
摘要:1. 介绍 Terraform is a tool for building, changing, and versioning infrastructure safely and efficiently. Terraform can manage existing and popular serv 阅读全文

posted @ 2017-07-02 23:00 荣锋亮 阅读(699) 评论(0) 推荐(0) 编辑

minio 介绍
摘要:minio 兼容Amason的S3分布式对象存储项目,采用Golang实现,客户端支持Java,Python,Javacript, Golang语言。 Minio可以做为云存储的解决方案用来保存海量的图片,视频,文档。由于采用Golang实现,服务端可以工作 在Windows,Linux, OS X 阅读全文

posted @ 2017-06-22 20:11 荣锋亮 阅读(3438) 评论(0) 推荐(0) 编辑

Apache Tez 了解
摘要:你可能听说过Apache Tez,它是一个针对Hadoop数据处理应用程序的新分布式执行框架。但是它到底是什么呢?它的工作原理是什么?哪些人应该使用它,为什么?如果你有这些疑问,那么可以看一下Bikas Saha和Arun Murthy提供的呈现“Apache Tez: 加速Hadoop查询处理”, 阅读全文

posted @ 2017-06-12 07:11 荣锋亮 阅读(17673) 评论(0) 推荐(1) 编辑

摘要:Cascalog一种能使在Hadoop上使用Clojure处理数据变得简单直观的工具。 Cascalog综合了两大顶尖技术:Clojure和Hadoop,同时让Datalog焕发青春。 Cascalog的特点是高性能、灵活和鲁棒。 阅读全文

posted @ 2017-06-11 11:48 荣锋亮 阅读(334) 评论(0) 推荐(0) 编辑

drill 表&&视图使用
摘要:1. table create table table_name as select * from storage_name.dbname.tablename create table table_name as select * from storage_name.dbname.tablename 阅读全文

posted @ 2017-06-04 16:30 荣锋亮 阅读(441) 评论(0) 推荐(0) 编辑

drill 数据库查询方式简单说明
摘要:1. mysql select * from mysql-storage.mysqldb.mysqltable select * from mysql-storage.mysqldb.mysqltable 2. oracle select * from oracle-storage.username 阅读全文

posted @ 2017-06-02 11:06 荣锋亮 阅读(511) 评论(0) 推荐(0) 编辑

drill java && spring jdbc 连接使用
摘要:原生 jdbc 连接 1. maven 包 <dependency> <groupId>org.apache.drill.exec</groupId> <artifactId>drill-jdbc-all</artifactId> <version>1.10.0</version> </depend 阅读全文

posted @ 2017-05-31 19:38 荣锋亮 阅读(904) 评论(0) 推荐(0) 编辑


< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5