摘要: 前言 ETL是 Extract Transform Load的缩写,也就是抽取 转换 加载,在数据工作中是非常重要的部分。实际上,ETL就是一个对数据进行批处理的过程,一个ETL程序就是一个批处理脚本,执行时能将一堆数据转化成我们需要的形式。 每个接触过数据批处理的工程师,都走过ETL的流程,只是没 阅读全文
posted @ 2018-01-21 22:17 longfei_aot 阅读(8463) 评论(1) 推荐(2) 编辑
摘要: 如果要使用Python来连接Presto,就需要相关的驱动包。 目前发现有两个驱动包,分别是: pyhive : https://github.com/dropbox/PyHive presto python client : https://github.com/prestodb/presto p 阅读全文
posted @ 2017-12-27 11:08 longfei_aot 阅读(14634) 评论(1) 推荐(0) 编辑