摘要:
前言 ETL是 Extract Transform Load的缩写,也就是抽取 转换 加载,在数据工作中是非常重要的部分。实际上,ETL就是一个对数据进行批处理的过程,一个ETL程序就是一个批处理脚本,执行时能将一堆数据转化成我们需要的形式。 每个接触过数据批处理的工程师,都走过ETL的流程,只是没 阅读全文
摘要:
如果要使用Python来连接Presto,就需要相关的驱动包。 目前发现有两个驱动包,分别是: pyhive : https://github.com/dropbox/PyHive presto python client : https://github.com/prestodb/presto p 阅读全文