摘要: 自定义sparkSQL数据源的过程中,需要对sparkSQL表的schema和Hbase表的schema进行整合; 对于spark来说,要想自定义数据源,你可以实现这3个接口: BaseRelation 代表了一个抽象的数据源。该数据源由一行行有着已知schema的数据组成(关系表)。 TableS 阅读全文
posted @ 2019-05-01 23:34 niutao 阅读(1644) 评论(1) 推荐(1) 编辑