摘要: 需求: 1、需要从一张mysql数据表中获取并筛选数据 2、通过spark将该表读进来,形成一个df:DataFrame,有一个集合 3、需要从df中进行筛选出来name在list中的值 df.where('name.isin(list)).show() 结果: 然而,isin(),看源码: 里面需 阅读全文
posted @ 2019-04-10 13:54 郭小白 阅读(4119) 评论(0) 推荐(1) 编辑
摘要: 在spark项目中读取mysql中的数据的时候,发生了报错: 原因:主要是因为数据库中有一些字段为null,无法进行转换: 上面字段那种,我的inserttime字段类型为timestamp类型,不为空,默认值为000-00-00 00:00:00,所以无法进行转换,所以要进行处理一下 所以这里要进 阅读全文
posted @ 2019-04-10 13:40 郭小白 阅读(517) 评论(0) 推荐(0) 编辑