摘要:
DataFrame和RDD互操作的两种方式:1)反射:case class 前提:事先需要知道你的字段、字段类型 2)编程:Row 如果第一种情况不能满足你的要求(事先不知道列)3) 选型:优先考虑第一种 阅读全文
摘要:
RDD里面Person看不到具体的内容哦,DataFrame可以看到name age height, 这样,DataFrame就可以做更多的优化。 RDD: java/scala ==> jvm python ==> python runtime DataFrame: java/scala/pyth 阅读全文