摘要:zip命令统计指标操作实例: redis中的HINCRBY命令操作示例: 参考: Redis HINCRBY命令 redis之incrby、incr、hincrby的使用 参考: Spark编程之基本的RDD算子之zip,zipPartitions,zipWithIndex,zipWithUniqu
阅读全文
摘要:部署Hive On Spark时spark读取Hive元数据报错: Failed to execute spark task, with exception 'org.apache.hadoop.hive.ql.metadata.HiveException(Failed to create spar
阅读全文
摘要:Driver: ①、driver进程就是应用的main()函数并且构建sparkContext对象,当我们提交了应用之后,便会启动一个对应的driver进程,driver本身会根据我们设置的参数占有一定的资源(主要指cpu core和memory)。②、driver可以运行在master上,也可以运
阅读全文
摘要:DataFrame与RDD互操作 官网:https://spark.apache.org/docs/2.2.1/sql-programming-guide.html 1、DataFrame与RDD互操作之一:反射方式 (RDD ==> DataFrame ①建立样例类,②调用toDF方法) pack
阅读全文
摘要:函数解析: 1. 参数:(zeroValue: U) (seqOp: (U, T) ⇒ U, combOp: (U, U) ⇒ U)2. 作用:aggregate函数将每个分区里面的元素通过seqOp和初始值进行聚合,然后用combine函数将每个分区的结果和初始值(zeroValue)进行comb
阅读全文
摘要:import java.util.Properties import org.apache.spark.sql.{DataFrameReader, SparkSession} object testMysql2 { def main(args: Array[String]): Unit = { //
阅读全文