摘要:
IDEA中运行spark报如下错误 Exception in thread "main" java.lang.NoSuchMethodError: scala.Product.$init$(Lscala/Product;)V at org.apache.spark.SparkConf$Depreca 阅读全文
摘要:
实现一个UDF函数可以继承 org.apache.hadoop.hive.ql.exec.UDF,也可以继承 org.apache.hadoop.hive.ql.udf.generic.GenericUDF 1.继承UDF,参考 https://docs.microsoft.com/en-us/az 阅读全文
摘要:
1.DataFrame API读取avro文件 https://sparkbyexamples.com/spark/read-write-avro-file-spark-dataframe/ pom引入,spark2.4.0之后可以使用apache的spark-avro包,之前需要使用databri 阅读全文
摘要:
1.缓冲区Buffer import java.nio.IntBuffer; //主类 //Function : IntBuffer_demo public class IntBuffer_demo { public static void main(String[] args) { // TODO 阅读全文
摘要:
1.引入依赖 <!--parquet--> <dependency> <groupId>org.apache.parquet</groupId> <artifactId>parquet-avro</artifactId> <version>1.10.0</version> </dependency> 阅读全文
摘要:
1.使用Flink SQL 如果使用的是flink sql的话,如果想要同步表到hive metastore的话,只需要在flink sql的建表语句中添加 hive_sync 相关的一些配置即可,如下 'hive_sync.enable' = 'true', 'hive_sync.mode' = 阅读全文