SparkSQL 自定义标准函数

本文的前提条件: SparkSQL in Java
参考地址: Scalar User Defined Functions (UDFs)

完整代码

package cn.coreqi;

import static org.apache.spark.sql.functions.udf;
import org.apache.spark.SparkConf;
import org.apache.spark.sql.*;
import org.apache.spark.sql.expressions.UserDefinedFunction;
import org.apache.spark.sql.types.DataTypes;

public class Main {
    public static void main(String[] args) {
        // 创建SparkConf对象
        SparkConf sparkConf = new SparkConf()
                .setMaster("local[*]")
                .setAppName("sparkSql");

        SparkSession spark = SparkSession
                .builder()
                .config(sparkConf)
                .getOrCreate();

        Dataset<Row> df = spark.read().json("datas/user.json");
        df.show();

        // DataFrames => SQL
        df.createOrReplaceTempView("user");

        UserDefinedFunction perfixName = udf(
                (name) -> "Name: " + name, DataTypes.StringType
        );
        perfixName.asNondeterministic();
        spark.udf().register("perfixName", perfixName);
        spark.sql("select age, perfixName(username) from user").show();

        // 关闭
        spark.close();
    }
}

作者:奇

出处:https://www.cnblogs.com/fanqisoft/p/17963589

版权:本作品采用「本文版权归作者和博客园共有,欢迎转载,但必须给出原文链接,并保留此段声明,否则保留追究法律责任的权利。」许可协议进行许可。

posted @   SpringCore  阅读(21)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!
历史上的今天:
2023-01-14 Docker 部署 Zabbix
2023-01-14 Centos8 部署 Zabbix
more_horiz
keyboard_arrow_up light_mode palette
选择主题
点击右上角即可分享
微信分享提示