随笔分类 -  编程语言

Python、Scala、Java等
摘要:一.简介 Spark的自定义udf和udaf是为了提供函数扩展,Spark本身提供了几十上百个算子,在数据分析的各个方面的常用计算方式都有提到,但计算场景千差万别,算子也不会面面俱到,如何在单机或集群上定义函数就是要重点关注的地方。特别是在集群模式中,函数需要使用spark注册才能在各个节点上使用, 阅读全文
posted @ 2018-11-26 17:56 云山之巅 阅读(777) 评论(0) 推荐(0) 编辑
摘要:一.概述 高阶函数,就是一个函数可以接收另一个函数作为参数的函数,scala与之类似。 二.导入基础包 import random from functools import reduce 三.自定义高阶函数 #定义普通函数,自动生成列表 def getList(): hList = list(ra 阅读全文
posted @ 2018-06-05 17:38 云山之巅 阅读(684) 评论(7) 推荐(0) 编辑
摘要:一.isinstance&type isinstance()函数用来判断一个对象是否是一个已知类型的数据,类似于type()。 isinstance()和type()的区别: 1.type()不会认为子类是一种父类类型,不考虑继承关系。 2.isinstance()会认为子类是一种父类类型,考虑继承 阅读全文
posted @ 2018-06-05 16:39 云山之巅 阅读(370) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示