Haskell学习-高阶函数

原文地址：Haskell学习-高阶函数
高阶函数(higher-order function)就是指可以操作函数的函数，即函数可以作为参数，也可以作为返回结果。有了这两个特性，haskell可以实现许多神奇的效果。

柯里化（Currying）

在haskell中所有的算术运算符都是函数(包括大小于等于关系符等)，而它们的快捷方式都可以省略操作数（参数）。

(+) 1 2 -- (+) 是需要两个操作数的函数
> 3

(+1) 2 -- (+1) 是需要左操作数的函数
> 3

(3*) 3 -- (3*) 是需要右操作数的函数
> 6

map (*2) [1,2,3] -- map所有元素 *2 的操作
> [2,4,6]

filter (>3) [2,3,4,5] -- 过滤 >3的元素
> [4,5]

haskell中的函数默认都是前缀模式的，也就是：函数名参数1 参数2 ... 。但几乎所有拥有两个参数的函数都有中缀模式，只需要将函数名反引号包起来就可以了：参数1 `函数名` 参数2。因为在某些情况下中缀函数可读性更好，更符合人们的理解习惯。

5 `div` 3 -- 求余数
> 1

9 `mod` 7 -- 求模
> 2

'f' `elem` ['a' .. 'z'] -- 是否包含'f'
> True

本质上，Haskell 的所有函数都只有一个参数，那么我们多个参数的函数又是怎么回事? 那是因为所有多个参数的函数都是 Curried functions。其实从上面的算术运算函数例子，我们大概就能猜出来了。接着用实例来进验证一下：

moreThen4 = max 4 -- 最小为4的函数

:t max -- 需要两个可比较的参数的函数
max :: Ord a => a -> a -> a

:t moreThen4 -- 需要一个可比较的数字的函数
> moreThen4 :: (Ord a, Num a) => a -> a

通过查看函数的类型可发现，两个参数的 max 函数其实可以写成 (max x) y 。moreThen4 其实就是 max 函数以不全的参数调用后，再创建了一个新的返回函数，该函数是单个参数形式的。

这和 JavaScript 里用闭包的特性返回函数来实现 柯里化 是一样一样的。但在函数式语言当中，函数本来就是一等公民，这事情简直就是和吃饭睡觉一样地自然而然。

我们看起来很怪的函数类型描述 Num a => a -> a -> a ，这下也能理解通了。它表示的是函数取一个数字参数a后，会返回一个需要a类型参数的函数 (Num a) => a -> a ，最后的这个函数再取一个参数a后，最终就会回传a类型的结果。
利用柯里化去掉多余参数后的函数更加简洁：

sum' xs = foldl (+) 0 xs
sum' = foldl (+) 0  -- 去掉xs后

maxNum x = foldr max 0 x
maxNum = foldr max 0  -- 去掉x后

Lambda表达式

lambda 已经不是什么新鲜事物了，早在 .NET 4.0时代 C# 就已经引入了 lambda，JavaScript 也在 ES6 中引入。

编写匿名的函数，这样就不需要费力的创建命名函数。因为匿名函数从 lambda 演算而来，所以匿名函数通常也被称为 lambda 函数。

在 Haskell 中，匿名函数以反斜杠符号 \ 开始，后跟函数的参数（可以包含模式），而函数体定义在 -> 符号之后。lambda 函数的定义只能有一条语句，同时无法为一个参数设置多个模式，如 [] 和 (x:xs)。

plusOne = \x -> x+1

checkZero = \x -> if x > 0 then "大于0" 
    else if x<0 then "小于0" 
    else "等于0"

折叠函数

遍历列表是一个非常普遍的需求，用折叠函数代替显式递归进行遍历明显更加易于理解和实现。其中 foldl 是左结合，foldr 是右结合，一般右折叠效率比较高，同时 foldr 也可以用于无限列表，所以应尽量使用 foldr。

折叠函数调用格式: fold 处理函数初始值(累加值) 需要折叠的列表

另外还提供了和 foldl/foldr 相似的 foldl1/foldr1，它们默认使用列表第一项为初始值，所以可以省略初始值。

map' :: Foldable t1 => (t2 -> a) -> t1 t2 -> [a]
map' f = foldr (\x acc -> f x:acc) []

filter' :: Foldable t => (a -> Bool) -> t a -> [a]
filter' f = foldr (\x acc -> if f x then x:acc else acc) []

elem' :: (Foldable t, Eq a) => a -> t a -> Bool
elem' y = foldl (\acc x -> if y==x then True else acc) False

and' :: Foldable t => t Bool -> Bool
and' = foldr1 (\x y->if not y then False else if not x then False else True)

-- 执行
map' (*2) [1,2]
> [2,4]

filter (>2) [1,2,3,4]
> [3,4]

elem' 1 [1,2,3]
> True

and' [True,False,True]
> False

与 foldl 和 foldr 相似的scanl 和 scanr，它们会记录下累加值的所有状态到一个 List。
也有 scanl1 和 scanr1。

scanl (+) 0 [3,5,2,1]  
> [0,3,8,10,11]  

scanr (+) 0 [3,5,2,1]  
> [11,8,3,1,0]

还有 foldl' 和 foldl1' 是它们各自惰性实现的严格版本。在用 fold 处理较大的 List 时，经常会遇到堆栈溢出的问题。而这罪魁祸首就是 fold 的惰性: 在执行 fold 时，累加器的值并不会被立即更新，而是做一个"在必要时会取得所需的结果"的承诺。每过一遍累加器，这一行为就重复一次。而所有的这堆"承诺"最终就会塞满你的堆栈。严格的 fold 就不会有这一问题，它们不会作"承诺"，而是直接计算中间值的结果并继续执行下去。如果用惰性 fold 时经常遇到溢出错误，就应换用它们的严格版。

函数组合

（$) 叫作函数呼叫符，它的优先级最低。

 f $ g x => f (g x)

-- 取>2的列表长度
length (filter (>2) [1,2,3,4])
length $ filter (>2) [1,2,3,4] -- 降低优先级消除括号
> 2

(.) 函数复合运算符，它可以组合函数，并产生新函数，然后传递给其它函数。当然我们可以用 lambda 实现，但大多数情况下，使用函数组合无疑更清楚。

(f . g) x => f(g x) 

-- 验证字符串是否为数字
not ( and ( map isDigit $ "12as"))
not . and . map isDigit $ "12as" -- 使用组合消除括号
> True

这两个运算符是消除括号的神器，有了它们，代码的可读性大大提高。
我们再利用haskell强大的模式匹配能力，改变函数运行方向，改造后的效果类似于unix/linux的管道，把上面两个表达式重写。现在连 ($) (.) 都不需要了，吊炸天了，有木有😊

-- 让参数和结果首尾相连，就是这么简单
x |> f = f x

-- unix/linux 中的管道？
[1,2,3,4] |> filter (>2) |>length
> 2

"12as" |> map isDigit |> and |> not
> True

参考资料

《HASKELL 趣学指南》
《Real World Haskell》

posted @ 2018-08-11 09:12 Jeff.Zhong 阅读(2269) 评论(0) 编辑收藏举报

刷新页面返回顶部

Jeff.Zhong