Haskell学习-函数式编程初探
原文地址:Haskell学习-函数式编程初探
为什么要学习函数式编程?为什么要学习Haskell?
.net到前端,C#和JavaScript对我来说如果谈不上精通,最起码也算是到了非常熟悉的程度。这两门语言就像是我的盾牌和宝剑,给我保驾护航,开山劈石,伴随着我不断成长。同时C#和JavaScript它们本身也在不断地进化,不断出现越来越多方便的语法糖,但追根到底很多都是从函数式语言汲取的精华。比如高阶函数,lambada表达式,柯里化等。
于是从探险的角度,以好奇的心态开始学习函数式语言,探索这个宝库,拾取可供临摹的珍宝。最起码它能让你多一个不同的角度看待编程语言,影响你的思考方式。 学习的对象当然选择函数式语言的集大成者-Haskell。
什么是Haskell和函数式编程
Haskell 是一门纯粹函数式的语言。
函数式编程是面向数学的抽象,将计算描述为一种表达式求值。命令式编程是关于解决问题的步骤,函数式编程是关于数据的映射。在纯粹函数式程式语言中,你不是像命令式语言那样命令计算机「要做什么」,而是通过用函数来描述出问题「是什么」,也就是所谓范畴论中的映射关系。函数式语言有以下的特性:
- 函数是一等公民,可以在任何地方定义,在函数内或函数外,可以作为函数的参数和返回值,可以对函数进行组合
- 变量的值是不可变的(immutable),也就是说不允许像命令式编程语言中那样多次给一个变量赋值。
- 函数式语言的条件语句,循环语句等也不是命令式编程语言中的控制语句,而是函数的语法糖
- 惰性求值
- 抽象数据类型
- 灵活的多态
- 高阶函数(Higher-order function)
- 柯里化(Currying)
- 闭包(Closure)
函数式编程的优点
函数式的最主要的好处主要是不可变性带来的。没有可变的状态,函数就是引用透明(Referential transparency)的和没有副作用(No Side Effect)。
- 函数即不依赖外部的状态也不修改外部的状态,函数调用的结果不依赖调用的时间和位置,这样写的代码容易进行推理,不容易出错。这使得单元测试和调试都更容易。
- 由于(多个线程之间)不共享状态,不会造成资源争用(Race condition),也就不需要用锁来保护可变状态,也就不会出现死锁,这样可以更好地并发,能够更好地利用多个处理器(核)提供的并行处理能力。
Haskell基本语法
-
变量和函数
一起介绍是因为在我看来,haskell中变量和函数是没有区别的。它们都是表达式,根据表达式的不同形式,分别对应到命令式语言中变量和函数的概念。 而且 haskell 中 变量 赋值后就是不可变的,该 变量 就等于被赋予的值,与命令式语言中 变量 是内存地址的引用是完全不同的概念。 硬要对应的话它更像是 C# 中的不可变量 const 或 static readonly 。
你能从下面代码中区分出哪些是变量,哪些是函数吗?a = 1 -- 变量 arr = map (*2) [1,2,3] -- 变量还是函数? maxNum = foldr max 0 -- 函数 --执行 a > 1 arr > [2,4,6] maxNum [3,5,1] > 5
定义函数: 函数名 参数 = 代码
调用函数: 函数名 参数
调用函数不用大括号( ),注意的是函数首字母不能大写。 还有maxNum看不到形式参数是因为柯里化可以去掉参数,后面会介绍。 -
if else
haskell中 if else 表达式中的 else 部分不能省略,也就是你不能只有 if 部分-- 等于小于大于0 分别对应 0,-1,1 sign x = if x == 0 then 0 else if x < 0 then -1 else 1
-
case of
case of 表达式,与其他语言的switch case 类似。-- 求出列表第一项 head' xs = case xs of [] -> "No head for empty lists!" (x:_) -> show x -- 执行 head' "hello" >'h' head' [3,2,1] > 3
-
函数模式匹配
函数模式匹配的方式定义 head',以及定义阶乘函数 factorial,它本质上就是 case of 的语法糖。函数模式匹配,减少了一大堆类似 if else 的判断逻辑,是我最喜欢的特性之一。-- 求出列表第一项 head' [] = "No head for empty lists!" head' (x:_) = show x -- 阶乘 factorial 0 = 1 factorial n = n * factorial (n - 1) --执行 head' [3,2,1] > 3 factorial 5 > 120
-
guards 和 where
guards,类似 if else 表达式,但可读性更强,where语句定义的是局部变量表达式,它只能放在语句尾部,guards同样也是非常好的定义方式。bmiTell weight height | bmi <= 18.5 = "You're underweight,you emo,you!" | bmi <= 25.0 = "You're supposedly normal. Pffft,I bet you're ugly!" | bmi <= 30.0 = "You're fat! Lose some weight,fatty!" | otherwise = "You're a whale,congratulations!" where bmi = weight / height ^ 2
-
let in
let in 表达式,let 中绑定的名字仅对 in 部分可见。-- 圆柱体面积 cylinder r h = let sideArea = 2 * pi * r * h topArea = pi * r ^2 in sideArea + 2 * topArea
递归
-
我们使用递归来实现斐波那契数列和快速排序,haskell写的快速排序是我见过的最容易理解的版本了,专门为解决数学问题而生的 haskell 在解决算法和数据结构方面果然是不同凡响。
-- 斐波那契数列 fab 1 = 1 fab 2 = 1 fab n = fab (n-1) + fab (n-2) -- 快速排序 quicksort [] = [] quicksort (x:xs) = let smallerSorted = quicksort [a | a <- xs, a <= x] biggerSorted = quicksort [a | a <- xs, a > x] in smallerSorted ++ [x] ++ biggerSorted
-
尾递归实现常用的map和filter函数
-
[] 表示空列表
-
_ 匹配的是任意值。
-
(x:xs) 非常有用的列表匹配模式,x表示第一项,xs表示除去第一项之后的部分。使用(x:xs)可以方便的实现尾递归
-- map map' f [] = [] map' f (x:xs) = f x : map' f xs -- filter filter' _ []= [] -- _代表任意值 filter' f (x:xs) | f x = x : filter' f xs | otherwise = filter' f xs
数据类型
了解了haskell基本语法后,我们再进一步了解haskell基本数据类型
-
:type 获取任何表达式的类型,可以用简写形式 :t
-
基本数据类型
- Int 表示整数
- Integer 也是整数,但表示的是无界的,所以可以表示非常大的数
- Float 表示单精度的浮点数
- Double 表示双精度的浮点数
- Bool 表示布尔值,它只有两种值:True 和 False
- Char 表示一个字符。一个字符由单引号括起,一组字符的 List 即为字符串
- List 列表中所有的项都必须是同一类型。
- Tuple 的类型取决于它的长度及其项的类型。
:t 1 -- Number 1 :: Num p => p :t 1::Integer 1::Integer :: Integer :t 1::Float 1::Float :: Float :t False -- Bool False :: Bool :t 'c' --字符 'c' :: Char :t "hello" -- 字符串 "hello" :: [Char] :t [1,2,3] -- 列表list [1,2,3] :: Num a => [a] :t [("hi",1),("there",2)] -- Tuple [("hi",1),("there",2)] :: Num b => [([Char], b)]
- 1::Integer 表示直接指定类型,如果不指定编译器会自动推导出类型,数字类型会推导出Number类型,它包括Int,Integer,Float,Double
- [Char] 和 String 表示的都是字符串类型
- [1,2,3] :: Num a => [a] 列表中的 a 表示任意类型,意思你可以是Bool,Stirng,Int等等
- [("hi",1),("there",2)] 这就是Tuple类型,列表里面的每个项都用 () 包起来,其中的每个项的元素数据类型必须相同,每个tuple中元素个数必须相等,但是每个tuple中的项可以不同类型,比如 ("hi",1) 中一个是字符串,一个是Int。
-
函数也有类型,定义函数的时候,加上参数的类型和输出类型是好习惯。
- &&、||、not 表示与或非逻辑
- == 表示等于
- /= 表示不等于
- ++ 连接列表,相当于concat
- a, b这种类型参数,表示可以传入任何类型。
- (Num a, Num p, Ord a) => a -> p 在 => 之前表示的是类型约束,这里的 a 限定只能是 Num 类型和 Ord 类型。Num表示数字类型,Ord则表示可比较大小的型别,包含如下三种型别之一:GT, LT, EQ。
:t head -- 取列表第一项的函数 head :: [a] -> a :t sign -- sign函数 sign :: (Num a, Num p, Ord a) => a -> p :t (==) -- 是否相等 (==) :: Eq a => a -> a -> Bool :t (++) -- 列表连接函数 (++) :: [a] -> [a] -> [a] -- 执行 sign 2 > 1 head [3,2,1] > 3 "abc" == "bbc" > False "hello " ++ "world" > "hello world"
List 和 List comprehension
-
列表常用的函数
null 列表是否为空
length 返回列表长度
head 返回列表第一个元素
tail 返回列表除第一个元素以后的所有元素
last 返回列表最后一个元素
init 返回列表除最后一个元素之前的所有元素
take n 返回列表前n个元素
drop n 丢弃列表前n个元素
maximum 返回最大的元素
minimum 返回最小的元素
sum 返回元素的和
elem 元素是否包含于列表 -
list range
方便的range,尾递归加上list range,你真的还需要命令式语言中的循环语句吗?[1..10] -- 1到10的列表 > [1,2,3,4,5,6,7,8,9,10] ['a'..'z'] -- a到z的字母字符串 > "abcdefghijklmnopqrstuvwxyz" take 10 [1,3..] -- 前10个奇数 > [1,3,5,7,9,11,13,15,17,19] take 10 (cycle[1,2,3]) -- 取前10的[1,2,3]序列 > [1,2,3,1,2,3,1,2,3,1] take 5 $ repeat 3 -- 取前5项的3序列 > [3,3,3,3,3] replicate 5 10 -- 相比 take repeat更方便的用法 > [10,10,10,10,10]
-
list comprehension
list comprehension 相当于map 和 filter的函数的增强版, | 之前等于map, | 之后等于filter, 尤其在多限制条件和同时实现map,filter功能时更加明显。是个非常强大和有用的特性,完全可以替代列表的 map 和 filter 函数。
list comprehension 其实是由 monad 或 applicative functor 生成的语法糖。[x*2 | x <- [1..10], x*2 >= 12] -- 取乘以 2 后大于等于 12 的元素, 等于map结合filter > [12,14,16,18,20] [if x `mod` 2 == 0 then "even" else "odd" | x <- [1..10]] -- 偶数转换为even,基数为odd, 等于map > ["odd","even","odd","even","odd","even","odd","even","odd","even"] [ x | x <- [10..20], x /= 13, x /= 15, x /= 19] -- 取除了13、15、19之外的元素,多个限制条件,等于filter > [10,11,12,14,16,17,18,20] [ x*y | x <- [2,5,10], y <- [8,10,11]] -- 求两个列表所有可能的组合 > [16,20,22,40,50,55,80,100,110] -- 嵌套的列表, 在不拆开它的前提下除去其中的所有奇数 let xxs = [[1,3,5,2,3,1,2,4,5],[1,2,3,4,5,6,7,8,9],[1,2,4,2,1,6,3,1,3,2,3,6]] [ [ x | x <- xs, even x ] | xs <- xxs] > [[2,2,4],[2,4,6,8],[2,4,2,6,2,6]] --取得所有三边长度皆为整数且小于等于 10,周长为 24 的直角三角形 [ (a,b,c) | c <- [1..10], b <- [1..c], a <- [1..b], a^2 + b^2 == c^2, a+b+c == 24] > [(6,8,10)]