Clojure学习03：数据结构（集合）

Clojure提供了几种强大的数据结构（集合）

一、集合种类

1、vector

相当于数组，如： [2 3 5] , ["ad" "adas" "adadsads"]

2、list

相当于链表，如： '(2 3 5) , '("ad" "adas" "adadsads")

与vector相比，[]变成了() ，又因为 ()符号是用于函数调用，为了区别，需要在（前面加上一个单引号'

3、map

语法格式如： {：a 1 :b 1}

map是1个或多个 key-value对，其中key标识符前面要求有:标识。map的key本身就是函数，通过它可以查找它所对应的值。

如：

user=> (def data {:a 1 :b 2} )

user=> (:a data)
1
user=> (:a {:a 1 :b 2} )
1
user=> (:a {:a 3 :b 2} )
3

上面第一个语句定义了一个值data，是个map。第二个语句是获取关键字:a的值，这里:a就是一个函数。
最后两个语句就是直接从map字面量上查询key对应的值。

4、set

语法格式如： #{值1 值2 ....}

user=> #{1 2 3}
#{1 3 2}

说明，相比java的集合，Clojure的集合对象有如下几个特征：

1） immutable 集合的内容在初始化后是不可修改的，后续对它的操作都会产生新的集合

2）heterogeneous 多相（异种的），集合中的元素不要求必须是同一种数据类型，可以是不同类型数据的集合

3）persistent 持久化的，集合的内容是不可修改的，相关的操作会产生新的集合，但并不是复制的方式，而是有点类似配置管理的机制，只是新增变更的部分，老的部分还是采用原来的数据。这样所有的历史数据都能完整的保留下来。

二、集合的三大操作

所有函数式编程语言，都对集合的操作提供了一些基础的高阶函数，最典型的是 filter ,map 和 reduce三个函数。

这个三个函数高度概括了对集合的操作。

下面我们分别介绍。

1、filter函数

filter函数是函数式编程中对集合操作的三大重要操作之一，几乎所有的支持函数式编程的语言都有类似的方法。

其作用是筛选出满足条件的元素组成一个新的集合返回。

filter函数需要两个参数，第一个是过滤函数，用于检查元素是否符合，第二个是集合本身。结果返回一个list。

如下面例子：

例1：

user=> (def stooges ["Moe" "Larry" "Curly" "Shemp"])
#'user/stooges
user=> (filter #(> (count %) 3) stooges)
("Larry" "Curly" "Shemp")

上面代码中的count函数是计算字符串的长度， #(> (count %) 3) 是个匿名函数，只有长度大于3的字符串才满足条件。

例2：

user=> (def years [1940 1944 1961 1985 1987])
#'user/years
user=> (filter #(even? %) years)
(1940 1944)

2、map

map函数是函数式编程中对集合操作的三大重要操作之一，几乎所有的支持函数式编程的语言都有类似的方法。

其作用是对集合中的每一个元素做处理，最后得到一个新的集合（注意集合类型是列表），新集合的元素个数和原集合一样，但内容可以不一样（包括元素的类型）。

所以map函数的第一个参数是对元素转换的处理函数，后面的参数是待处理的集合（一个或多个）。

下面我们举例来说明：

例1：

(defn fun [item] (* item 2)) //定义了一个函数，返回的值是对输入参数乘以2

(map fun [1 2 3]) //map函数使用了fun函数，最后map函数调用后的返回结果为 (2 4 6)

可以看出，被处理的集合是vector，但处理后返回的集合类型为list

例2：

user=> (map fun #{1 2 3}) (2 6 4)

可以看出，set被处理后返回的集合类型也是列表，而且因为set本身是无序的，返回的list结果序号与set表面上看的也不一致。

例3：

user=> (map + [2 4] [5 6] [1 2]) (8 12)

user=> (map + [2 4 7] [5 6] [1 2 3 4]) (8 12)

上面两个例子传入的第一个参数是函数是 + ，后面是多个集合。最后的结果是按照最小的集合元素算的。

例4：

user=> (map #(* % 2) [1 2 3]) (2 4 6)

上面代码中传给map的是一个匿名函数 #(* % 2) 。在实际的集合map操作中，大量场景下会传入匿名函数。

Clojure中的匿名函数就类似于 python、java8中的lambda表达式。

3、reduce

reduce函数是函数式编程中对集合操作的三大重要操作之一，几乎所有的支持函数式编程的语言都有类似的方法。

其作用是对集合做处理，得到一个计算后的值。如sum ,count, max, min 都是reduce操作的特例，只不过这些操作是非常常见和通用的，会被提为专门的方法。

如：

user=> (reduce #(+ %1 %2) [1 2 3])
6

上面操作是对集合求和。reduce的第一个参数是一个函数，这里是匿名函数，该匿名第一个参数(用1%代替)是每次迭代的返回值，%2是元素。

每次对元素操作，1%都会重新最后作为参数传入，最后一个元素处理完后%1的值会作为reduce的函数值返回。

user=> (reduce #(* %1 %2) [2 4 6])
48

上面操作是对集合中的元素求乘积。

user=> (reduce #(if (> %1 %2) %1 %2) [10 2 54 3 6])
54
user=> (reduce #(if (< %1 %2) %1 %2) [10 2 54 3 6])
2

上面的两个操作分别是取最大值和最小值。

三、集合的其它操作

下面介绍的集合的操作都是对上述三大操作的一些特例。

1、count函数

该函数用于获取集合中的元素个数

user=> (count [19 "yellow" true])
3
user=> (count '(19 "yellow" true))
3
user=> (count #{19 "yellow" true})
3
user=> (count {:a 1 :b 2})
2

从上面例子可以看出，count函数对这四种集合都是适合的。

2、reverse

该函数是对集合中的数据进行反转排列，返回一个新的集合。因为map和set本身是无序的数据结构，所以reverse函数也只对vector和list有意义。

user=> (reverse [2 4 7])
(7 4 2)
user=> (reverse '(2 4 7))
(7 4 2)

3、map

map函数的作用是对集合中的每一个元素做处理，最后得到一个新的集合（注意集合类型是列表），新集合的元素个数和原集合一样，但内容可以不一样（包括元素的类型）。

所以map函数的第一个参数是对元素转换的处理函数，后面的参数是待处理的集合（一个或多个）。

下面我们举例来说明：

例1：

(defn fun [item] (* item 2)) //定义了一个函数，返回的值是对输入参数乘以2

(map fun [1 2 3]) //map函数使用了fun函数，最后map函数调用后的返回结果为 (2 4 6)

可以看出，被处理的集合是vector，但处理后返回的集合类型为list

例2：

user=> (map fun #{1 2 3})
(2 6 4)

可以看出，set被处理后返回的集合类型也是列表，而且因为set本身是无序的，返回的list结果序号与set表面上看的也不一致。

例3：

user=> (map + [2 4] [5 6] [1 2])
(8 12)

user=> (map + [2 4 7] [5 6] [1 2 3 4])
(8 12)

上面两个例子传入的第一个参数是函数是 + ，后面是多个集合。最后的结果是按照最小的集合元素算的。

例4：

user=> (map #(* % 2) [1 2 3])
(2 4 6)

上面代码中传给map的是一个匿名函数 #(* % 2) 。在实际的集合map操作中，大量场景下会传入匿名函数。

Clojure中的匿名函数就类似于 python、java8中的lambda表达式。

4、apply

该函数的作用是给它传入一个函数和集合，该函数对整个集合进行操作后返回的结果就是apply函数的返回结果。

user=> (apply + [2 4 6])
12
user=> (apply * [2 4 6])
48
user=> (apply - [2 4 6])
-8

5、从集合中获取单个元素

user=> (def stooges ["Moe" "Larry" "Curly" "Shemp"])
#'user/stooges
user=> (first stooges)
"Moe"
user=> (second stooges)
"Larry"
user=> (last stooges)
"Shemp"
user=> (nth stooges 2)
"Curly"

最后一个方法nth的第2个参数表示获取第几个元素（从0开始，这里2代表第3个元素）。

6、从集合中获取多个元素

user=> (def stooges ["Moe" "Larry" "Curly" "Shemp"])
#'user/stooges

user=> (next stooges)
("Larry" "Curly" "Shemp")

user=> (nthnext stooges 1)
("Larry" "Curly" "Shemp")

user=> (nthnext stooges 2)
("Curly" "Shemp")
user=> (butlast stooges)
("Moe" "Larry" "Curly")

user=> (drop-last 1 stooges)
("Moe" "Larry" "Curly")
user=> (drop-last 2 stooges)
("Moe" "Larry")

7、some

该函数可以用来判断集合中是否包含某个元素，需要一个用来判断的函数作为参数，另一个参数是集合本身。如：

user=> (def stooges ["Moe" "Larry" "Curly" "Shemp"])
#'user/stooges
user=> (some #(= % "Moe") stooges)
true
user=> (some #(= % "Mark") stooges)
nil

可以看出，如果存在则返回true，否则返回nil（为何不返回false呢？）。

上面的写法会看起来比较笨拙，可以用如下的方法达到同样目的：

user=> (contains? (set stooges) "Moe")
true
user=> (contains? (set stooges) "Mark")
false

上面操作，利用set方法将vector转换为set集合，然后利用contains?函数进行判断，看上去会更清晰简单些。

另外一个区别是，当元素不存在时返回的不是nil，而是false

posted @ 2016-04-29 00:16 51kata 阅读(1246) 评论(0) 收藏举报

刷新页面返回顶部

Clojure学习03：数据结构（集合）

公告