Scala学习(三)----数组相关操作

数组相关操作

摘要:

本篇主要学习如何在Scala中操作数组。Java和C++程序员通常会选用数组或近似的结构(比如数组列表或向量)来收集一组元素。在Scala中,我们的选择更多,不过现在我们先假定不关心其他选择,而只是想马上开始用数组。本篇的要点包括:

1. 若长度固定则使用Array,若长度可能有变化则使用ArrayBuffer

2. 提供初始值时不要使用new

3. 用()来访问元素

4. 用for (elem<-arr)来遍历元素

5. 用for (elem<-arr if…)…yield…来将原数组转型为新数组

6. Scala数组和java数组可以互操作;用AnayBuffer,使用scalacollection.JavaConversions中的转换函数

定长数组

如果你需要一个长度不变的数组,可以用Scala中的Array。例如:

val nums=new Array[Int] (10) //长度为10的整数数组,所有元素初始化为0

val a=new Array [String] (10) //长度为10的字符串数组,所有元素初始化为null

val s= Array("Hello", "World") //长度为2的Array[String]类型是推断出来的,已提供初始值就不需要new

S (0) ="Goodbye" //Array("Goodby ","World"),使用()而不是[]来访问元素

在JVM中,Scala的Array以Java数组方式实现。示例中的数组在JVM中的类型为java.lang.String[]。Int、Double或其他与Java中基本类型对应的数组都是基本类型数组。

举例来说,Array(2,3,5,7,11)在JVM中就是一个int[]。

变长数组:缓冲

尾端操作缓冲数组

对于那种长度按需要变化的数组,Java有ArrayList,C++有vector。Scala中的等效数据结构为ArrayBuffer

import scala.collection.mutable.ArrayBuffer

val b=ArrayBuffer[lnt]() // 或者new ArrayBuffer [int],一个空的数组缓冲,准备存放整数

b+=1 // ArrayBuffer (1),用+=在尾端添加元素

b+=(1,2,3,5) // ArrayBuffer(1,1,2,3,5),在尾端添加多个元素,以括号包起来

b++= Array(8, 13, 21) // ArrayBuffer(1, 1, 2, 3, 5, 8,13, 21) //用++=操作符追加任何集合

b.trimEnd(5) // ArrayBuffer(1, 1, 2),移除最后5个元素

在数组缓冲的尾端添加或移除元素是一个高效的操作

任意位置操作缓冲数组

你也可以在任意位置插入或移除元素,但这样的操作并不那么高效。所有在那个位置之后的元素,都必须被平移。举例如下:

b.insert (2,6) //ArrayBuffer(1, 1, 6, 2),在下标2之前插入

b.insert (2,7,8,9) // ArrayBuffer(1, 1,7,8,9, 6,2),你可以插入任意多的元素

b.remove(2) // ArrayBuffer(1,1,8,9,6,2)

b.remove (2,3) //ArrayBuffer(1,1, 2),第2个参数的含义是要移除多少个元素

有时你需要构建一个Array,但不知道最终需要装多少元素。在这种情况下,先构建一个数组缓冲,然后调用:

b.toArray //Array(1, 1,2)

反过来,调用乱toBuffer可以将一个数组a转换成一个数组缓冲

遍历数组和数组缓冲

全遍历

在Java和C++中,数组和数组列表/向量有一些语法上不同,Scala则更加统一。大多数时候,你可以用相同的代码处理这两种数据结构。以下是for循环遍历数组或数组缓冲的语法:

for (i <- 0 until a.length) //变量i的取值从0到a length -1

println(i+":"+a(i))

utiI是Richlnt类的方法,返回所有小于但不包括上限的数字。例如:

0 until 10 // Range(0,1,2,3,4,5,6,7,8, 9)

需要注意的是,0 until 10实际上是一个方法调用:0.until(10)

条件遍历

如下结构:

for(I <- 区间)

会让变量i遍历该区间的所有值。拿本例来说,循环变量i先后取值0、1,等等,直到但不包含a.length。如果想要每两个元素一跳,可以让i这样来进行遍历:

0 until (a.length,2) //Range(0,2,4,…)

如果要从数组的尾端开始,遍历的写法为:

(0 until a.length) .reverse //Range(...,2,1,0)

如果在循环体中不需要用到数组下标,我们也可以直接访问数组元素,就像这样:

for (elem <- a)

println (elem)

这和Java中的"增强版"for循环,或者C++中的"基于区间的"for循环很相似。变量elem先后被设为a(0),然后a(1),依此类推

数组转换

for中的推导式和守卫

在前面,你看到了如何像Java或C++那样操作数组。不过在Scala中,你可以走得更远。从一个数组或数组缓冲出发,以某种方式对它进行转换是很简单的。这些转换动作不会修改原始数组,而是产生一个全新的数组。像这样使用for推导式

val a=Array(2, 3, 5, 7, 11)

val result=for (elem <- a) yield 2*elem //result是Array(4,6,10, 14, 22)

for(…)yield循环创建了一个类型与原始集合相同的新集合。如果你从数组出发,那么你得到的是另一个数组。如果你从数组缓冲出发,那么你在for(…)yield之后得到的也

是数组缓冲

结果包含yield之后的表达式的值,每次迭代对应一个。通常,当你遍历一个集合时,你只想处理那些满足特定条件的元素。这个需求可以通过守卫:for中的if来实现。在这里我们对每个偶数元素翻倍,并丢掉奇数元素:

for (elem <- a if elem%==0) yield 2*elem

请留意结果是个新的集合,原始集合并没有受到影响

一种等价方法

除上述之外,还有另一种做法是

a.filter (_%2==0).map(2*_)

甚至

a.filter { _%2 == 0 } map {2*_ }

某些有着函数式编程经验的程序员倾向于使用filter和map而不是守卫和yield,这不过是一种风格罢了与for循环所做的事完全相同。你可以根据喜好任意选择。

高效数组操作

考虑如下示例:给定一个整数的数组缓冲,我们想要移除除第一个负数之外的所有负数。传统的依次执行的解决方案会在遇到第一个负数时置一个标记,然后移除后续出现的负数元素

var first=true

var n=a.length

var i=0

while ( i<n ) {

if (a(i) >= 0)

i+=1

else{

if (first) {

first=false

i+=1

} else {

a.remove (i)

n-=1

}

}

}

但这个方案其实并不那么好:从数组缓冲中移除元素并不高效,把非负数值拷贝到前端要好得多。

首先收集需要保留的下标:

var first= true

val indexes=for (i <- 0 until a.length if first || a(i)>=0) yield {

if (a(i)<0)

first=false;

i

}

然后将元素移动到该去的位置,并截断尾端:

for(j <- 0 until indexes.length)

a(j)= a(indexes(j))

a.trimEnd (a.length -indexes.length)

这里的关键点是,拿到所有下标好过逐个处理

常用算法

求和与排序

有一种说法,很大比例的业务运算不过是在求和与排序。还好Scala有内建的函数来处理这些任务

Array(1,7,2, 9).sum // 19,对ArrayBuffer同样适用

要使用sum方法,元素类型必须是数值类型:要么是整型,要么是浮点数或者Biglnteger/BigDecimal。

同理,min和max输出数组或数组缓冲中最小和最大的元素。

ArraryBuffer("Mary", "had","a","little", "lamb").max // "little"

sorted方法将数组或数组缓冲排序并返回经过排序的数组或数组缓冲,这个过程并不会修改原始版本:

val b=ArrayBuffer(1,7,2, 9)

val bSorted=b.sorted(_ < _) // b没有被改变,bSorted是ArrayBuffer(1,2,7,9)

还可以提供一个比较函数,不过你需要用sortWith方法:

val bDescending=b.sorted(_ > _) // ArrayBuffer(9,7,2, 1)

可以直接对一个数组排序,但不能对数组缓冲排序:

val a=Array(1,7,2,9)

scala.util. Sorting.quickSortIa(a) // a现在是Array(1,2,7,9)

关于num、max和quickSort方法,元素类型必须支持比较操作,这包括了数字、字符串以及其他带有Ordered特质的类型。

显示数组内容

最后,如果你想要显示数组或数组缓冲的内容,可以用mkString方法,它允许你指定元素之间的分隔符。该方法的另一个重载版本可以让你指定前缀和后缀。例如:

a.mkString("and") // "1 and 2 and 7 and 9"

a.mkString("<" , "," , ">") // "<1,2,7,9>"

和toString相比:

a.toString // " [I@85b8d",这里被调用的是Java的毫无意义的toString方法

b.toString // "ArrayBuffer(l,7,2, 9)",toString方法报告了类型,便于调试

解读Scaladoc

数组和数组缓冲有许多有用的方法,我们可以通过浏览Scala文档来获取这些信息。对Array类的操作方法列在ArrayOps相关条目下。从技术上讲,在数组上应用这些操作之前,数组都会被转换成ArrayOps对象。

由于Scala的类型系统比java更丰富,在浏览Scala的文档时,你可能会遇到一些看上去很奇怪的语法。所幸,你并不需要理解类型系统的所有细节就可以完成很多有用

的工作。你可以把下表用做"解码指环"。

多维数组

和Java一样,多维数组是通过数组的数组来实现的。举例来说,Double的二维数组类型为:

Array[Array[Double]]

要构造这样一个数组,可以用ofDim方法:

val matrix=Array.ofDim[Double](3,4) //三行,四列要访问其中的元素,使用两对圆括号:

matrix (row) (column) =42

你可以创建不规则的数组,每一行的长度各不相同:

val triangle=new ArraylArray [Int] (10)

for (i <- 0 until triangle.length)

triangle(i)=new Array[lnt] (i+1)

与Java互操作

由于Scala数组是用java数组实现的,你可以在Java和Scala之间来回传递。如果你调用接受或返回java.utiI.List的Java方法,则当然可以在Scala代码中使用Java的ArrayList但那样做没什么意思。你完全可以引入scala.collection.JavaConversions里的隐式转换方法。这样你就可以在代码中使用Scala缓冲,在调用Java方法时,这些对象会被自动包装成Java列表。

举例来说,java.lang.ProcessBuilder类有一个以List<String>为参数的构造器。以下是在Scala中调用它的写法:

import scala.collection.JavaConversions.bufferAsJavaList

import scala.collection.mutable.ArrayBuffer

val command = ArrayBuffer("ls", "-al", "/home/cay")

val pb = new ProcessBuilder(command) // Scala到Java的转换

Scala缓冲被包装成了一个实现了java.util.List接口的Java类的对象。反过来讲,当Java方法返回java.util.List时,我们可以让它自动转换成一个Buffer:

import scala.collection.JavaConversions.asScalaBuffer

import scala.collection.mutable.Buffer

val cmd: Buffer[String] = pb.command() // Java到Scala的转换

需要注意的是,不能使用ArrayBuffer——包装起来的对象仅能保证是个Buffer。如果Java方法返回一个包装过的Scala缓冲,那么隐式转换会将原始的对象解包出来。拿本例来说,cmd == command。☆☆

posted @ 2018-03-05 11:30  初见微凉i  阅读(238)  评论(0编辑  收藏  举报