(转载)Scala.Actor实践心得与设计思想
原文出自:http://www.cnblogs.com/shiyangxt/archive/2011/07/30/2121663.html
这段时间系统的学习了Scala,编程思想上可谓收获不少,想从里面挑些值得写的东西分享给大家,Scala的Actor
可谓这门语言的一个亮点,函数式编程核心价值在于多核编程,所以就打算说说这个Actor,总结一下学习心得。先很俗
套的简单谈谈概念,然后会拿四个例子做补充。主要内容包括基本原理,设计思想,单机环境并发测试。
Actor是一种基于事件的轻量级线程,在以前的并发模型中,我们需要关注共享的数据结构,而使用Actor则需要
关注操作数据的代码结构,因为减少了数据的共享。Actor的主要能力来源于消息传递,而不是采用阻塞调用的处理形式。
如果创建直接或间接扩展 Actor的类,要确保对对象的所有调用都通过消息传递进行。
我把Actor的设计思想归为两类,使用目的归为两类。从设计思想上来说Scala推荐的是以消息传递为核心的设计
思想,由于Scala可以无缝使用Java类库,所以也可以采用以共享数据为核心的设计,当然也可以写出混合式设计风格的
。使用目的主要有两种,一种是Scala提供API给Java调用,另一种就是Scala自给自足。举三个例子,例子很简单,是一
个累加器。
1、以消息传递为核心的设计:使用Actor的actor方法,使用不可变对象,不考虑数据共享问题,以消息传递为设计核心。
import actors._, Actor._ /* * Author:ShiYang * Blog:http://shiyangxt.cnblogs.com * */ object SendMessageStyle { def main(args: Array[String]): Unit = { val caller = self val accumulator = actor { var continue = true var sum = 0 loopWhile(continue) { reactWithin(500) { case number: Int => sum += number case TIMEOUT => continue = false caller ! sum } } } accumulator ! 1 accumulator ! 2 accumulator ! 3 receiveWithin(1000) { case result => println("Total is " + result) } } }
2、以共享数据为核心的设计:构建由Actor继承共享数据操作类,以共享数据为核心。
import actors._, Actor._ /* * Author:ShiYang * Blog:http://shiyangxt.cnblogs.com * */ object SharedDataStyle { case class Add(number: Int) case class GetResult(sender: Actor) class AddActor extends Actor { override def act(): Unit = process(0) def process(value: Int): Unit = { reactWithin(500) { case Add(number) => process(value + number) case GetResult(a) => a ! value; process(value) case _ => process(value) } } } def main(args: Array[String]): Unit = { val addActor = new AddActor addActor.start() addActor ! Add(1) addActor ! Add(2) addActor ! Add(3) addActor ! GetResult(self) receiveWithin(1000) { case result => println("Total is " + result) } } }
3、以API形式提供给Java程序使用:由于Java不能直接向Actor发消息,所以需要对Scala的!()方法进行封装。
import actors._, Actor._ /* * Author:ShiYang * Blog:http://shiyangxt.cnblogs.com * */ object ForJavaStyle { case class Add(number: Int) case class GetResult(sender: Actor) private class AddActor extends Actor { override def act(): Unit = process(0) def process(value: Int): Unit = { reactWithin(500) { case Add(number) => process(value + number) case GetResult(a) => a ! value; process(value) case _ => process(value) } } } private val addActor = new AddActor addActor.start() private def add(sender: Actor, num: Int): Unit = { sender ! Add(num) } private def getResult(sender: Actor): Int = { sender ! GetResult(self) receiveWithin(1000) { case result: Int => result } } def addForJava(num: Int): Unit = { add(addActor, num) } def getResultForJava(): Int = { getResult(addActor) } }
Java端调用代码:
/* * Author:ShiYang * Blog:http://shiyangxt.cnblogs.com * */ public class GetFromScala { public static void main(String[] args) { ForJavaStyle$.MODULE$.addForJava(1); ForJavaStyle$.MODULE$.addForJava(2); ForJavaStyle$.MODULE$.addForJava(3); System.out.println("Total is " + ForJavaStyle$.MODULE$.getResultForJava()); } }
通过上面的例子可见Scala对Java语言有非常大的补充,提高了生产力。为Java提供了轻松实现多核并行编程的能
力。为了进一步测试Actor的并发性能,于是做了一个简单的单机环境并发测试。
程序是构建一个Actor动态有序数组,并发创建N个Actor对象,为了证明这些对象全都可用,顺序从数组的第一个Actor发消息到最后一个Actor,只有当一个
Actor接收到前一个Actor发送的消息后,才向后一个Actor发送消息。当最后一个数组元素接收到消息后,再把消息从数组
尾部用同样处理过程逆序发送到数组头部。这个消息发送过程不是并发处理,是顺序处理。这里只是为了证明这些对象全都
可用。如果为了测试并发处理,可以修改程序,让每个数组元素给后一位数组元素发消息。这样就会看到输出混乱的发送信
息,因为并发是无序的。
测试环境:双核4G内存,Windows XP,Sun JVM1.6,单机环境,Scala版本2.9.0.1
测试结果:当使用Receive方法接收消息时,由于Receive会在结束任务前一直持有线程,而Scala在后台默认只给Receive
方法启动256个线程,我的程序又是顺序的发消息,而且不是临时接收器(只处理一次消息),所以Receive在这种情况下,
只有255个并发。React接收器由于不需要长期持有线程,空闲即释放线程。所以React在本程序中可以跑20w的并发,如果
简单优化一下JVM,就可以达到100w的并发量。默认React接收器后台会调用4个线程组成的线程池。如果修改程序让每个数
组元素给后一位数组元素并发的发消息,那么在不阻塞线程的情况下,Receive方法也可以达到和React一样的并发量。因为
这个测试程序是顺序发送消息,所以就没有设置超时,如果是并发环境,建议加上超时,避免线程阻塞。
下面是测试程序:
import actors._, Actor._, java.util._ /* * Author:ShiYang * Blog:http://shiyangxt.cnblogs.com * */ object ConcurrentTest { val actors = new ArrayList[Actor] val length = 1000000 var startTime = System.nanoTime def main(args: Array[String]): Unit = { for (i <- 0 to length) actors.add(actor { info("react: " + i + " actor created") reactMessage }) actors.get(0) ! (0, 0) } def info(msg: String) = println(msg + " received by " + Thread.currentThread) def receiveMessage { var continue = true while (continue) { receive { case (id: Int, direction: Int) => sendMessage(id: Int, direction: Int) case "finish" => continue = false val endTime = System.nanoTime println("Finish, spend time:" + (endTime - startTime) / 1000000000.0 + " secs") case _ => println("input error") } } } def reactMessage { var continue = true loopWhile(continue) { react { case (id: Int, direction: Int) => sendMessage(id: Int, direction: Int) case "finish" => continue = false val endTime = System.nanoTime println("Finish, spend time:" + (endTime - startTime) / 1000000000.0 + " secs") case _ => println("input error") } } } //direction=0->sendLatter;direction=1->sendFormer def sendMessage(id: Int, direction: Int) { if (direction == 0 && id != length) { info("Actor" + id + " send message to the Actor" + (id + 1)) actors.get(id + 1) ! (id + 1, 0) } else if (id != 0 && direction == 1) { info("Actor" + id + " send message to the Actor" + (id - 1)) actors.get(id - 1) ! (id - 1, 1) } else if (direction == 0 && id == length) { actors.get(length) ! (length, 1) } else if (id == 0 && direction == 1) { actors.get(0) ! "finish" } } }
前些天看到Scala正在努力支持.net平台,不过我觉得.net平台有F#,所以对于.net程序员来说Scala提供不了什么
附加价值。如果非要找出来这样做的优点的话,就是Scala可以同时支持两个主流平台,野心不小。如果看后有所收获,请
推荐让更多人看到,算我为Scala的推广尽了点绵薄之力。行文仓促,如果有不对的地方,欢迎指正。