[案例ANR]媒体播放器操作线程与资源释放问题

打开log文件, 由于是ANR错误,因此搜索"ANR",为何要加空格呢,你加上和去掉比较一下就知道了 。可以屏蔽掉不少保存到anr.log文件的无效信息。

定位到关键的事件信息如下:
01-1516:49:02.433 E/ActivityManager( 2466): ANR in com.android.mms(com.android.mms/.ui.SlideshowActivity)
01-1516:49:02.433 E/ActivityManager( 2466): Reason:keyDispatchingTimedOut
01-1516:49:02.433 E/ActivityManager( 2466): Load: 0.6 / 0.61 / 0.42
01-1516:49:02.433 E/ActivityManager( 2466): CPU usage from 1337225ms to57ms ago:
01-1516:49:02.433 E/ActivityManager( 2466):   sensorserver_ya:8% = 0% user + 8% kernel / faults: 40 minor
......

01-1516:49:02.433 E/ActivityManager( 2466):  -com.android.mms:0% = 0% user + 0% kernel
01-1516:49:02.433 E/ActivityManager( 2466):  -flush-179:8: 0% =0% user + 0% kernel
01-1516:49:02.433 E/ActivityManager( 2466): TOTAL: 25% = 10% user + 14%kernel + 0% iowait + 0% irq + 0% softirq
01-1516:49:02.436 I/        ( 2466):dumpmesg >"/data/log/dumpstate_app_anr.log"

我们用自然语言来描述一下日志,这也算是一种能力吧。
01-1516:49:02.433 E/ActivityManager( 2466): ANR in com.android.mms(com.android.mms/.ui.SlideshowActivity)
翻译:在16:49分2秒433毫秒的时候ActivityManager(进程号为2466)发生了如下错误:com.android.mms包下面的.ui.SlideshowActivity无响应。

01-1516:49:02.433 E/ActivityManager( 2466): Reason:keyDispatchingTimedOut
翻译:原因,keyDispatchingTimeOut-按键分配超时

01-1516:49:02.433 E/ActivityManager( 2466): Load: 0.6 / 0.61 /0.42
翻译:5分钟,10分钟,15分钟内的平均负载分别为:0.6, 0.61 ,0.42

在这里我们大概知道问题是什么了,结合我们之前的操作流程,我们知道问题是在点击按钮某时候可能处理不过来按钮事件,导致超时无响应。那么现在似乎已经可以进行工作了 。我们知道Activity中是通过重载dispatchTouchEvent(MotionEventev)来处理点击屏幕事件  。然后我们可以顺藤摸瓜,一点点分析去查找原因 。但这样够了么 ?
其实不够, 至少我们不能准确的知道到底问题在哪儿 , 只是猜测,比如这个应用程序中,我就在顺藤摸瓜的时候发现了多个IO操作的地方都在主线程中,可能引起问题,但不好判断到底是哪个  ,所以我们目前掌握的信息还不够。

于是我们再分析虚拟机信息, 搜索“DalvikThread”关键词,快速定位到本应用程序的虚拟机信息日志,如下:
-----pid 2922 at 2011-01-13 13:51:07 -----
Cmdline: com.android.mms

DALVIKTHREADS:
"main"prio=5 tid=1 NATIVE
|group="main" sCount=1 dsCount=0 s=N obj=0x4001d8d0self=0xccc8
|sysTid=2922 nice=0 sched=0/0 cgrp=default handle=-1345017808
|schedstat=( 3497492306 15312897923 10358 )
atandroid.media.MediaPlayer._release(Native Method)
atandroid.media.MediaPlayer.release(MediaPlayer.java:1206)
atandroid.widget.VideoView.stopPlayback(VideoView.java:196)
atcom.android.mms.ui.SlideView.stopVideo(SlideView.java:640)
atcom.android.mms.ui.SlideshowPresenter.presentVideo(SlideshowPresenter.java:443)
atcom.android.mms.ui.SlideshowPresenter.presentRegionMedia(SlideshowPresenter.java:219)
atcom.android.mms.ui.SlideshowPresenter$4.run(SlideshowPresenter.java:516)
atandroid.os.Handler.handleCallback(Handler.java:587)
atandroid.os.Handler.dispatchMessage(Handler.java:92)
atandroid.os.Looper.loop(Looper.java:123)
atandroid.app.ActivityThread.main(ActivityThread.java:4627)
atjava.lang.reflect.Method.invokeNative(Native Method)
atjava.lang.reflect.Method.invoke(Method.java:521)
atcom.android.internal.os.ZygoteInit$MethodAndArgsCaller.run(ZygoteInit.java:858)
atcom.android.internal.os.ZygoteInit.main(ZygoteInit.java:616)
atdalvik.system.NativeStart.main(Native Method)

"BinderThread #3" prio=5 tid=11 NATIVE
|group="main" sCount=1 dsCount=0 s=N obj=0x4837f808self=0x242280
|sysTid=3239 nice=0 sched=0/0 cgrp=default handle=2341032
|schedstat=( 32410506 932842514 164 )
atdalvik.system.NativeStart.run(Native Method)

"AsyncQueryWorker"prio=5 tid=9 WAIT
|group="main" sCount=1 dsCount=0 s=N obj=0x482f4b80self=0x253e10
|sysTid=3236 nice=0 sched=0/0 cgrp=default handle=2432120
|schedstat=( 3225061 26561350 27 )
atjava.lang.Object.wait(Native Method)
-waiting on <0x482f4da8> (a android.os.MessageQueue)
atjava.lang.Object.wait(Object.java:288)
atandroid.os.MessageQueue.next(MessageQueue.java:146)
atandroid.os.Looper.loop(Looper.java:110)
atandroid.os.HandlerThread.run(HandlerThread.java:60)

"Thread-9"prio=5 tid=8 WAIT
|group="main" sCount=1 dsCount=0 s=N obj=0x4836e2b0self=0x25af70
|sysTid=2929 nice=0 sched=0/0 cgrp=default handle=2370896
|schedstat=( 130248 4389035 2 )
atjava.lang.Object.wait(Native Method)
-waiting on <0x4836e240> (a java.util.ArrayList)
atjava.lang.Object.wait(Object.java:288)
atcom.android.mms.data.Contact$ContactsCache$TaskStack$1.run(Contact.java:488)
atjava.lang.Thread.run(Thread.java:1096)

"BinderThread #2" prio=5 tid=7 NATIVE
|group="main" sCount=1 dsCount=0 s=N obj=0x482f8ca0self=0x130fd0
|sysTid=2928 nice=0 sched=0/0 cgrp=default handle=1215968
|schedstat=( 40610049 1837703846 195 )
atdalvik.system.NativeStart.run(Native Method)

"BinderThread #1" prio=5 tid=6 NATIVE
|group="main" sCount=1 dsCount=0 s=N obj=0x482f4a78self=0x128a50
|sysTid=2927 nice=0 sched=0/0 cgrp=default handle=1201352
|schedstat=( 40928066 928867585 190 )
atdalvik.system.NativeStart.run(Native Method)

"Compiler"daemon prio=5 tid=5 VMWAIT
|group="system" sCount=1 dsCount=0 s=N obj=0x482f1348self=0x118960
|sysTid=2926 nice=0 sched=0/0 cgrp=default handle=1149216
|schedstat=( 753021350 3774113668 6686 )
atdalvik.system.NativeStart.run(Native Method)

"JDWP"daemon prio=5 tid=4 VMWAIT
|group="system" sCount=1 dsCount=0 s=N obj=0x482f12a0self=0x132940
|sysTid=2925 nice=0 sched=0/0 cgrp=default handle=1255680
|schedstat=( 2827103 29553323 19 )
atdalvik.system.NativeStart.run(Native Method)

"SignalCatcher" daemon prio=5 tid=3 RUNNABLE
|group="system" sCount=0 dsCount=0 s=N obj=0x482f11e8self=0x135988
|sysTid=2924 nice=0 sched=0/0 cgrp=default handle=1173688
|schedstat=( 11793815 12456169 7 )
atdalvik.system.NativeStart.run(Native Method)

"HeapWorker"daemon prio=5 tid=2 VMWAIT
|group="system" sCount=1 dsCount=0 s=N obj=0x45496028self=0x135848
|sysTid=2923 nice=0 sched=0/0 cgrp=default handle=1222608
|schedstat=( 79049792 1520840200 95 )
atdalvik.system.NativeStart.run(Native Method)

-----end 2922 -----

每一段都是一个线程,当然我们还是看线程号为1的主线程了。通过分析发现关键问题是这样:
atcom.android.mms.ui.SlideshowPresenter$3.run(SlideshowPresenter.java:531)
定位到代码:
mHandler.post(newRunnable() {
public void run() {
try {
presentRegionMedia(view,(RegionMediaModel) model, dataChanged);
} catch (OMADRMException e) {
Log.e(TAG, e.getMessage(), e);
Toast.makeText(mContext,
mContext.getString(R.string.insufficient_drm_rights),
Toast.LENGTH_SHORT).show();
} catch (IOException e){
Log.e(TAG, e.getMessage(), e);
Toast.makeText(mContext,
mContext.getString(R.string.insufficient_drm_rights),
Toast.LENGTH_SHORT).show();

}
}

很清楚了,Handler.post方法之后执行时间太长的问题。 继续看presentRegionMedia(view,(RegionMediaModel) model, dataChanged);方法, 发现最终是调用的framework中MediaPlayer.stop方法。
至此,我们的日志分析算是告一段落。 可以开始思考解决办法了。

三,如何通过Handler或者多线程来解决某操作执行时间过程的问题。结合上面的分析,我们知道问题似乎是线程队列中某个操作presentRegionMedia(view,(RegionMediaModel) model, dataChanged);执行时间太长所导致的界面无响应。 因此比较典型的做法当然是控制线程队列 。在这里我们不得不提一下Handler  .

HandlerAndroid中是什么样的作用和地位呢?

  1. 线程之间消息传递 ,通过sendMessage方法 。我们通常用来后台子线程向主线程传递消息,主线程接到通知之后做更新界面等操作。
  2. 通过管理消息队列(MessageQueue)来安排计划任务。 这个常常会被人忽略,很多书上也没有提到这个作用。

Handler这个单词中文意思是管理者,处理者的意思。 通过这个意思顾名思义,我们知道这个对象就是个操作对象。那么要操作谁呢?

当然是消息队列(MessageQueue)。Android消息队列类似于Win32队列设计。 都是采用线性结构,先进先出 。其实在智能手机平台很久以前就用这种消息结构了 。比如Palm ,只不过Palm是整个进程共享一个消息队列,而Android是线程为单位的队列罢了。

那么是否每个线程或者子线程都有消息队列呢?

很遗憾,不是的,也没有必要。 在Android中,只有使用了Looper的线程才有消息队列。 当然如果你要简单建立一个有消息队列的线程也很方便,直接使用HandlerThread即可,这个类继承于Thread类。怎么用我就不多说了吧 。你懂的 !

Handler有两种方式来操作消息队列。

一种是通过sendMessage(Message)方法,发送消息体

另一种是通过post(Runnable)方法 , 发送Runnable对象 。

注意:这点请注意,虽然发送方法含参不同 , 但他们使用的是同一个消息队列。 我记得Mars的视频教程上说有两个队列,一个是消息队列,一个是线程队列。 这种说法是错误的 。事实上只有一个消息队列,没有所谓的线程队列。 当然了 ,post(Runnable)也没有启动新的线程,仍然是在当前线程。

注意:还有一种说法,说Handler对象在主线程,这种说法也是错误的, 准确的说是在产生他的线程中 。 虽然常常我们是在主线程产生他的。

那么我们要在Android建立多线程程序该如何做呢?很简单,就是Java的多线程方式。要么实现Runnable接口,要么继承Thread类。

关于线程同步,线程锁定,线程异步,线程池 这些概念也是一样的 。 我就不累述了。

 

好了,经过一点儿简单的介绍,我们有了一些Handler的基础,现在开始回到我们的问题开始来分析:

mHandler.post(newRunnable() {
public void run() {
try {
presentRegionMedia(view,(RegionMediaModel) model, dataChanged);
} catch (OMADRMException e) {
Log.e(TAG, e.getMessage(), e);
Toast.makeText(mContext,
mContext.getString(R.string.insufficient_drm_rights),
Toast.LENGTH_SHORT).show();
} catch (IOException e){
Log.e(TAG, e.getMessage(), e);
Toast.makeText(mContext,
mContext.getString(R.string.insufficient_drm_rights),
Toast.LENGTH_SHORT).show();

}
}

从上面这段代码中,我们可以看出,在做播放器控制按钮(比如播放,暂停,停止)等操作的时候, 是通过Handler.post(Runnable)来放到消息队列中, 排序来处理 。 那么之所以这里出现了无响应,很有可能是因为某一项控制操作太耗时或者耗资源。 这时候又接收到新的要处理的消息,就会处理不过来了。 因此我试图让队列中同时只有一个控制播放器按钮的任务在。 我对代码做了如下改动:

Runnabler = new Runnable(){
public void run() {
try {
presentRegionMedia(view,(RegionMediaModel) model, dataChanged);
} catch (OMADRMException e) {
Log.e(TAG, e.getMessage(), e);
Toast.makeText(mContext,
mContext.getString(R.string.insufficient_drm_rights),
Toast.LENGTH_SHORT).show();
} catch (IOException e){
Log.e(TAG, e.getMessage(), e);
Toast.makeText(mContext,
mContext.getString(R.string.insufficient_drm_rights),
Toast.LENGTH_SHORT).show();

}
}

mHandler.removeCallbacks(r);

mHandler.post(r);

代码慢慢看,思路很简单:其实就是在postRunnable之前先清除队列中已存的相同Runnable实例。 这样可以保证同时队列中只有一个操作在处理 。

 

很遗憾,不生效。:(,改动之后,问题依然存在,欲哭无泪 。

 

再来,我将整个模式改为message再试试,核心代码如下 :

if(mHandler.hasMessages(MEDIA_PLAY_WHAT_MESSAGEFLAG))

{

return ;

}

Messagemsg = mHandler.obtainMessage() ;

msg.what= this.MEDIA_PLAY_WHAT_MESSAGEFLAG ;

msg.obj= mMeidaPlayMessageObj ;

mHandler.sendMessageDelayed(msg,1000) ;

 

代码慢慢看,思路也很简单,通过发消息的方式, 先检测如果有相关消息队列,就直接跳出函数,不做任何处理,否则延迟一秒后再向队列发送一条消息 。

 

为何我用了1秒这个这么长的时间呢,因为这么长时间如果都处理不了,那就不是压力测试的问题了,而是方法本身的问题了,这也是通过排除法来试图排除是因为点击屏幕过快产生的问题。

编译,再试 ,很不辛,又不生效,不幸被我猜中了 。 仰望苍天 !

 

现在问题很明显了:不是压力测试时候点击过快导致的ANR,而是某些方法本身有问题。

通过之前我们的日志

-----pid 2922 at 2011-01-13 13:51:07 -----
Cmdline: com.android.mms

DALVIKTHREADS:
"main"prio=5 tid=1 NATIVE
|group="main" sCount=1 dsCount=0 s=N obj=0x4001d8d0self=0xccc8
|sysTid=2922 nice=0 sched=0/0 cgrp=default handle=-1345017808
|schedstat=( 3497492306 15312897923 10358 )
atandroid.media.MediaPlayer._release(Native Method)
atandroid.media.MediaPlayer.release(MediaPlayer.java:1206)
atandroid.widget.VideoView.stopPlayback(VideoView.java:196)
atcom.android.mms.ui.SlideView.stopVideo(SlideView.java:640)

很容易就知道了问题出在每次执行完了MediaPlayer.stop()方法调用之后会调用release()来释放播放器资源。 而这个方法中又死在了_release()方法上。 这是一个Native方法。

因此,真相大白 ,问题是在Framework层的MediaPlayer调用的Native方法_release()上。

posted @ 2014-06-06 08:35  It's_Lee  阅读(657)  评论(0编辑  收藏  举报