Unity性能优化-DrawCall
1. DrawCall是啥?其实就是对底层图形程序(比如:OpenGL ES)接口的调用,以在屏幕上画出东西。所以,是谁去调用这些接口呢?CPU。比如有上千个物体,每一个的渲染都需要去调用一次底层接口,而每一次的调用CPU都需要做很多工作,那么CPU必然不堪重负。但是对于GPU来说,图形处理的工作量是一样的。所以对DrawCall的优化,主要就是为了尽量解放CPU在调用图形接口上的开销。所以针对drawcall我们主要的思路就是每个物体尽量减少渲染次数,多个物体最好一起渲染。
2. 优化方式
(1)Draw Call Batching
采用批处理方式,Unity在运行时可以将一些物体进行合并,从而用一个描绘调用来渲染他们。
- 静态批处理:物体不移动,并且拥有相同的材质,静态批处理就允许引擎对任意大小的几何物体进行批处理操作来降低描绘调用。例如:在一个3D场景中,有Cube、Capsule、Cylinder、Sphere这个4个GameObject,注意之间不要有遮挡,另外还有Camera和Direction Light,它的处理前后的统计数据如下:
- 动态批处理
在这里使用时,遇到了坑,很多资料都没有提及到,在默认情况下,Unity是没有打开的,需要在Player Settings中进行设置的:
用了一个不错的例子来看,
for(int i = 0; i < 500; i++) { GameObject cube; cube = GameObject.Instantiate(prefab) as GameObject; }
动态批处理的结果是非常明显的(塔防游戏中估计能提高不少效率)
DrawCall的动态批处理存在着很多约束,所以默认是关闭的
a. 需要在每个顶点上进行一定的开销,所以动态批处理仅支持小于900顶点的网格物体;
b.着色器使用顶点位置,法线和UV值三种属性,那么你只能批处理300顶点以下的物体;如果你的着色器需要使用顶点位置,法线,UV0,UV1和切向量,那你只能批处理180顶点以下的物体(这个地方不懂);
c.不要使用缩放。分别拥有缩放大小(1,1,1) 和(2,2,2)的两个物体将不会进行批处理
d.统一缩放的物体不会与非统一缩放的物体进行批处理
e.用缩放尺度(1,1,1) 和 (1,2,1)的两个物体将不会进行批处理,但是使用缩放尺度(1,2,1) 和(1,3,1)的两个物体将可以进行批处理
f.使用不同材质的实例化物体(instance)将会导致批处理失败;
g.拥有lightmap的物体含有额外(隐藏)的材质属性,比如:lightmap的偏移和缩放系数等。所以,拥有lightmap的物体将不会进行批处理(除非他们指向lightmap的同一部分)。(什么是lightmap)
h.多通道的shader会妨碍批处理操作。比如,几乎unity中所有的着色器在前向渲染中都支持多个光源,并为它们有效地开辟多个通道。
i. 预设体的实例会自动地使用相同的网格模型和材质。
3. 打包图集
每个材质/纹理的渲染一定是会产生DrawCall的,这个DrawCall只能通过打包图集来进行优化,例如在2D游戏中使用了2张图片,它的数据为:
在Unity中,Window->2D->Sprite Packer,先转到Editor Settins中进行设置:
这次的结果,明显减少了一次Draw Batch: