CPU 和GPUskinning对比

CPU：

比如广泛的设备兼容性，比如上面说的精确逻辑处理，比如可以根据距离对Skinning进行LOD（如近距离角色每秒30帧Skinning，远距离角色每秒15帧Skinning），比如多Pass渲染时只需要一次Skinning（还要考虑阴影渲染的pass），等等

对于多Pass的shader，也省去了每一个pass都要做一次蒙皮的冗余操作。比如，做ShadowMap的时候，渲染深度时，算好的蒙皮结果可以直接用于后续的着色处理，而不需要再蒙皮一次。

GPU:

一些GPU的常量寄存器数量也不足（如都D3D9设备和GLES 2.0设备），实现GPU Skinning的时候需要额外的处理。

1.烘焙的贴图过大，因为为了存储浮点数，必须使用rgbahalf的格式，这个格式每个像素有64个字节，是真彩色的两倍。假设一个小兵有1000个顶点，那么1s的动作就需要1000*64,也就是64000个字节，而正常情况下，我们小兵在2000个顶点左右，动画在5s以上，那么每个动画贴图大概就在2M以上，甚至有可能是4M。而我们有60多个兵种，这样一算竟然有240M。虽然小米超神使用了RGMB来减少每个像素的大小，但那也高达120M的动画贴图了。而我们知道，原始的骨骼动画数据其实只有几百k左右。

2.无法计算光照，因为法线始终保持T-pos形态，在shader里面改变顶点位置的时候，无法重新计算法线。为了能够使用正常的光照计算，必须将法线也一起烘焙。幸运的是法线都是单位向量，可以采用rgba存储，但也需要大概1M左右的空间。

3.没有动画之间的blend，为了实现blend，必须对两个动作的贴图进行采样，然后lerp。这样会导致shader里放两张4M的贴图，对手游来说还是不小的开销。

ref:

https://www.zhihu.com/question/67301295/answer/251770734

https://gameinstitute.qq.com/community/detail/127819

posted @ 2021-04-03 10:46 钢与铁阅读(576) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 全程不用写代码，我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了，比商业数据库还牛
· .NET10 - 预览版1新功能体验（一）

勇—钢与铁

CSDN： https://blog.csdn.net/qq_14914623

CPU 和GPUskinning对比

我的标签

随笔分类

随笔档案