CG: 用Rust实现一个3D渲染器 - 浅谈MSAA抗锯齿

摘要

写作动机:毕业设计是从头写一个3D渲染器,编程语言为Rust。鉴于有幸听过GAMES101相关课程,遂想为毕设加入4xMSAA抗锯齿算法。但踩了几个大坑,差点自闭,解决后趁思路还算清晰,分享一下遇到的难点和对应方案。

这三篇博文给了我较大启发:

  1. 博文一

  2. 博文二

  3. 博文三

另外,本文并不会教你MSAA的原理,讨论仅从我在实现时应用的方案来切入。


问题的产生

接触过GAMES101 CG课作业二的伙伴应该熟悉,课程定义的MSAA流程以及我们在网上看到的实现如下:

// 't'为当前三角形面片
seg_pos = {{0.25, 0.25}, {0.75, 0.25},{0.25, 0.75}, {0.75, 0.75}};
for(int x=x_l;x<=x_r;x++)
    for(int y=y_b;y<=y_t;y++) 
        int count = 0
        float min_depth = FLT_MAX;
        for(auto & e : seg_pos) 
            if(insideTriangle((float)x + e[0], (float)y + e[1], t.v)) 
                count++
                ...用重心坐标插值出当前采样点深度
                min_depth = std::min(min_depth, 当前采样点深度)
        if(count != 0 && depth_buf[get_index(x, y)] > min_depth) 
            像素颜色 = t.getColor() * (count / 4)
            设置颜色(像素颜色)

这是一种简化版MSAA:四个子采样点设置在像素中心的右上角,判断每个采样点是否在当前考虑的三角形面片内,若是则命中次数加1,并维护一个变量min_depth,记录四个采样点中最小的深度值。如果命中次数为0,或者未通过深度测试,则直接discard当前像素;否则当前像素设置颜色为 三角形颜色 * 命中率,说白了就是简单的算术平均。

于是乎,我为毕设实现MSAA时便屁颠屁颠地直接将上述流程照搬,结果出了大问题 -- 每个三角形面片之间出现了黑色裂缝:

一开始我以为又是什么舍入带来的精度损失,查阅资料后,好像在实现GAMES作业2的时候也有类似问题。

于是我重新回去运行作业2,确实在三角形交界处会出现黑线:

直接原因便是,这种算法存在一个缺陷,具体请看图:

(注意,作业2比较特殊,整个场景就定义了两个三角形面片,也就是蓝色和黄绿色三角形)

图中,我们正在蓝色三角形内进行光栅化。考虑一种最坏的情况,即边缘像素仅有左下角的采样点命中了蓝色三角形内部。

按照上面伪代码的思路,根本不考虑另外三个处于黄绿色三角形内的采样点的贡献,当前像素颜色简单粗暴设置为 t.getColor() * (1/4) ,这里的 \(t\) 即为蓝色三角形,它的颜色为 \(RGB(194,217,233)\),则当前像素会被设置为 \(RGB(48,54,58)\),呈现出一种类似于黑色的颜色,所以也不难想象当采样点命中为2、3个的时候,颜色也只是会稍微浅一点罢了,这与右边的黄绿色产生了一种较强的割裂感,从而产生裂缝的错觉。


尝试解决

意识到问题后,我便查阅资料,并确定要实现一种开销较大的MSAA:

每个像素有4bit的coverage mask,以及4个深度值(每个sample各一个),另外还有其他attribute(最简单的就是color),并且是可以拿一份color copy给所有sample(准确地说是只copy给那些mask非0的sample),而这份color可以来自像素中心或者某个sample。

策略

我选用的策略是,对于一个像素,算出其每个被命中sample(采样点)的颜色、深度,最后再对相关值进行关于命中次数的算术平均:

(这个例子和上述作业2不太一样,这里假设背景的蓝色和黄绿色仅恰巧为某些材质的接缝处,并不是简单的两个三角形交界;图中的三角形是很多三角面片的其中一个)

如图,按照我选择的策略,该像素最右的sample在该三角形之外,被discard(丢弃)。那么该像素的颜色即为剩下三个sample颜色的算术平均,最终颜色在边界处产生一种较为平滑的过渡。这其实接近于SSAA了,因为会对多个采样点运行fragment shader。


实现

你可能会注意到我在讲述策略时用了一种不太一样的sample模式,也即采样点并非在像素右上角,而是环绕像素中心并略微旋转:

因为在应对三角形边界情形时,顺时针旋转26.6度的算子被证明是一种比较有效的sample模式。下面来看如何通过代码一步步实现:

为了得到目标模式,我们先确立一个正正方方的采样模式,其各sample都是一个Vector2类型,为这些sample均乘以一个旋转矩阵即可:

pub static MSAA_LEVEL: usize = 4;
pub static MSAA_OFFSET: f32 = 0.25;
pub static MSAA_SAMPLE_POS: Matrix2<Vector2<f32>> = Matrix2::new(
    Vector2::new(-MSAA_OFFSET,-MSAA_OFFSET),Vector2::new(MSAA_OFFSET,MSAA_OFFSET),
    Vector2::new(-MSAA_OFFSET,MSAA_OFFSET),Vector2::new(MSAA_OFFSET,-MSAA_OFFSET),
);
  • MSAA_LEVEL表征一个像素的sample个数
  • MSAA_OFFSET表征每个sample与像素中心x、y的偏移绝对值
  • MSAA_SAMPLE_POS表征还未旋转的sample模式

计算旋转后的模式:

pub fn calc_conv() -> Matrix2<Vector2<f32>> {
    let mut conv_tmp: Matrix2<Vector2<f32>> = Default::default();
    let rotate: Matrix2<f32> = rotate_matrix2d(-26.6);
    for i in 0..4 {
        conv_tmp[i] = rotate*MSAA_SAMPLE_POS[i];
    }
    conv_tmp
}

为了方便输出单个像素四个sample的状态,我定义了一个结构叫做 MsaaTensor

pub struct MsaaTensor {
    mask:  Vector4<bool>,
    dept:  Vector4<f32>,
    colo:  Vector4<Vector3<f32>>,
}
  • mask记录各sample是否被激活(命中 / hit)
  • dept记录各sample的深度
  • colo记录各sample的颜色

进入渲染例程,通过三个变量奠基:

for 像素(x,y) in 当前三角形包围盒 {
    let 像素坐标 = x + y * self.height;
    let 张量 = msaa_tensors[像素坐标];
    let hit = 0.0;
    ......
}

为每个像素计算其MsaaTensor四个角的信息:

for 像素(x,y) in 当前三角形包围盒 {
    ......
    for idx in 0..MSAA_LEVEL {
        let 采样点重心坐标 = barycentric(三角形三顶点,像素.x+采样模式[idx].x,像素.y+采样模式[idx].y);
        if 在三角形内(采样点重心坐标) {
            hit += 1.0;
            let 深度 = 深度插值(采样点重心坐标,三角形三顶点);
            tensor.设置标志(idx,true);
            tensor.设置深度(idx,深度);
            tensor.设置颜色(idx,着色器.颜色(采样点重心坐标));
        }else {
            tensor.设置标志(idx,false);
        }
    }
    ......
}

如果没有子sample被hit,那么直接discard此像素:

for 像素(x,y) in 当前三角形包围盒 {
    ......
    if hit == 0.0 {
        continue;
    }
    ......
}

只要有一个sample被hit,计算blend信息并着色:

for 像素(x,y) in 当前三角形包围盒 {
    .......
    else {
        let 漫反射_blend = Default::default();
        let 深度_blend = 0.0;
        for idx in 0..MSAA_LEVEL {
            if msaa_tensors[ipixel].标志位(idx) == true {
                漫反射_blend += msaa_tensors[ipixel].颜色(idx);
                深度_blend   += msaa_tensors[ipixel].深度(idx);
            }
        }

        // 当前pixel的深度由被hit的子sample混合得到
        深度_blend /= hit;
        if 深度缓存(像素.x,像素.y)>深度_blend {
            continue;
        }

        深度缓存(像素x, 像素.y, depth_blend);
        帧缓存(像素.x, 像素.y, 漫反射_blend/hit);
    }
    ......
}

运行程序看看效果:

对比发现,好像除了一些地方变糊了,模型内部颜色交界处改善不太明显。那么试着把MSAA_OFFSET的步长改大一点:

pub static MSAA_OFFSET: f32 = 0.5;

效果相对明显了,但我发现除了颜色变换剧烈的边缘,一些较为平滑的局部也被MSAA处理得糊成一片。原因是我们的策略会对一切sample hit数不为0的像素进行算术平均处理,这与MSAA的理念相违背了。

改进

若像素的sample hit数为4,则表明该像素并不处于三角形面片边缘,也就没必要进行MSAA平均处理,直接用改像素点本身的颜色着色就行了。有了这个觉悟,为代码加一段判定:

for 像素(x,y) in 当前三角形包围盒 {
    .......
    else if hit == 4.0 {
        let 像素重心坐标 = barycentric(三角形三顶点,像素.x,像素.y);
        let 深度 = 深度插值(像素重心坐标,三角形三顶点);
        if 深度缓存(像素.x,像素.y)>深度 {
            continue;
        }
        深度缓存(像素x, 像素.y, 深度);
        帧缓存(像素.x, 像素.y, 着色器.颜色(像素重心坐标));
        continue;
    }
    ......
}

看看效果:

很明显内部平滑部分未被MSAA影响,但似乎对比起来效果不显著,这里我还是感到比较困惑,欢迎伙伴一起讨论。

posted @ 2021-06-04 19:04  elexenon  阅读(926)  评论(0编辑  收藏  举报