RGB2GRAY 各种算法速度比较,整形乘法比查表法快!
1. 查表法,外循环用 这种格式 :
//for(int j = 0; j != h; ++j)// for(int i = 0; i!=w;++i)//、
耗时 700ms
for(int j = 0; j != h; ++j) for(int i = 0; i!=w;++i) { int r,g,b,y,r1,g1,b1,y1; r = D[in[of3]];//查表 //这里给第一个ALU执行 g = E[in[of3+1]]; b = F[in[of3+2]]; y = r + g + b; out[of] = y; of3 +=3; of+=1; }
耗时: 1000ms
2. 查表法, 外循环用这种格式 : for(int i = 0; i != img_size; ++i)
for(int i = 0; i != img_size; ++i) { int r,g,b,y,r1,g1,b1,y1; r = D[in[of3+2]];//查表 //这里给第一个ALU执行 g = E[in[of3+1]]; b = F[in[of3]]; y = r + g + b; out[i] = y; of3 +=3; }
耗时 700ms
3. 整形乘法, 1ALU
for(int i = 0; i != img_size; ++i) { int r,g,b,y,r1,g1,b1,y1; r = 1224 * in[of3+2]; g = 2404 * in[of3+1]; b = 467 * in[of3]; y = r + g + b; y = y >> 12; //这里去掉了除法运算 out[i] = y; of3 +=3; }
耗时: 550ms
4. 整形乘法 : 2ALU
for(int i = 0; i != img_size; i+=2) //一次并行处理2个数据
{
int r,g,b,y,r1,g1,b1,y1;
r = 1224 * in[of6+2];
g = 2404 * in[of6+1];
b = 467 * in[of6];
y = r + g + b;
y = y >> 12;
out[i] = y;
r1 = 1224 * in[of6+5];
g1 = 2404 * in[of6+4];
b1 = 467 * in[of6+3];
y = r1 + g1 + b1;
y = y >> 12;
out[i + 1] = y;
of6 += 6;
//of += 1;
}
耗时:450ms
5. 根据实验,发现bgr2y 函数是否加inline 对耗时无明显影响, 为了保险,还是应该加上inline。
思考:
1. 2ALU算法比1ALU算法快10%~25%
2.整形乘法法比查表法快 18%,至于为什么会比查表法快,是因为现在的CPU使用的都是硬件乘法器,比操作内存要快!!
分类:
Protocols
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 提示词工程——AI应用必不可少的技术
· .NET周刊【3月第1期 2025-03-02】