摘要: 视频压缩及解压缩,DCT是耗速大户,相对运算密集,试将运算部分由SSE2取代,以期提高运算速度。 原程序:耗时59us 替换程序:耗时140us 使用SSE2竟然慢一倍多!为什么?经过多次采用不同形式的试验,虽然有改善,但谈不上提速,后来终于悟出了道理,解释如下: 1. 处理器增加了8个XMM寄存器 阅读全文
posted @ 2018-06-09 16:30 hbg200 阅读(219) 评论(0) 推荐(0) 编辑
摘要: BCB6是早期的产物,有着快速优美的开发体验,可比喻为天堂般的享受。随着岁月的流失,BCB6的光芒逐渐暗淡,但光明依然存在,当运行SSE2指令后,有喜也有忧,喜的是可以运行加速指令,提高运算速度,忧的是SSE2后的指令再也运行不动了,这优美的软件,今天到了速度的边界,天堂的光芒在此消失,也许是千古绝 阅读全文
posted @ 2018-06-09 00:33 hbg200 阅读(236) 评论(0) 推荐(0) 编辑