CUDA npp运动检测模块性能测试
测试环境:
Cpu: Intel(R)Core(TM)i7-4790 CPU @3.6GHZ |
GPU: NVIDIA GeForce GTX960 *2 |
操作系统: Windows 7 专业版 64位操作系统 |
内存: 安装内存(RAM) 16.0GB |
显存: 4g*2 |
测试指标 测试项目 |
单帧耗mean(500P) |
GPU占用率 |
显存占用 Unit:M |
Cpu占用率 |
内存占用 Unit:M |
|
1080p |
1 路 |
9.23ms |
98% / 0% |
237 / 0 |
0% |
263 |
1080p |
2 路 |
9.05ms |
98% / 98% |
237 / 237 |
0-1% |
528 |
1080p |
4 路 |
18ms |
99% / 99% |
389 / 389 |
0-1% |
528 |
1080p |
8 路 |
35.5ms |
99% / 99% |
702 / 702 |
0-1% |
529 |
1080p |
16路 |
72.5ms |
99% / 99% |
1325 / 1325 |
0-1% |
520 |
1080p |
24路 |
109.5ms |
99% / 99% |
2339 /2339 |
0-1% |
522 |
720p |
1 路 |
4.27ms |
96% / 0% |
153/0 |
0% |
263 |
720p |
2 路 |
4.2ms |
96% / 96% |
153/153 |
0% |
528 |
720p |
4 路 |
8ms |
99%/99% |
225/225 |
0-1% |
515 |
720p |
8 路 |
16ms |
99%/99% |
370/370 |
0-1% |
519 |
720p |
16路 |
32ms |
99%/99% |
661/661 |
0-1% |
520 |
720p |
32路 |
65ms |
99%/99% |
1243/1243 |
0-1% |
523 |
4cif |
1 路 |
2.1ms |
90%-90% |
121 / 0 |
0-1% |
341 |
4cif |
2 路 |
2ms |
91% / 91% |
121 / 121 |
0-1% |
518 |
4cif |
4 路 |
3.5ms |
99% / 99% |
162 / 162 |
0-1% |
519 |
4cif |
8 路 |
7ms |
99% / 99% |
244 / 244 |
0-1% |
519 |
4cif |
16路 |
14ms |
99% / 99% |
408 / 408 |
0-1% |
521 |
4cif |
32路 |
28.5ms |
96% / 96% |
737 / 737 |
0-1% |
524 |
4cif |
64路 |
102ms |
55% / 55% |
1394 / 1394 |
0-1% |
529 |
注: 1. 上述测试的每一路对应主机程序的一个线程。
2. 上述的所有测试不考虑主机和内存之间的数据拷贝,单纯的测试GPU的计算能力
所以cpu基本处于空闲状态。
分析:1. 随着主机线程数目的增多,线程之间的调度时间延时会导致GPU占用率下降
2. 比较此前测试的GTX760显卡, GTX960的计算能力略弱,但多线程能力稍强。