07 2012 档案

摘要:HP Xeon 55xx的服务器上NVIDIA GPU的带宽问题 但是通过SDK的带宽测试,数值比较奇怪。 host -> device 最高不到3GB/S, device-> host 最高只有3.2GB/s,这与PCI Express Gen 2.0的5-6GB/s的数据相差比较... 阅读全文
posted @ 2012-07-24 20:33 唐僧吃肉 阅读(215) 评论(0) 推荐(0) 编辑
摘要:月光博客6月12日发表了《写给新手程序员的一封信》,翻译自《An open letter to those who want to start programming》,我的朋友(他在本站的id是Mailper)告诉我,他希望在酷壳上看到一篇更具操作性的文章。因为他也是喜欢编程和技术的家伙,于是... 阅读全文
posted @ 2012-07-15 15:01 唐僧吃肉 阅读(147) 评论(0) 推荐(0) 编辑
摘要:转自:http://blog.sina.com.cn/s/blog_3e28c8a50100bnin.html 我们在用C/C++语言写程序的时侯,内存管理的绝大部分工作都是需要我们来做的。实际上,内存管理是一个比较繁琐的工作,无论你多高明,经验多丰富,难免会在此处犯些小错误,而通常这些错误又... 阅读全文
posted @ 2012-07-14 20:45 唐僧吃肉 阅读(779) 评论(0) 推荐(0) 编辑
摘要:CPU 双精度浮点峰值:核数*主频*FU数目*(每个FU含有的浮点部件) 一般来说,intel的x86架构FU数目是2,每个FU含有一个乘法部件,一个加法部件,所以每个FU含有的浮点部件=2 对于单精度来说,浮点峰值=双精度浮点峰值*2 这是因为使用SSE指令,长度为128位,每个计算部件可放4... 阅读全文
posted @ 2012-07-12 10:46 唐僧吃肉 阅读(435) 评论(0) 推荐(0) 编辑
摘要:作者:小熊在线-宁道奇 日期:2011年06月20日 . http://www.beareyes.com.cn/2/lib/201106/20/20110620416_0.htm 并行计算:让处理的速度变得更快 相对于串行计算,并行计算可以划分成时间并行... 阅读全文
posted @ 2012-07-08 22:29 唐僧吃肉 阅读(802) 评论(0) 推荐(0) 编辑