随笔档案「2012年7月」 - 唐僧吃肉

HP Xeon 55xx上GPU的带宽问题

摘要：HP Xeon 55xx的服务器上NVIDIA GPU的带宽问题但是通过SDK的带宽测试，数值比较奇怪。 host -> device 最高不到3GB/S, device-> host 最高只有3.2GB/s，这与PCI Express Gen 2.0的5-6GB/s的数据相差比较... 阅读全文

posted @ 2012-07-24 20:33 唐僧吃肉阅读(274) 评论(0) 推荐(0)

《写给新手程序员的一封信》

摘要：月光博客6月12日发表了《写给新手程序员的一封信》，翻译自《An open letter to those who want to start programming》，我的朋友（他在本站的id是Mailper）告诉我，他希望在酷壳上看到一篇更具操作性的文章。因为他也是喜欢编程和技术的家伙，于是... 阅读全文

posted @ 2012-07-15 15:01 唐僧吃肉阅读(154) 评论(0) 推荐(0)

Linux 下的段错误(Segmentation fault)调试方法

摘要：转自：http://blog.sina.com.cn/s/blog_3e28c8a50100bnin.html 我们在用C/C++语言写程序的时侯，内存管理的绝大部分工作都是需要我们来做的。实际上，内存管理是一个比较繁琐的工作，无论你多高明，经验多丰富，难免会在此处犯些小错误，而通常这些错误又... 阅读全文

posted @ 2012-07-14 20:45 唐僧吃肉阅读(817) 评论(0) 推荐(0)

浮点性能峰值，带宽的计算

摘要：CPU 双精度浮点峰值：核数*主频*FU数目*（每个FU含有的浮点部件）一般来说，intel的x86架构FU数目是2，每个FU含有一个乘法部件，一个加法部件，所以每个FU含有的浮点部件=2 对于单精度来说，浮点峰值=双精度浮点峰值*2 这是因为使用SSE指令，长度为128位，每个计算部件可放4... 阅读全文

posted @ 2012-07-12 10:46 唐僧吃肉阅读(463) 评论(0) 推荐(0)

双剑合璧：CPU+GPU异构计算完全解析

摘要：作者:小熊在线-宁道奇日期:2011年06月20日 . http://www.beareyes.com.cn/2/lib/201106/20/20110620416_0.htm 并行计算：让处理的速度变得更快相对于串行计算，并行计算可以划分成时间并行... 阅读全文

posted @ 2012-07-08 22:29 唐僧吃肉阅读(877) 评论(0) 推荐(0)

唐僧吃肉

07 2012 档案

公告