随笔分类 -  GPU基础知识

Cache替换策略
摘要:LRU, Least Recently Used, LRU算法根据各block(cache line)使用的情况, 总是选择那个最长时间未被使用的block进行替换。这种策略比较好的反映了程序局部性规律。gem5中该替换策略的代码:voidLRURP::invalidate(const std::shared_ptr& replacement_data)const{ // Reset las... 阅读全文

posted @ 2020-09-11 19:59 迈克老狼2012 阅读(3867) 评论(1) 推荐(0) 编辑

Bilateral Filtering(双边滤波) for SSAO(转)
摘要:原文链接:http://blog.csdn.net/bugrunner/article/details/7170471 另外一篇相似的英文资料:http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/MANDUCHI1/Bilateral_Filtering.html#Index 1. 简介 图像平滑是一个重要的操作,而且有多种成... 阅读全文

posted @ 2016-06-28 05:41 迈克老狼2012 阅读(1262) 评论(0) 推荐(0) 编辑

HBM内存介绍
摘要:原帖地址:http://www.anandtech.com/show/9969/jedec-publishes-hbm2-specification The high-bandwidth memory (HBM) technology solves two key problems related to modern DRAM: it substantially increases ba... 阅读全文

posted @ 2016-02-18 15:09 迈克老狼2012 阅读(8701) 评论(0) 推荐(0) 编辑

DRAM 内存介绍(三)
摘要:参考资料:http://www.anandtech.com/show/3851/everything-you-always-wanted-to-know-about-sdram-memory-but-were-afraid-to-ask/7 GPU中我们通常使用GDDR5内存,它的memory channel宽度是32bit,和DDR3/DDR4 不同(它们的m... 阅读全文

posted @ 2016-02-03 11:01 迈克老狼2012 阅读(2751) 评论(0) 推荐(0) 编辑

DRAM 内存介绍(二)
摘要:参考资料:http://www.anandtech.com/show/3851/everything-you-always-wanted-to-know-about-sdram-memory-but-were-afraid-to-ask/4 DDR3 SDRAM的读写操作都是burst相关的,在一个address启动读写操作后,它都要连续进行burst length的byte读写,... 阅读全文

posted @ 2016-02-03 10:59 迈克老狼2012 阅读(2718) 评论(0) 推荐(0) 编辑

Directx11教程(14) D3D11管线(2)
摘要:下面我们来了解一些GPU memory的知识,主要参考资料:http://fgiesen.wordpress.com/0211/07/02/a-trip-through-the-graphics-pipeline-2011-part-2 【注:请参考另一篇日志:2012-11-13:http://www.cnblogs.com/mikewolf2002/archive/2012/11/... 阅读全文

posted @ 2016-01-31 22:01 迈克老狼2012 阅读(1610) 评论(0) 推荐(0) 编辑

Pitch,Yaw,Roll的概念
摘要:在航空中,pitch, yaw, roll下图所示。 pitch是围绕X轴旋转,也叫做俯仰角。 yaw是围绕Y轴旋转,也叫偏航角。 roll是围绕Z轴旋转,也叫翻滚角。 在3D系统中,假设视点为原点,则视点坐标系如下图所示,通常z轴的负方向是视点方向(OpenGL)。 阅读全文

posted @ 2016-01-22 16:17 迈克老狼2012 阅读(18726) 评论(0) 推荐(0) 编辑

OpenGL和D3D11中的深度模版测试
摘要:在OpenGL和D3D11的管线中,像素shader之后的操作就是深度模版测试,深度模版测试是以sample为单位进行的,就是一个像素上可以有多个采样点,每个采样点都有深度信息。深度模版测试对每个采样点都要进行一次,如果是msaa,最后要对每次采样的像素结果进行resolve,得到最终的结果。在下面的链接中有msaa的介绍。 http://www.cnblogs.com/mikewolf... 阅读全文

posted @ 2016-01-21 22:00 迈克老狼2012 阅读(2359) 评论(0) 推荐(0) 编辑

每个程序员都应该了解的内存知识(3)-虚拟内存
摘要:英文原帖地址:http://lwn.net/Articles/253361/ 原翻译地址:http://www.oschina.net/translate/what-every-programmer-should-know-about-virtual-memory-part3 4 虚拟内存 处理器的虚拟内存子系统为每个进程实现了虚拟地址空间。这让每个进程认为它在系统中是独立的... 阅读全文

posted @ 2013-04-13 14:04 迈克老狼2012 阅读(1811) 评论(0) 推荐(0) 编辑

每个程序员都应该了解的内存知识(2)-CPU caches
摘要:英文原帖:http://lwn.net/Articles/252125/ 原翻译贴:http://www.oschina.net/translate/what-every-programmer-should-know-about-cpu-cache-part2 现在的CPU比25年前要精密得多了。在那个年代,CPU的频率与内存总线的频率基本在同一层面上。内存的访问速度仅比寄存器... 阅读全文

posted @ 2013-04-13 11:01 迈克老狼2012 阅读(3266) 评论(0) 推荐(0) 编辑

每个程序员都应该了解的内存知识(1)
摘要:英文原帖:http://lwn.net/Articles/250967/ 原翻译贴:http://www.oschina.net/translate/what-every-programmer-should-know-about-memory-part1 在原翻译的基础上,进行了一些修改。 1 简介 早期计算机比现在更为简单。系统的各种组件(子系统)例如CPU,内存,大容量... 阅读全文

posted @ 2013-04-13 09:12 迈克老狼2012 阅读(2063) 评论(0) 推荐(0) 编辑

D3D10/11中的遮挡查询的使用
摘要:在D3D10/11中,有D3D10_QUERY/D3D11_QUERY接口,通过QUERY接口,我们可以查询GPU的一些状态,比如GPU的时间戳信息(Timestamp)[这个常用来做performance分析],或者遮挡查询信息等等。我们通过directx sdk中的例子来看看在D3D10/11中,如何使用遮挡查询。源文件目录:SDK root\Samples\C++\Direct3... 阅读全文

posted @ 2012-12-27 21:10 迈克老狼2012 阅读(2875) 评论(0) 推荐(1) 编辑

深度解读 - Windows 7核心图形架构细致分析(转贴)
摘要:原帖地址:http://technet.microsoft.com/zh-cn/library/ee921514.aspx 如现在大家所想的那样, Windows7 其实是 Windows Vista 的改进版。 Windows 7 在 Windows Vista 的基础上进行了大量的完善工作,也加入了不少新特性。 Vista 与其上一代 XP 相比,提供了非常大的改进,然而一方面这... 阅读全文

posted @ 2012-12-23 15:29 迈克老狼2012 阅读(1790) 评论(0) 推荐(0) 编辑

视图矩阵的推导
摘要:把物体从世界坐标系转化到视点坐标系的矩阵称为视图矩阵。 下面我们先看下OpenGL中视图矩阵的推导过程: 假设视点或camera的局部坐标系为UVN,UVN分别指向右方、上方和后方从而构成右手坐标系,视点则处于局部坐标系的原点位置。 就如OpenGL中的函数gluLookAt(eyex, eyey, eyez, lookatx, lookaty,... 阅读全文

posted @ 2012-11-25 15:43 迈克老狼2012 阅读(6038) 评论(1) 推荐(0) 编辑

透视校正插值
摘要:在3D渲染中,输入数据是一些primitive信息,包括顶点位置、颜色、纹理坐标等等。在光栅化阶段,primitive(一般为三角形)被转化成一系列的fragment(或者称为像素),这些fragment接下来要做ps操作,此时每个fragment都有位置、颜色、纹理坐标这些属性信息,这些属性信息... 阅读全文

posted @ 2012-11-25 13:21 迈克老狼2012 阅读(5843) 评论(5) 推荐(4) 编辑

D3D的投影矩阵推导[转贴]
摘要:原帖地址:http://blog.csdn.net/popy007/article/details/4091967 上一篇文章中我们讨论了透视投影变换的原理,分析了OpenGL所使用的透视投影矩阵的生成方法。正如我们所说,不同的图形API因为左右手坐标系、行向量列向量矩阵以及变换范围等等的不同导致了矩阵的差异,可以有几十个不同的透视投影矩阵,但它们的原理大同小异。这次我们准备讨论... 阅读全文

posted @ 2012-11-25 10:47 迈克老狼2012 阅读(3593) 评论(0) 推荐(0) 编辑

深入探索投影变换[转贴]
摘要:原帖地址: http://blog.csdn.net/popy007/article/details/1797121 透视投影是3D流水线的重要组成部分,它将视点空间中的点从视锥体(Frustum)变换到规则观察体( 裁剪空间),待裁剪完毕后再进行透视除法,此时规则观察体则成为归一化的规则观察体,然后归一化规则观察体中的XY平面进行视口映射,映射到屏幕空间,Z坐标则... 阅读全文

posted @ 2012-11-25 10:15 迈克老狼2012 阅读(1981) 评论(1) 推荐(1) 编辑

D3D11中的硬件反锯齿 SSAA/MSAA/EQAA/CSAA(3)
摘要:五 、EQAA/CSAA EQAA(enhanced quality AA)和CSAA(coverage sample AA)其实是同样的采样技术,EQAA是AMD的实现,CSAA是NV的实现,下面我以EQAA为例看看这两种AA的原理: 在MSAA中,每个采样都有一个sample color缓冲相对应,这样在AA数目比较大的时候,比如16XMSAA,对memory的需... 阅读全文

posted @ 2012-11-24 10:06 迈克老狼2012 阅读(4180) 评论(0) 推荐(0) 编辑

D3D11中的硬件反锯齿 SSAA/MSAA/EQAA/CSAA(2)
摘要:三、SSAA(super-sampling anti-aliasing) SSAA最初的思路是先上采样渲染图像,然后再下采样输出图像,比如我们要渲染输出一个256*256的图像,可以设置color buffer为512*512(4倍的SSAA),这个时候我们的ps需要执行512*512个thread,同时深度模版测试也要进行512*512次,最后把4倍的color buffer re... 阅读全文

posted @ 2012-11-22 20:24 迈克老狼2012 阅读(3706) 评论(3) 推荐(0) 编辑

D3D11中的硬件反锯齿 SSAA/MSAA/EQAA/CSAA(1)
摘要:在篇日志中,我们学习一下在D3D11中,如何启用aa(反锯齿)功能,提高渲染质量,并了解一下硬件反锯齿的原理。首先我们先回顾一下采样和滤波的概念,然后了解在D3D11中,如何启用aa(anti-aliasing)功能,最后是SSAA/MSAA/EQAA/CSAA几种硬件aa的原理。 一、采样和滤波 采样(sampling)和filter(滤波)是信号处理中的概念。所谓sa... 阅读全文

posted @ 2012-11-22 20:08 迈克老狼2012 阅读(3294) 评论(1) 推荐(0) 编辑

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示