--- My_原创 - 随笔分类(第6页) - zyl910

[笔记] Intel C++编译器的预定义宏（Windows版、Linux版）

摘要：网上有很多介绍VC与GCC预定义宏的帖子，例如《C\C＋＋宏大全》。而对于Intel C++编译器的预定义宏，似乎没人介绍。我Google了很久，发现Intel官网上有，但是很奇怪，很多链接都失效了，报告404错误。反复调整搜索关键字，一个一个的尝试链接，最后终于找到了有效的页面了。为了怕以后链接失效，赶紧记录下载。该手册的名字是《Intel® C++ Compiler XE 12.1 User and Reference Guides》，分别有Windows版和Linux版——Windows：http://software.intel.com/sites/products/d 阅读全文

posted @ 2012-07-06 11:03 zyl910 阅读(6498) 评论(0) 推荐(0) 编辑

[VC] 检测AVX系列指令集的支持级别（AVX、AVX2、F16C、FMA、FMA4、XOP）

摘要：从2011年的Sandy Bridge微架构处理器开始，现在支持AVX系列指令集的处理器越来越多了。本文探讨如何用VC编写检测AVX系列指令集的程序，并利用了先前的CPUIDFIELD方案。一、AVX系列指令集简介 SSE5 指令：SSE5 是一个纸面上的指令集，并没有最终实现，AMD 在 2007 年 8 月公布 SSE5 指令集规范，在 2009 年 5 月 AMD 推出了 XOP，FMA4 以及 CVT16 来取代 SSE5 指令。 AVX 指令：2008 年 3 月 Intel 发布了 AVX（Advanced Vector Extensions）指令集规范，首次在 Sandy B.. 阅读全文

posted @ 2012-07-04 16:01 zyl910 阅读(11752) 评论(0) 推荐(0) 编辑

[VC] CPUIDFIELD：CPUID字段的统一编号、读取方案。范例：检查SSE4A、AES、PCLMULQDQ指令

摘要：除了基本的MMX和SSE系列指令集外，x86体系还有其他扩展指令集，例如SSE4A、AES、PCLMULQDQ等，它们也可以利用CPUID指令来检测。但是，这些指令集细碎杂多。如果像以前那样分别编写检测函数的话，那工作量太大，不值得。而且大量的函数名也会给使用带来麻烦。于是文篇探讨如何设计一套通用的检测方案。零、指令简介 SSE4A指令：是AMD提出的，最早出现在2007年的K10微架构的处理器上。它针对Intel的SSE4指令集修改而来，去除其中对I64优化的指令，保留图形、影音编码、3D运算、游戏等多媒体指令，并完全兼容。 AES指令：是Intel提出的，最早出现在2010年的West.. 阅读全文

posted @ 2012-06-29 14:11 zyl910 阅读(4082) 评论(0) 推荐(0) 编辑

[C#] cmdarg_ui：“简单参数命令行程序”的通用图形界面

摘要：我们有时需要写一些小工具，或者是需要写一些简短的测试程序，这时编写命令行程序会比较方便。但是命令行程序用起来不太方便，比如——1.查看信息困难。有时候我们需要观察命令行程序的输出结果，但是在默认情况下，命令行程序执行完毕后会自动关闭窗口，来不及观察信息。这时可以采取“在程序中等待按键”、“手工打开命令提示符输入命令”、“在批处理中等待按键”、“批处理重定向”等方法，但是都比较麻烦。2.命令参数困难。某些命令行程序需要参数，这时只有手工打开命令提示符输入命令。有时要键入文件的全限定名，那就更花功夫了。怎么解决以上难题呢？首先想到的是把那些小程序改写为图形界面程序，或者为命令行程序分别... 阅读全文

posted @ 2012-06-19 17:29 zyl910 阅读(3096) 评论(0) 推荐(0) 编辑

[VC兼容32位和64位] 检查MMX和SSE系列指令集的支持级别

摘要：以前我写了一篇《[VC6] 检查MMX和SSE系列指令集的支持级别（最高SSE4.2）》（http://www.cnblogs.com/zyl910/archive/2012/03/01/checksimd.html）。现在发现该方法存在两点缺陷——1.不支持64位，因为VC的64位程序不支持内嵌汇编；2.没有区分硬件支持与操作系统支持。怎么解决这两点缺陷呢？对于第1点，可以利用Intrinsics函数来兼容32位和64位。为了更方便的使用CPUID指令，可以利用《如何在各个版本的VC及64位下使用CPUID指令》（http://www.cnblogs.com/zyl910/arc... 阅读全文

posted @ 2012-05-25 22:22 zyl910 阅读(4878) 评论(0) 推荐(1) 编辑

[使用心得]利用按键精灵批量删除pdf中的水印

摘要：新版本——http://www.cnblogs.com/zyl910/archive/2012/11/14/pdf_remove_watermake_marco_v2.html[使用心得] 利用按键精灵批量删除pdf中的水印 V2：用于页面内对象数量不定时删除最后一个对象一、利用“内容”面板删除水印启动Acrobat Prefessional，打开该pdf文档。点击菜单栏中的“视图→导航面板→内容”，打开“内容”面板—— 观察内容面板，展开树列表，会发现每一页中的第3个对象是水印（容器<Artifact> www.ckook.com）—— 在水印对象上右击鼠标弹出快捷菜单，点击阅读全文

posted @ 2012-05-22 16:20 zyl910 阅读(5305) 评论(1) 推荐(0) 编辑

如何在各个版本的VC及64位下使用CPUID指令

摘要：前面我们探讨了在16位的DOS实模式下使用CPUID指令（http://www.cnblogs.com/zyl910/archive/2012/05/14/dos16_getcpuid.html）。而现在64位Windows系统已经很流行了，在32/64位模式下如何使用CPUID呢？于是本文介绍了如何在各个版本的VC及64位下使用CPUID指令。一、推荐使用__cpuid、__cpuidex等Intrinsics函数在32位模式下，我们可以使用内嵌汇编来调用cpuid指令。但在64位模式下，VC编译器不支持内嵌汇编。于是微软提供了Intrinsics函数——编译器会将Intrins... 阅读全文

posted @ 2012-05-21 18:04 zyl910 阅读(12650) 评论(0) 推荐(0) 编辑

[笔记] 分解多核CPU的x2APIC_ID（或APIC_ID）中的各个子字段

摘要：一、分解x2APIC_ID摘自《Intel® 64 Architecture Processor Topology Enumeration》中的“Sub ID Extraction Parameters for x2APIC ID”——SMT_ID: CPUID.(EAX=11, ECX=0):EAX[4:0] provides the width parameter to derive a SMT select mask to extract the SMT_IDs of logical processors within the same processor core. The 阅读全文

posted @ 2012-05-15 17:24 zyl910 阅读(3206) 评论(0) 推荐(0) 编辑

[TurboC++] 如何在DOS下的16位C++编译器中使用CPUID指令获取CPU信息

摘要：有时我们需要编写DOS实模式下的CPU信息诊断程序，但是TurboC++等很多16位C++编译器不支持CPUID指令和32位汇编。于是本文介绍了一种办法，靠内嵌机器码实现了获取CPUID信息。一、CPUID指令简介 CPUID指令是intel IA32架构下获得CPU信息的汇编指令，可以得到CPU类型，型号，厂商信息，商标信息，序列号，缓存等一系列CPU相关的东西。 CPUID指令一般使用使用eax作为输入参数（某些时候会用到ecx），eax、ebx、ecx、edx作为输出参数。例如这样的汇编代码——mov eax, 1cpuid... 以上代码以1为输入参数，执行cpuid后... 阅读全文

posted @ 2012-05-14 23:57 zyl910 阅读(4090) 评论(0) 推荐(0) 编辑

C++AMP的tiled_index线程编号属性笔记

摘要：tiled_index类中有4个属性与线程编号有关——tiled_index.global：线程的全局编号。相当于DirectCompute中的SV_DispatchThreadID。tiled_index.local：线程的局部编号。相当于DirectCompute中的SV_GroupThreadID。tiled_index.tile：线程块的编号。相当于DirectCompute中的SV_GroupID。tiled_index.tile_origin：线程块中首个线程的全局编号。（tile_origin=global-local）。参考文献——http://msdn.microsoft.c 阅读全文

posted @ 2012-05-09 15:24 zyl910 阅读(826) 评论(0) 推荐(0) 编辑

使用GetLogicalProcessorInformation获取逻辑处理器的详细信息（NUMA节点数、物理CPU数、CPU核心数、逻辑CPU数、各级Cache）

摘要：现在多核处理器已经很普及了，市场主流是双核处理器，还有4核、8核等高端产品。而且Intel推广了超线程技术（Hyper-Threading Technology, HTT），可以将一个物理核心模拟为两个逻辑处理器。这一切使得“CPU数量”这一概念变得复杂起来，对于软件开发人员来说，希望能获得物理CPU数、CPU核心数、逻辑CPU数等详细信息。在Windows平台，可以调用GetLogicalProcessorInformation函数来获取它们的详细信息。一、背景知识先来明确一下名词——physical processor packages：物理处理器封装个数，即俗称的“物理CPU... 阅读全文

posted @ 2012-05-08 18:06 zyl910 阅读(2954) 评论(0) 推荐(1) 编辑

ID3D11DeviceContext::Dispatch与numthread笔记

摘要：假定——[numthreads(TX, TY, TZ)] // 线程组尺寸。既线程组内有多少个线程。Dispatch(GX, GY, GZ); // 线程组的数量。既有多少个线程组。那么——SV_GroupThreadID={iTX, iTY, iTZ} // 【线程组内的】线程3D编号SV_GroupID={iGX, iGY, iGZ} // 线程组的3D编号SV_DispatchThreadID={iGX*TX+iTX, iGY*TY+iTY, iGZ*TZ+iTZ} // 将线程组展开后，每个线程的全局3D编号。SV_GroupIndex=iTX + iTY*TX + iTZ*TX*TY 阅读全文

posted @ 2012-05-07 16:50 zyl910 阅读(878) 评论(0) 推荐(0) 编辑

[维多利亚2 MOD] RecoverMingV（Vic2版复明） V1.1.3(2012-5-4更新)，兼容AHD 2.31beta

摘要：更新历史——[2012-5-4] V1.1.3& 兼容最新的 AHD 2.31beta(2012-04-27)：http://bbs.52pcgame.com/thread-424493-1-1.html& 文本修订。下载地址——http://115.com/file/e73tbte8http://u.xunzai.com/fileview_1147668.htmlhttp://dl.dbank.com/c0xsvgps5w更多内容——http://www.cnblogs.com/zyl910/archive/2012/02/17/RecoverMingV_V1.html[维多阅读全文

posted @ 2012-05-04 23:12 zyl910 阅读(1150) 评论(0) 推荐(0) 编辑

SIMD函数整理：01 《PC平台新技术MMX（上册）：开发编程指南》第8章 MMX编码技术

摘要：一、来源来源：《PC平台新技术MMX（上册）：开发编程指南》第8章 MMX编码技术书籍信息——http://e.360buy.com/30027396.htmlPC平台新技术MMX（上册）：开发编程指南作者：吴乐南编出版社：东南大学出版社ＩＳＢＮ：9787810502528出版时间：1997-10-01页数：149字数：237000所属分类：电子书 > 计算机与互联网 > 编程语言与程序设计电子书 > 计算机与互联网 > 计算机工具书二、整理后的代码代码——#include <Windows.h>#include <st 阅读全文

posted @ 2012-04-26 21:59 zyl910 阅读(2389) 评论(0) 推荐(0) 编辑

SIMD函数整理：00 索引贴（2012-07-31更新）

摘要：作者：zyl910 关于SIMD（MMX、SSE、AVX）编程的资料一直很零散，于是我试图进行收集整理，便于随时翻阅学习。而且很多代码是直接用汇编写的，易读性差、难以重用，于是我决定将其统一改写为Intrinsics函数版。一、Instructions函数对照表在使用Instructions函数时，很多时候会发现MSDN说的不详细，这时只有去翻阅Intel、AMD文档了。但Intel、AMD文档都是按照汇编指令名排序的，查起来不太方便。而且SIMD指令大多很复杂，文字描述难以详细的解释其功能，唯有伪代码才能精确的解释其功能。但Intel、AMD文档上的伪代码大多很长，不适合随时翻阅。... 阅读全文

posted @ 2012-04-26 21:53 zyl910 阅读(6847) 评论(0) 推荐(2) 编辑

SIMD（MMX/SSE/AVX）变量命名规范心得

摘要：当使用Intrinsics函数来操作SIMD指令集（MMX/SSE/AVX等）时，会面对不同长度的SIMD数据类型，其中又分为多种紧缩格式。为此，我设计了一套SIMD变量命名规范，可以有效的提高代码的可读性。一、SIMD数据类型简介 SIMD数据类型有——__m64：64位紧缩整数（MMX）。__m128：128位紧缩单精度（SSE）。__m128d：128位紧缩双精度（SSE2）。__m128i：128位紧缩整数（SSE2）。__m256：256位紧缩单精度（AVX）。__m256d：256位紧缩双精度（AVX）。__m256i：256位紧缩整数（AVX）。注：紧缩整数包括了8位、16... 阅读全文

posted @ 2012-04-23 17:49 zyl910 阅读(9815) 评论(1) 推荐(1) 编辑

AVX指令集中的32种浮点比较关系详解（NaN、无序、有序等）

摘要：在传统印象中，数字的比较关系只有6种。但在AVX指令集中，Intel一下给出了32种浮点比较谓词，详见下图——（Intel手册：Table 3-9. Comparison Predicate for VCMPPD and VCMPPS Instructions）为什么会有这么多种比较谓词呢？我为此困惑困惑了很久。直到最近翻阅了不少资料后，才终于将它们弄懂了。一、浮点数据类型 Intel使用的是IEEE 754规范的浮点数据类型。对于浮点数据类型来说，除了可以存储数字、无穷之外，还可以存储 NaN（not a number。非数）。 NaN（非数）分为两大类——1.QNaN：qu... 阅读全文

posted @ 2012-04-19 15:50 zyl910 阅读(5096) 评论(0) 推荐(0) 编辑

深入探讨用位掩码代替分支（9）：测试成绩总结

摘要：一、测试结果汇总将前面的测试结果进行汇总，整理为表格（单位是毫秒，数值越小越好）—— 测试f0_iff1_minf2_negf3_sarf4_mmxf5_sseVC6 on 32bit2016206371967237.525.7VC6 on 64bit2028207571868737.125.3VC2010(32) on 32bit17932112512437VC2010(32) on 64bit17162106514437VC2010(64) on 64bit16231997421328C#2010(any) on 32bit192221472471559C#2010(any) on... 阅读全文

posted @ 2012-04-13 17:20 zyl910 阅读(1814) 评论(2) 推荐(0) 编辑

深入探讨用位掩码代替分支（8）：SSE指令集速度测试

摘要：在上一篇测试了MMX指令集，这次我们来测试SSE指令集。说的更精确一点，是测试SSE2指令集。本篇致力于解决以下问题——1.SSE/SSE2指令集是什么？2.如何阅读Intel/AMD的手册？3.如何运用SSE指令集？如何将MMX代码升级为SSE代码。4.如何在VC++6.0这样的高级语言编译器中使用MMX指令集？一、简介 1999 年 Intel 推出了第 1 代的 SSE（Streaming SIMD Extensions）指令以回击 AMD 的 3DNow! 指令，使用在 Pentium III 处理器上。随后 AMD 在 2001 年 10 月发布的 Athlon XP ... 阅读全文

posted @ 2012-04-12 22:09 zyl910 阅读(4453) 评论(2) 推荐(0) 编辑

深入探讨用位掩码代替分支（7）：MMX指令集速度测试

摘要：前面我们测试了高级语言做饱和处理的性能。其实，对于这样的大批量数据处理，使用SIMD（Single Instruction Multiple Data，单指令多数据流）技术能极大的提高性能。MMX指令集是目前x86平台上覆盖最广的SIMD指令集，于是本文对它进行探讨。本文致力于解决以下问题——1.MMX指令集是什么？2.如何阅读Intel/AMD的手册？2.如何运用MMX指令集？3.如何在VC++6.0这样的高级语言编译器中使用MMX指令集？一、MMX指令集简介 MMX（Multi Media eXtension，多媒体扩展指令集）指令集是Intel公司于1996年推出的一项多媒体指... 阅读全文

posted @ 2012-04-09 22:25 zyl910 阅读(3337) 评论(0) 推荐(0) 编辑

zyl910

公告

搜索

常用链接

我的标签

积分与排名

合集 (2)

随笔分类 (1290)

随笔档案 (215)

My

阅读排行榜

评论排行榜

推荐排行榜

最新评论

随笔分类 - --- My_原创