01 2015 档案
摘要:MIC性能优化主要包括系统级和内核级:系统级优化包括节点之间,CPU与MIC之间的负载均衡优化;MIC内存空间优化;计算与IO并行优化;IO与IO并行优化;数据传递优化;网络性能优化;硬盘性能优化等。内核级优化包括并行度优化;负载均衡优化;进程/线程的同步优化;线程扩展优化;向量化优化;cache优...
阅读全文
摘要:MIC中offload的用法如下:#pragma offload specifier [,specifier...]specifier可以填入的选项为:target 例:taget(mic:0)if 例:if(N>100)in 例:in(p:length(LEN) alloc_if(...
阅读全文
摘要:给定n个数{1...n},如何给出这n个数的全排列呢?给定一个整数k,我们给它一个向左或向右的方向,k(->)或者k()6(->)3(->)1()4(->)那么只有3,5,6是可以移动的。全排列的算法如下:从1(m的p,改变所有p的箭头方向例如当n=3时:1()2()1()
阅读全文
摘要:关于signal和wait,属于异步传输的语法,即CPU端无需等待offload语句返回,即可异步运行下面的代码。一般用于启动MIC代码段后,并发执行CPU代码,达到同步执行的目的。另外一种用法是使用offload_transfer和offload_wait语句,这两个语句与offload类似,但只...
阅读全文
摘要:下面是线程池的类,下面是threadpool.h文件 1 /* 2 * threadpool.h 3 * 4 * Created on: 2015年1月8日 5 * Author: xk 6 */ 7 8 #ifndef THREADPOOL_THREADPOOL_H_ 9 ...
阅读全文
摘要:先看一段代码,如下 1 #include 2 #include 3 #define LEN 5 4 int main(int argc,char** argv){ 5 int i; 6 float x=2; 7 float arr[LEN]; 8 #pragma of...
阅读全文
摘要:c++/c使用__declspec(target(mic))函数或变量声明或__attribute__((target(mic)))函数或变量声明举例如下:__attribute__((target(mic))) int a;__attribute__((target(mic))) void fun...
阅读全文
摘要:mic中编程十分简单,只需在普通程序中简单加几句就可以,使用lspci|grep -i -co-processor 命令可以查看机器中是否插入MIC卡以及MIC卡的数目,MIC编程环境的配置这里就不讲了,下面是一个示例程序, 1 #include 2 #include 3 #include 4 in...
阅读全文