摘要:
vim test.cpp #include <unordered_map>#include <cstdio>#include <omp.h> int main(int argc, char *argv[]){ std::unordered_map<unsigned,std::string> map{ 阅读全文
摘要:
1. tar xvf new_project.tar.gz 2. cd new_project 3. git config --global user.email “user.name@...." 4. git config --global user.name "user.name" 5. git 阅读全文
摘要:
1. 下载fftw 2.tar -zxvf fftw.tar.gz 3. ./configure --prefix=path --enable-sse2 --enable-avx --enable-float --enable-shared 4. make 5 make install 阅读全文
摘要:
1, cuda-gdb 可执行文件 2. b 打断点 3. 进入核函数 把断点打在核函数中 4. r 5. cuda block 1 thread 1 选取线程 阅读全文
摘要:
编译选项: nvcc 4.cpp -o test_gemm -lcudart -lcuda -lcublas -std=c++11 #include <sys/time.h> #include <cuda_profiler_api.h> #include <cublas_v2.h> #include 阅读全文
摘要:
统计一个数组中重复的数字的个数:https://www.codenong.com/7573900/ 阅读全文
摘要:
1. Cuda中的thrust库的使用 cuda的thrust的官方文档地址:https://docs.nvidia.com/cuda/thrust/ Thrust 是一个类似STL的 CUDA C++ 模板库 Thrust是并行算法和数据结构的基于GPU CUDA的C++库。Thrust主要通过管 阅读全文
摘要:
基于OpenACC的太湖之光硅晶体加速分子动力学模拟 2020 摘要:以SW26010异构多核处理器和扩展的编程模型,使用多体势(Tersoff)执行固体共价晶体的分子动力学(MD)模拟。 Amdahl定律:当我们对系统的某个部分加速时,其对系统整体性能的影响取决于该部分的重要性和加速程度。 实现两 阅读全文