Wangtn

2023年6月14日

摘要：数组的内存空间是连续的，链表是不连续的链表分为单端链表和双端链表访问O（N）搜索O（N）插入O（1）删除O（1）写很快但是读很慢常用操作： 1.创建链表 2.添加元素 3.访问元素 4.查找元素 5.删除元素 6.链表的长度 203 给你一个链表的头节点 head 和一个整数 val 阅读全文

posted @ 2023-06-14 22:21 Wangtn 阅读(10) 评论(0) 推荐(0) 编辑

数组

摘要：数组指在连续内存空间中存储一组相同类型的元素数组通过索引实现访问 O（1）数组通过遍历整个数组来实现搜索 O（N）插入和删除的时间复杂度都是 O（N）特点是适合读不适合写 1.创建数组 2.添加元素 3.访问元素 4.修改元素 5.删除元素 6.遍历数组 7.查找元素 8.数组的长度 9.数阅读全文

posted @ 2023-06-14 21:59 Wangtn 阅读(5) 评论(0) 推荐(0) 编辑

2023年6月12日

This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.

摘要： tensors = pywrap_tfe.TFE_Py_Execute(ctx._handle, device_name, op_name,tensorflow.python.framework.errors_impl.UnknownError: Failed to get convolution 阅读全文

posted @ 2023-06-12 10:44 Wangtn 阅读(62) 评论(0) 推荐(0) 编辑

2023年3月31日

cuda原子操作进行直方图计算

摘要：首先在cpu上进行计算 #include <iostream> #include <chrono> #define DATA_LEN (100 * 1024 * 1024) inline int rnd(float x) { return static_cast<int>(x * rand() / 阅读全文

posted @ 2023-03-31 17:03 Wangtn 阅读(107) 评论(0) 推荐(0) 编辑

2023年3月28日

使用cuda常量内存进行性能优化

摘要：常量内存是在变量前面加上 __constant__，常量内存用于保存核函数执行期间不会发生变化的数据，NVIDIA向硬件提供了 64KB 的常量内存，在通常情况下，使用常量内存代替全局内存能有效的缩减内存带宽常量内存的赋值使用 cudaMemcpyToSymbol() 函数示例代码中我创建了一个阅读全文

posted @ 2023-03-28 18:11 Wangtn 阅读(952) 评论(0) 推荐(0) 编辑

tensorflow checkpoint转savedmodel

摘要： checkpoint文件结构 saved_model文件结构 import tensorflow as tf def convert_model(): trained_checkpoint_prefix = '/home/tiwang/code/jupyter-notebook/DIEN/dien/ 阅读全文

posted @ 2023-03-28 14:50 Wangtn 阅读(145) 评论(0) 推荐(0) 编辑

2023年3月20日

ubuntu20.04 安装TensorRT c++库

摘要：官方那个文档上有很多中安装方法，这里采用压缩包安装，解压后直接将lib和include文件配置在环境变量里就ok了，对于c++来说是最方便的首先下载TensorRT：https://developer.nvidia.com/tensorrt 注意安装TensorRT之前要事先装好cuda和cudn 阅读全文

posted @ 2023-03-20 14:46 Wangtn 阅读(1911) 评论(0) 推荐(0) 编辑

2023年3月8日

cmake编译cuda

摘要： cuda程序在教程中多是用nvcc来进行编译，但是实际项目中cuda程序往往是和c++混在一起的，所以用cmake编译会更方便 cmake目前可以较好的支持cuda编译，本文只列出其中一种方法，仅供参考 CMakeLists.txt cmake_minimum_required(VERSION 3. 阅读全文

posted @ 2023-03-08 08:57 Wangtn 阅读(515) 评论(0) 推荐(0) 编辑

2023年3月7日

cuda错误检查函数

摘要： cuda大部分库函数的返回值都是cudaError_t，所以可以用一个函数来接收其他库函数的返回值，从而判断该库函数是否正常执行这个函数可以用宏来实现 #define CHECK(call) \ do \ { \ const cudaError_t error_code = call; \ if 阅读全文

posted @ 2023-03-07 17:38 Wangtn 阅读(236) 评论(0) 推荐(0) 编辑

cuda获取硬件信息

摘要： int gpu_count = -1; cudaGetDeviceCount(&gpu_count); std::cout << "gpu count: " << gpu_count << std::endl; 多显卡环境中设置显卡 cudaSetDevice(0) 多显卡环境下当cuda运算结束后阅读全文

posted @ 2023-03-07 17:31 Wangtn 阅读(279) 评论(0) 推荐(0) 编辑

公告