会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Wangtn
博客园
首页
新随笔
联系
订阅
管理
1
2
3
4
5
···
21
下一页
2025年5月7日
inline解决重定义问题
摘要: 项目中在一个头文件加了一个cuda kernel,然后出现了重定义问题,头文件中的其他kernel都没有重定义,只有我加的有这个问题。 发现其他kernel是模板函数默认是inline的,非模板函数需要手动加一下inline,inline解决重定义问题的具体原因如下 在 C++ 中,头文件中定义的函
阅读全文
posted @ 2025-05-07 10:49 Wangtn
阅读(23)
评论(0)
推荐(0)
2024年2月19日
编译期循环执行的代码
摘要: 使用模板元编程进行递归编写,来实现编译期代码循环执行 例:给定一个无符号整数(unsigned int),求该整数对应的二进制数中有几个1 #include <iostream> template <size_t input> constexpr size_t onesCount = (input
阅读全文
posted @ 2024-02-19 22:37 Wangtn
阅读(15)
评论(0)
推荐(0)
2023年12月11日
关于类和结构体中的const
摘要: 一个const类型的类是无法调用非const类型的成员函数的,因此stl容器中类的成员函数都会有const的重载版本,因为不清楚用户会初始化const的类实例还是非const的类实例。 如下就是一个非法代码 #include <iostream> struct DataType{ int _m_pu
阅读全文
posted @ 2023-12-11 11:00 Wangtn
阅读(54)
评论(0)
推荐(0)
2023年10月25日
cuda vectorized实现矩阵转置
摘要: 使用了共享内存和向量化传输,目前为止效果最好的一个实现 __global__ void transposeSmemVec(float* input, float* output, const int X, const int Y){ __shared__ float smem[32 * 4 * 32
阅读全文
posted @ 2023-10-25 10:52 Wangtn
阅读(93)
评论(0)
推荐(0)
2023年10月18日
onnx子图修改与动态静态转化
摘要: 子图修改 import onnx import onnx_graphsurgeon as gs import onnxruntime as ort import numpy as np def cut_subgraph(origin_graph_path, input_node_name_list,
阅读全文
posted @ 2023-10-18 13:56 Wangtn
阅读(1217)
评论(0)
推荐(0)
2023年7月4日
markdown语法
摘要: # 一级标题 ## 二级标题 ### 三级标题 **粗体内容1** __粗体内容2__ *斜体内容1* _斜体内容2_ ***斜粗体内容1*** ___斜粗体内容2___ ~~删除线~~ 分段 > 引用1 >>引用2 * 列表项1 * 子项 * 子项 * 列表项2 * 列表项3 1. 列表项1 1.
阅读全文
posted @ 2023-07-04 14:52 Wangtn
阅读(9)
评论(0)
推荐(0)
2023年6月20日
堆
摘要: 堆是一种二叉树结构 1.堆是一个完全二叉树(从上到下,从左到右依次填满) 2.堆中的每一个节点都要大于等于他的孩子节点(最大堆)或者小于等于他的孩子节点(最小堆) 最大堆的堆顶元素是他的最大值,最小堆的堆顶元素是他的最小值 访问(堆里面不通过索引访问) 搜索O(1)一般只查看堆顶元素 添加O(log
阅读全文
posted @ 2023-06-20 14:16 Wangtn
阅读(47)
评论(0)
推荐(0)
2023年6月17日
树
摘要: 没有孩子的节点是叶子节点 树的高度是从下往上算的,叶子结点的高度是0,根节点的高度最大 树的深度是从上往下算的,根节点的深度是0,叶子结点的深度最大 层是从上往下看的,根节点是第一层,越往下层数越多 满二叉树:除了叶子节点每个节点都有两个孩子 完全二叉树:从树的根节点从上到下,从左到右依次填满节点形
阅读全文
posted @ 2023-06-17 20:15 Wangtn
阅读(31)
评论(0)
推荐(0)
2023年6月15日
哈希表
摘要: 哈希表 = 散列表 key:value 键值对 python的哈希表就是字典,c++是std::map 哈希碰撞:两个不同的key通过同一个哈希函数得到了相同的内存地址 哈希表中不存在访问 搜索O(1)如果发生哈希碰撞他的时间复杂度就是O(K)k是碰撞的元素个数 插入O(1) 删除O(1) 常用操作
阅读全文
posted @ 2023-06-15 22:33 Wangtn
阅读(26)
评论(0)
推荐(0)
栈
摘要: 栈的访问时间复杂度O(1) 搜索时间复杂度O(N) 插入删除的时间复杂度是O(1) 常见操作: 1.创建栈 2.添加元素 3.查找栈顶元素-即将出栈的元素 4.删除栈顶元素-即将出栈的元素 5.栈的长度 6.栈是否为空 7.遍历栈(便删除栈顶元素,边遍历) 20 给定一个只包括 '(',')','{
阅读全文
posted @ 2023-06-15 21:32 Wangtn
阅读(27)
评论(0)
推荐(0)
1
2
3
4
5
···
21
下一页
公告