上一页 1 2 3 4 5 6 7 ··· 41 下一页
摘要: 问题缘由: 因在docker容器中的linux系统输入nvcc 等命令都是有效的,但通过ssh连接到docker容器内,就存在该命令未找到等问题,查询资料得知,这是因为通过ssh连接docker容器后环境变量发生了变化, 修改方法: 解决方法:更改字段分隔符,使之仅仅遇到换行时分割 /etc/pro 阅读全文
posted @ 2023-06-08 22:49 牛犁heart 阅读(442) 评论(0) 推荐(1) 编辑
摘要: 解决方法:重新安装VSCode。 我一开始是在ubuntu商店下载的,结果上网查了了下,商店里的VSCode是阉割版的,想要输入中文就要重新安装。 安装流程:先删除再安装。 1.可以在商店里已安装界面下选择移除,或者 sudo snap remove code。删除后仍会保留已打开文件的记录,所以不 阅读全文
posted @ 2023-04-09 23:32 牛犁heart 阅读(369) 评论(0) 推荐(0) 编辑
摘要: 本节来了解下C++11 中关于条件变量(condition_variable) 的相关知识,这一部分的内容相信网上已经有了很多的分享,这里仅是对该部分内容学习的记录、总结。 条件变量(condition_variable) 条件变量是一种多线程的同步机制,它能够阻塞线程,直到某一条件满足。条件变量要 阅读全文
posted @ 2023-04-02 22:35 牛犁heart 阅读(194) 评论(0) 推荐(0) 编辑
摘要: TVM图级优化按照优化范围,可分为局部优化和全局优化 局部优化是TVM图级优化的重点,其中算子融合是AI编译器必不可少的优化方法。 算子融合核心思想就是将多个算子合并成一个内核,因而无需将中间结果写回全局内存,减少了中间变量的分配,也减少了片上缓存和片外存储之间的数据传输。 那算子融合也是有条件的, 阅读全文
posted @ 2023-03-27 00:13 牛犁heart 阅读(241) 评论(0) 推荐(0) 编辑
摘要: 虽然之前也依据tvm官方文档写过一篇关于TVM架构的博客,但总感觉属于一种身在此山中的感觉(偏向于TVM实现的各个模块),并没有一览众山小的即视感(对框架的整体理解)。 因此,今天再次请求出战... 华丽的分割线 首先呢,想先来介绍下常规编译器的结构和特征 常规的编译器通常是由前端(frontend 阅读全文
posted @ 2023-03-12 17:00 牛犁heart 阅读(969) 评论(0) 推荐(0) 编辑
摘要: 这是一篇科普文--关于thread_local关键字 首先,C++11之前并没有对并发进行任何的支持,C++11首次提供了以下的支持: 语言核心定义了一个内存模型,保证当更改"被两个不同线程使用"的两个object时,他们彼此独立,而引用thread_local关键字 标准库支持启动多线程,包括传递 阅读全文
posted @ 2023-03-07 23:39 牛犁heart 阅读(288) 评论(0) 推荐(0) 编辑
摘要: 好吧,承认是自己浅薄了 当被问起C++重载时,嘴角不自觉的微微上扬,然后脱口而出,C++重载的原则: 函数名相同,函数参数列表不同(类型、个数、顺序) 匹配原则1:严格匹配,找到再调用 匹配原则2:通过隐式类型转换寻求一个匹配,找到则调用 注:返回类型不构成重载条件 C++编译时多态也是由重载函数来 阅读全文
posted @ 2023-03-05 13:32 牛犁heart 阅读(356) 评论(0) 推荐(1) 编辑
摘要: 批量归一化(BN)如何实现?作用 实现过程: 计算训练阶段mini_batch数量激活函数前结果的均值和方差,然后对其进行归一化,最后对其进行放缩和平移。 作用: 可以使用更高的学习率进行优化 移除或使用较低的dropout 降低L2权重衰减系数 调整数据的分布,不考虑激活函数,它让没一层的输出归一 阅读全文
posted @ 2023-03-04 20:47 牛犁heart 阅读(50) 评论(0) 推荐(0) 编辑
摘要: TVM介绍 为解决深度学习框架和硬件后端适配问题,华盛顿大学的陈天奇等人提出了TVM. TVM是一个端到端的全栈编译器,包括统一的IR堆栈和自动代码生成方法,其主要功能是优化在CPU、GPU和其他定制AI芯片上执行的AI模型,通过自动转换计算图,实现计算模式的融合和内存利用率最大化,并优化数据布局, 阅读全文
posted @ 2023-02-19 21:49 牛犁heart 阅读(191) 评论(0) 推荐(0) 编辑
摘要: 函数的调用其实是函数的入栈出栈操作,但当程序栈因程序的错误导致破坏了栈,这时候就会导致gdb解析core文件时解析不出来的情况,即是问号(?) 那还能做点什么呢? 可以通过打印$rbp$和$rsp$的值得到最后调用栈的栈底和栈顶。 (gdb) p $rbp $40 = (void *) 0x7fff 阅读全文
posted @ 2023-02-16 23:48 牛犁heart 阅读(865) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 41 下一页