Pytorch常见指令

一、常见语句

参考：https://zhuanlan.zhihu.com/p/76255917

1、torch.cumsum

按dim逐级求和，积分操作

参考：https://blog.csdn.net/songxiaolingbaobao/article/details/114580364

2、torch.einsum

爱因斯坦求和

参考：https://zhuanlan.zhihu.com/p/434232512

3、DataLoader

有待仔细学习

数据流处理器

参考：https://blog.csdn.net/Chinesischguy/article/details/103198921

参数：
dataset 数据集，map-style and iterable-style 可以用index取值的对象、
batch_size 大小
shuffle 取batch是否随机取， 默认为False
sampler 定义取batch的方法，是一个迭代器， 每次生成一个key 用于读取dataset中的值
batch_sampler 也是一个迭代器， 每次生次一个batch_size的key
num_workers 参与工作的线程数
collate_fn 对取出的batch进行处理
drop_last 对最后不足batchsize的数据的处理方法

4、NearestNeighbors

参考：https://blog.csdn.net/weixin_37804469/article/details/106911125?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522164949000316782184673928%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=164949000316782184673928&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_ecpm_v1~hot_rank-1-106911125.nonecase&utm_term=NearestNeighbors&spm=1018.2226.3001.4450

5、torch.stack

可以拼接，也可以实现一个list的每个元素转化成整体的tensor

参考：https://blog.csdn.net/Z_lbj/article/details/85012764

6、nn.Parameter

将本来不训练的参数变得可训练，比如transformer里的class token

参考：https://blog.csdn.net/weixin_44966641/article/details/118730730

7、Norm

归一化的介绍：https://blog.csdn.net/u013289254/article/details/99690730

BN和LN的区别

两种LN的区别：https://www.codeleading.com/article/30465389894/

F.normalize：某一维度l2化：https://www.cxymm.net/article/lj2048/118115681

二、引用说明

1、opencv与ros冲突

opencv搜索问题

File "/home/xjh/packages/keras-yolo3/yolo.py", line 179, in detect_video

import cv2

ImportError: /opt/ros/kinetic/lib/python2.7/dist-packages/cv2.so: undefined symbol: PyCObject_Type

https://blog.csdn.net/qq_34544129/article/details/81946494 加入了PYTHONPATH没有用

然后强制删除路径，管用

import sys
sys.path.remove('/opt/ros/kinetic/lib/python2.7/dist-packages')

当然应该也可以注释掉./bashrc中的ros路径

三、Numpy问题

1、astype

将array的数据类型改变

如：

A = np.array([[1.2,2.2,3.2,4.2],[5.2,6.2,7.2,8.2]])
C = A.astype(int)

参考：https://blog.csdn.net/rouranling/article/details/123103744

附录：带解决的问题

1、cluster是那里来的？

2、为什么输入是二维的，两个一样的拼在一起？

四、过程优化

1、爆显存

参考：https://blog.csdn.net/qq_28660035/article/details/80688427?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-1.pc_relevant_paycolumn_v3&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-1.pc_relevant_paycolumn_v3&utm_relevant_index=2

本次使用方法为：在每个batch取出，训练开始前加入torch.cuda.empty_cache()，立马不爆显存！

2、timm model_ema

似乎是可以优化指标的ema方法

参考：https://zhuanlan.zhihu.com/p/68748778

3、Warm up

预热，可以缓解过拟合，LOSS容易NAN

参考：

https://blog.csdn.net/comway_Li/article/details/105016725

https://blog.csdn.net/u011995719/article/details/77884728

https://blog.csdn.net/sinat_36618660/article/details/99650804

5、结束后台进程
pkill python

4、不显示warning

import warnings
warnings.filterwarnings('ignore')
6、测试的时候爆显存

训练的时候反而没有，这是不正常的，参考：https://blog.csdn.net/zdluffy/article/details/104715510

with torch.no_grad(): # 加上这句
outputs = model.forward(data)

posted @ 2022-04-02 14:34 小咸鱼在看博客阅读(207) 评论(0) 编辑收藏举报

刷新页面返回顶部

小咸鱼在看博客园

你好，你也是咸鱼吗？