使用pytorch实现HWC转CHW分析

使用pytorch实现HWC转CHW分析

import torch

import numpy as np

from torchvision.transforms import ToTensor

t = torch.tensor(np.arange(24).reshape(2,4,3))

print(t)

#HWC 转CHW

print(t.transpose(0,2).transpose(1,2))

print(t.permute(2,0,1))

print(ToTensor()(t.numpy()))

D:\anaconda\python.exe C:/Users/liuxinyu/Desktop/pytorch_test/day3/hwc转chw.py
tensor([[[ 0, 1, 2],
[ 3, 4, 5],
[ 6, 7, 8],
[ 9, 10, 11]],

[[12, 13, 14],
[15, 16, 17],
[18, 19, 20],
[21, 22, 23]]], dtype=torch.int32)
tensor([[[ 0, 3, 6, 9],
[12, 15, 18, 21]],

[[ 1, 4, 7, 10],
[13, 16, 19, 22]],

[[ 2, 5, 8, 11],
[14, 17, 20, 23]]], dtype=torch.int32)
tensor([[[ 0, 3, 6, 9],
[12, 15, 18, 21]],

[[ 1, 4, 7, 10],
[13, 16, 19, 22]],

[[ 2, 5, 8, 11],
[14, 17, 20, 23]]], dtype=torch.int32)
tensor([[[ 0, 3, 6, 9],
[12, 15, 18, 21]],

[[ 1, 4, 7, 10],
[13, 16, 19, 22]],

[[ 2, 5, 8, 11],
[14, 17, 20, 23]]], dtype=torch.int32)

Process finished with exit code 0

补充:opencv python 把图(cv2下)BGR转RGB,且HWC转CHW

如下所示:

img = cv2.imread("001.jpg")

img_ = img[:,:,::-1].transpose((2,0,1))

① 在opencv里,图格式HWC,其余都是CHW,故transpose((2,0,1))

② img[:,:,::-1]对应H、W、C,彩图是3通道,即C是3层。opencv里对应BGR,故通过C通道的 ::-1 就是把BGR转为RGB

注: [::-1] 代表顺序相反操作

③ 若不涉及C通道的BGR转RGB,如Img[:,:,0]代表B通道,也就是蓝色分量图像;Img[:,:,1]代表G通道,也就是绿色分量图像;

Img[:,:,2]代表R通道,也就是红色分量图像。

补充:python opencv 中将图像由BGR转换为CHW用于后期的深度训练

BGR HWC -> CHW 12 -> HCW 01 -> CHW

import cv2 as cv

import  numpy as np

img = cv.imread("lenna.png")

#BGR HWC -> CHW  12 -> HCW 01 -> CHW

transform_img = img.swapaxes(1,2).swapaxes(0,1)

print(img.shape)

print(transform_img.shape)

cv.imshow("image0 ",transform_img[0])

cv.imshow("image1",transform_img[1])

cv.imshow("image2",transform_img[2])

cv.waitKey(0)

cv.destroyAllWindows()

以上为个人经验,希望能给大家一个参考,也希望大家多多支持服务器之家。

参考文献链接

Opencv读取图片HWC转CHW

在读取图片时,一般可采取PIL或cv2实现,但是二者读取得到的数据格式有些不同。

对于给定的RGB图片,当使用PIL加载图片时,可将其直接转换为[C,H,W]的tensor,并且此时格式为RGB。

img = torch.ByteTensor(torch.ByteStorage.from_buffer(img.tobytes()))

当采用cv2读取图片时,不同之处有两点:

读取的维度为[H,W,C];

颜色通道为BGR,而不是RGB。

因此,在PIL和CV2读取图片间进行转换时,需要同时注意维度和RGB通道。

具体地,将HxWxC转换为CxHxW:

通过transpose()实现,分别img.transpose(0,1)和img.transpose(0,2)即可;

也可直接使用permute(),即img.permute(2,0,1)

此外,若设计BGR转RGB,则首先需要对通道进行逆序,通过下面命令实现。

img = img[::-1,:,:]

 

 

 

参考文献链接                    

http://www.zzvips.com/article/205586.html

https://blog.csdn.net/u010970956/article/details/104338072

https://blog.csdn.net/qq_32925101/article/details/125173277

 

posted @   吴建明wujianming  阅读(149)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
历史上的今天:
2023-06-13 clang前端基础系统概要
2023-06-13 LLVM外部项目清单介绍
2023-06-13 编译和安装LLVM整个流程
2022-06-13 云边端与边缘计算技术
2021-06-13 芯片面积大小
2021-06-13 光刻技术发展
2021-06-13 关于TVM的点滴记录
点击右上角即可分享
微信分享提示