pytorch11——pytorch生态
Pytorch是一个十分强大的深度学习领域框架,Pytorch的强大并不仅局限于自身的易用性,更在于开源社区围绕Pytorch所产生的一系列工具包(一般是Python package)和程序,这些强大的工具包极大的方便了Pytorch在特定领域的使用。比如对于计算机视觉,有TorchVision、TorchViedo等用于图片和视频处理;对于自然语言处理,有torchtext;对于图卷积网络,有Pytorch Geometric......。这里只是举例,每个领域还有很多优秀的工具包供社区使用。这些工具包共同构成了PyTorch的生态(EcoSystem)。
1|01.torchvison
PyTorch之所以会在短短的几年时间里发展成为主流的深度学习框架,除了本身框架的优势之外,还在于有良好的生态圈。
1|11.1torchvision简介
torchvison包含了在计算机视觉中常常用到的数据集,模型和图像处理的方式,而具体的torchvision则包括了下面这几部分,带*****的部分是我们经常会使用到的一些库,所以在下面的部分我们对这些库进行一个简单的介绍:
- torchvision.datasets*
- torchvision.models*
- torchvision.transforms*
- torchvision.io
- torchvision.ops
- torchvision.utils
1|21.2torchvision.datasets
torchvision.datasets主要包含了一些我们在计算机视觉中常见的数据集,在0.10.0版本的torchvision下,有以下的数据集:
1|31.3 torchvision.transforms
我们知道在计算机视觉中处理的数据集有很大一部分都是图片类型的,如果获取的数据是格式或者大小不一的图片,则需要进行归一化和大小缩放等操作,这些是常用的数据预处理方法。除此之外,当图片数据有限时,可以进行数据增强来扩充数据集。而torchvision.transforms中就包含了许多这样的操作。之前第四章的Fashion-mnist实战中的数据的处理时我们就用到了torchvision.transformer:
1|41.4 torchvision.models
为了提高训练效率,减少不必要的重复劳动,Pytorch官方也提供了一些预训练好的模型供我们使用。现有的预训练好的模型可以分为以下几类:
-
Classfication
在图像分类里面,Pytorch官方提供了以下模型,并在不断增多。
这些模型都是在ImageNet-1k进行预训练好的。 -
Semantic Segmentation
语义分割的预训练模型是在COCO train2017的子集上进行训练的,提供了二十个类别,包括background, aeroplane, bicycle, bird, boat, bottle, bus, car, cat, chair, cow, diningtable, dog, horse, motorbike, person, pottedplant, sheep, sofa,train, tvmonitor。
-
Object Detection,instance Segmentation and Keypoint Detection
物体检测,实例分割和人体关键点检测的模型我们同样是在COCO train2017进行训练的,在下方我们提供了实例分割的类别和人体关键点检测类别:
- video classfication
视频分类模型实在Kinetics-400上进行预训练的。
1|51.5 torchvision.io
torchvision.io提供了视频、图片、文件的io操作功能,包括读写,编解码等处理操作。
1|61.6 torchvision.ops
提供了许多计算机视觉的特定操作,避免重复造轮子
1|71.7 torchvision.utils
提供了一些可视化方法。
2|0总结:
torchvision的出现帮助我们解决了常见的计算机视觉中一些重复且耗时的工作,并在数据集的获取,数据增强,模型预训练等方面大大降低了我们工作难度。
__EOF__
本文链接:https://www.cnblogs.com/tccjx/articles/16043647.html
关于博主:评论和私信会在第一时间回复。或者直接私信我。
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!
声援博主:如果您觉得文章对您有帮助,可以点击文章右下角【推荐】一下。您的鼓励是博主的最大动力!
本文来自博客园,作者:TCcjx,转载请注明原文链接:https://www.cnblogs.com/tccjx/articles/16043647.html
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 如何调用 DeepSeek 的自然语言处理 API 接口并集成到在线客服系统
· 【译】Visual Studio 中新的强大生产力特性
· 2025年我用 Compose 写了一个 Todo App