news 2026/6/8 19:30:57

探索Transform的中不同参数的用法

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
探索Transform的中不同参数的用法

1问题

1,ToTensor:将PIL Image或numpy.ndarray转换为torch.FloatTensor,并将其归一化到[0.0, 1.0]范围内。

2,Normalize:将PIL Image或numpy.ndarray转换为torch.FloatTensor,并将其归一化到[-1.0, 1.0]范围内。

3,Resize:调整图像大小。

4,CenterCrop:将给定的PIL Image进行中心切割,得到给定的size。

5,Compose:将多个变换组合在一起。

6,RandomCrop:从图像中随机裁剪出一定大小的区域。

2 方法

数据转换:transforms.ToTensor()

ToTensor是transforms模块中的一个函数,用于将PIL Image或numpy.ndarray类型的数据转换为torch.FloatTensor类型。在Pytorch中,图像数据通常以PIL Image的形式存在,而模型训练时需要的数据格式为torch.FloatTensor

from torchvision import transforms # 创建一个ToTensor实例


to_tensor = transforms.ToTensor() # 对图像进行ToTensor转换
image = Image.open('example.jpg')
image_tensor = to_tensor(image)

数据归一化:transforms.Normalize()

Normalize是transforms模块中的一个函数,用于将PIL Image或numpy.ndarray类型的数据进行归一化处理。归一化是将数据缩放到一个特定的范围,通常是[0, 1]或[-1, 1]。在图像处理中,归一化可以使得不同尺度的图像具有相同的尺度,从而方便模型的训练和预测。

from torchvision import transforms # 创建一个Normalize实例,指定均值和标准差


normalize = transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) # 对图像进行Normalize转换
image = Image.open('example.jpg')
normalized_image = normalize(image)

调整图像大小transforms.Resize()

Resize是transforms模块中的一个函数,用于调整图像的大小。在图像处理中,我们需要将不同大小的图像输入到模型中进行训练和预测

from torchvision import transforms # 创建一个Resize实例,指定目标尺寸


resize = transforms.Resize((224, 224)) # 对图像进行Resize转换
image = Image.open('example.jpg')
resized_image = resize(image)

从图像中心裁剪出指定大小的区域transforms.CenterCrop()

CenterCrop是transforms模块中的一个函数,用于从图像中心裁剪出指定大小的区域。在图像处理中,我们需要将不同大小的图像输入到模型中进行训练和预测。因此,我们需要对图像进行大小调整,使其具有相同的尺寸。

from torchvision import transforms # 创建一个CenterCrop实例,指定目标尺寸


center_crop = transforms.CenterCrop((224, 224)) # 对图像进行CenterCrop转换
image=Image.open('example.jpg') center_cropped_image = center_crop(image)

对图像进行多种不同的操作:transforms.Compose()

Compose是transforms模块中的一个函数,用于将多个变换组合在一起。在图像处理中,我们可能需要对图像进行多种不同的操作,例如缩放、裁剪、旋转等

from torchvision import transforms # 创建一个Compose实例,指定多个变换操作


compose=transforms.Compose([ transforms.Resize((224, 224)),transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) ]) # 对图像进行Compose转换 image = Image.open('example.jpg')
composed_image = compose(image)

从图像中随机裁剪出指定大小的区域transforms.RandomCrop()

RandomCrop是transforms模块中的一个函数,用于从图像中随机裁剪出指定大小的区域

from torchvision import transforms # 创建一个RandomCrop实例,指定目标尺寸


random_crop = transforms.RandomCrop((224, 224)) # 对图像进行RandomCrop转换
image=Image.open('example.jpg') random_cropped_image = random_crop(image)

3结语

torchvision.trantransform是PyTorch中用于数据预处理的模块,它提供了多种常用的数据转换操作,如缩放、裁剪、旋转等。在图像处理中,我们通常需要将不同大小的图像输入到模型中进行训练和预测。因此,我们需要对图像进行大小调整,使其具有相同的尺寸。通过使用这些函数,我们可以方便地对图像进行预处理,使其符合模型的要求。例如,在ImageNet数据集上训练卷积神经网络时,我们需要将所有图像缩放到指定的大小(224x224),并进行归一化处理。这时,我们可以使用Compose函数将这些操作组合在一起,一次性完成所有的预处理操作。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/7 18:16:23

如何快速掌握OpenPLC Editor:面向初学者的完整指南

如何快速掌握OpenPLC Editor:面向初学者的完整指南 【免费下载链接】OpenPLC_Editor 项目地址: https://gitcode.com/gh_mirrors/ope/OpenPLC_Editor 在工业自动化领域,OpenPLC Editor作为一款符合IEC 61131-3标准的开源PLC编程工具,…

作者头像 李华
网站建设 2026/6/5 7:05:18

ustcthesis模板参考文献格式最新调整:完整配置指南

ustcthesis模板参考文献格式最新调整:完整配置指南 【免费下载链接】ustcthesis LaTeX template for USTC thesis 项目地址: https://gitcode.com/gh_mirrors/us/ustcthesis 中国科学技术大学本科论文模板(ustcthesis)近期对参考文献格式进行了重要更新&…

作者头像 李华
网站建设 2026/6/8 11:53:24

解锁ROG主板隐藏监控功能:T Sensor温度探头完整配置手册

解锁ROG主板隐藏监控功能:T Sensor温度探头完整配置手册 【免费下载链接】LibreHardwareMonitor Libre Hardware Monitor, home of the fork of Open Hardware Monitor 项目地址: https://gitcode.com/GitHub_Trending/li/LibreHardwareMonitor ROG STRIX X6…

作者头像 李华
网站建设 2026/6/7 18:50:22

终极跨平台歌词下载解决方案:ZonyLrcToolsX完整使用指南

终极跨平台歌词下载解决方案:ZonyLrcToolsX完整使用指南 【免费下载链接】ZonyLrcToolsX ZonyLrcToolsX 是一个能够方便地下载歌词的小软件。 项目地址: https://gitcode.com/gh_mirrors/zo/ZonyLrcToolsX 在当今数字音乐时代,拥有一款专业的歌词…

作者头像 李华
网站建设 2026/6/7 10:02:40

老虎证券Q3季报图解:营收1.75亿美元 同比增73% 净利5396万美元

雷递网 雷建平 12月12日老虎证券 (NASDAQ: TIGR,“UP Fintech”)日前发布截至2025年9月30日的财报。财报显示,老虎证券2025年前9个月营收为4.36亿美元,较上年同期的2.67亿美元增长63%;净利为1.26亿美元,上年…

作者头像 李华
网站建设 2026/6/8 6:15:23

五一视界通过上市聆讯:将成Physical AI第一股 商汤与摩尔线程加持

雷递网 雷建平 12月15日北京五一视界数字孪生科技股份有限公司(简称:“五一视界”,51WORLD)日前通过上市聆讯,准备在港交所上市。五一视界股东包括商汤与摩尔线程,摩尔线程是当下科创板当红炸子鸡&#xff…

作者头像 李华