news 2026/6/5 23:47:31

Day42Dataset和Dataloader

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Day42Dataset和Dataloader

1.Dataset类:“存数据的容器”

你可以把它理解成一个数据盒子,里面装着你的数据集(比如图片、标签)。要让这个 “盒子” 能用,得给它加两个 “功能按钮”(Python 的特殊方法):

  • __getitem__(self, idx):按索引idx取数据(比如dataset[0]就能拿到第 1 个样本)。
  • __len__(self):返回数据集的总样本数(比如len(dataset)知道一共有多少数据)。

2.DataLoader类:“给模型端菜的服务员”

Dataset是 “装菜的盘子”,DataLoader就是 “把菜分成小份、端给模型吃” 的人。它的作用是:

  • Dataset里的数据分成批次(比如一次给模型喂 32 个样本,而不是全塞进去)。
  • 支持打乱数据(避免模型学 “顺序” 而不是 “规律”)。
  • 支持多线程加载(加快数据读取速度)。

3. MNIST 手写数据集

这是一个 “手写数字图片集”,里面是 0-9 的手写数字(每张图是 28x28 的黑白色),是深度学习入门常用的 “练习数据集”。

作业:获取 CIFAR 数据集的一张图片

import torch from torchvision import datasets, transforms import matplotlib.pyplot as plt # 1. 加载CIFAR数据集(自动下载到本地) transform = transforms.ToTensor() # 把图片转成PyTorch能处理的格式 cifar_dataset = datasets.CIFAR10(root='./data', train=True, download=True, transform=transform) # 2. 取第1张图和它的标签 img, label = cifar_dataset[0] # 用Dataset的__getitem__取数据 # 3. 显示图片 plt.imshow(img.permute(1, 2, 0)) # 调整格式(PyTorch是[通道,高,宽],plt需要[高,宽,通道]) plt.title(f"Label: {label}") # 显示标签(CIFAR10的标签是0-9,对应不同类别) plt.show()

@浙大疏锦行

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/4 23:46:41

终极GeneFace环境搭建指南:从零开始快速部署

终极GeneFace环境搭建指南:从零开始快速部署 【免费下载链接】GeneFace GeneFace: Generalized and High-Fidelity 3D Talking Face Synthesis; ICLR 2023; Official code 项目地址: https://gitcode.com/gh_mirrors/ge/GeneFace GeneFace是一个基于3D人脸建…

作者头像 李华
网站建设 2026/6/4 21:19:40

diffusers-ct_cat256:快速生成高清猫咪图像的一致性模型

diffusers-ct_cat256:快速生成高清猫咪图像的一致性模型 【免费下载链接】diffusers-ct_cat256 项目地址: https://ai.gitcode.com/hf_mirrors/openai/diffusers-ct_cat256 导语:OpenAI开源的diffusers-ct_cat256模型凭借一致性模型(…

作者头像 李华
网站建设 2026/6/5 5:54:10

Qwen3-1.7B:单模型双模式推理新突破

Qwen3-1.7B作为Qwen系列最新一代大语言模型,首次实现单模型内无缝切换思考模式与非思考模式,在17亿参数规模下达成推理能力与运行效率的双重优化。 【免费下载链接】Qwen3-1.7B Qwen3-1.7B具有以下特点: 类型:因果语言模型 训练阶…

作者头像 李华
网站建设 2026/6/4 17:42:00

闪烁之光刑天版 无限代金券买断

闪烁之光刑天版 卡牌回合 无限代金券 手游内购买断GM后台道具超爽霸榜 领礼包 开新区 送99万代金券

作者头像 李华
网站建设 2026/6/4 12:13:24

Langchain-Chatchat相似问法生成技术应用探索

Langchain-Chatchat相似问法生成技术应用探索 在企业构建智能问答系统的过程中,一个常见的尴尬场景是:员工明明知道知识库里有答案,却怎么也搜不到。输入“报销单怎么填?”返回空结果,换成“费用报销流程是什么&#x…

作者头像 李华