news 2026/5/26 8:55:48

原始数据—>张量转换后会丢失原始数据吗

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
原始数据—>张量转换后会丢失原始数据吗

学习李沐香蕉目标检测时疑问

原始数据 → 张量的转换链路(全程可回溯):

1. 图像原始数据的转换链路
硬盘上的.png文件(原始数据) ↓ 由torchvision.io.read_image读取 单个图像张量(uint8,[C,H,W])→ 存入images列表 ↓ 在BananasDataset的__getitem__中 转为float32张量(模型可训练)

张量和原始图片是一一对应的数值映射

比如原始图片中 (100,200) 像素的 RGB 值是 (255,0,0),张量中img[0,100,200]=255(R 通道)、img[1,100,200]=0(G 通道)、img[2,100,200]=0(B 通道)。

若要还原为 “可视化的原始图片”,只需将张量转格式即可:

# 从images列表中取第一个图像张量(还原原始图片) img_tensor = train_dataset.features[0] # uint8张量,[3,H,W] # 步骤1:转置为[H,W,C](Matplotlib可视化格式) img_np = img_tensor.permute(1,2,0).numpy() # 步骤2:显示原始图片(和硬盘上的.png文件完全一致) d2l.plt.imshow(img_np)
2. 标签原始数据的转换链路
CSV文本文件(原始标注:img_name,label,xmin,ymin,xmax,ymax) ↓ 由pd.read_csv读取为DataFrame(文本→数字) ↓ 转为list(target)([0,100,80,200,180]) ↓ torch.tensor(targets).unsqueeze(1) 标签张量(float32,[N,1,5])

张量中的数值就是 CSV 里的原始数字(只是维度适配),比如张量labels[0] = [[0,100,80,200,180]],对应 CSV 中00001.png的标注:label=0, xmin=100, ymin=80, xmax=200, ymax=180

若要还原为 “原始 CSV 格式”,只需将张量转回 DataFrame:

# 从标签张量还原原始标注 labels_np = train_dataset.labels.squeeze(1).numpy() # [N,5] csv_raw = pd.DataFrame( labels_np, columns=['label','xmin','ymin','xmax','ymax'] ) # 添加img_name列(从CSV中读取的原始图像名) csv_raw['img_name'] = csv_data.index print(csv_raw) # 和原始CSV文件内容完全一致

为什么代码不返回 “原始数据”(文件 / 文本)?

PyTorch 模型训练的核心是数值计算,原始的.png 文件(二进制)、CSV 文本(字符串)无法直接输入模型 —— 必须转为张量(数值矩阵):

  1. 图像张量:是原始图片像素的数值化表示,可参与梯度计算、卷积等操作;
  2. 标签张量:是原始标注的数值化表示,可用于计算损失(如边界框回归损失)。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/26 7:34:26

分享一次来自奇安信的面试经历

前言 本文主要分享我的网络安全岗位面试经历,希望对准备求职的同学有所帮助。先简单说下面试前的背景:2023年3月入职奇安信集团安全研究岗,主攻渗透测试方向。 篇幅可能稍长,大家多包涵哈。 简历 我的简历用Markdown编写&…

作者头像 李华
网站建设 2026/5/25 17:42:01

Qwen-Image低显存部署与中文海报生成

Qwen-Image低显存部署与中文海报生成:从模型镜像到专业级视觉创作实战 你有没有遇到过这样的场景?客户发来一条需求:“做个端午节活动海报,要有‘端午安康’四个字,风格传统一点,还得带点现代感。” 于是你…

作者头像 李华
网站建设 2026/5/26 4:08:52

开源项目版本管理终极指南:告别分支混乱与代码冲突

开源项目版本管理终极指南:告别分支混乱与代码冲突 【免费下载链接】qmk_firmware Open-source keyboard firmware for Atmel AVR and Arm USB families 项目地址: https://gitcode.com/GitHub_Trending/qm/qmk_firmware 你是否曾在深夜调试代码时&#xff0…

作者头像 李华
网站建设 2026/5/25 16:11:20

露,机能实验室整体解决方案 行为学实验室整体解决方案 动物行为学整体解决方案 人体生理实验整体解决方案

在医学教育中引入生理实验,有助于打破临床与基础阶段的早期壁垒:学生通过亲身参与相互性自身实验,深化对基础实验意义的认知,同时积累临床诊断的直观感受,安徽,正华,生物动物行为实验站属于综合…

作者头像 李华
网站建设 2026/5/26 6:01:27

GPON OLT 和 EPON OLT 刚入门怎么选?

对于很多小白来说,不从事光模块行业,不了解GPON OLT 和 EPON OLT光模块的不同到底在哪里,更不知道怎么去选择更合适自己的产品,但新项目测试急需确定,怎么根据项目需求进行选择呢?项目催的急,选…

作者头像 李华