news 2026/6/5 20:17:57

将基于 YOLOv8 进行模型训练使用 FLIR 数据集 如何训练配对的红外可见光行人车辆目标检测数据集 建立深度学习红外可见光车辆行人检测系统 推理识别检测 行人 车辆

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
将基于 YOLOv8 进行模型训练使用 FLIR 数据集 如何训练配对的红外可见光行人车辆目标检测数据集 建立深度学习红外可见光车辆行人检测系统 推理识别检测 行人 车辆

将基于 YOLOv8 进行模型训练使用 FLIR 数据集 如何训练配对的红外可见光行人车辆目标检测数据集 建立深度学习红外可见光车辆行人检测系统 推理识别检测 行人 车辆

文章目录

      • 一、环境搭建
        • 1. 安装 CUDA 驱动和 Anaconda
        • 2. 创建 Python 虚拟环境
        • 3. 安装 PyTorch 和其他依赖
      • 二、数据准备
      • 三、模型训练
        • 1. 加载预训练模型
        • 2. 开始训练
      • 四、模型推理
        • 1. 推理单张图片
        • 2. 批量推理
      • 五、模型评估

以下文字及代码仅供参考学习使用。

数据集描述:

FLIR配对行人车辆目标检测数据集,10400+张

数据集包含3个类别,为pedestrian,bicycle,car,jpg图片和txt标签

1

使用 FLIR 数据集进行行人、自行车和汽车的目标检测任务,将基于 YOLOv8 进行模型训练、推理及评估。以下将详细介绍如何设置环境、准备数据、训练模型以及进行推理和评估。

一、环境搭建

1. 安装 CUDA 驱动和 Anaconda

确保系统已经安装了 CUDA 驱动,并且可以通过命令nvidia-smi查看 GPU 信息。

下载并安装 Anaconda 来管理 Python 环境。

2. 创建 Python 虚拟环境

打开终端或 Anaconda Prompt:

# 创建名为 flir_yolo 的环境conda create-nflir_yolopython=3.8# 激活环境conda activate flir_yolo
3. 安装 PyTorch 和其他依赖

根据 CUDA 版本选择合适的 PyTorch 安装命令:

pipinstalltorch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117 pipinstallultralytics opencv-python matplotlib numpy tqdm tensorboard scikit-learn

验证是否成功:

python-c"import torch; print(torch.cuda.is_available())"

应输出True

二、数据准备

假设数据集结构如下:

flir_dataset/ ├── images/ │ ├── train/ │ └── val/ └── labels/ ├── train/ └── val/ └── data.yaml

创建一个data.yaml文件来描述数据集的路径和类别信息:

# data.yamltrain:./flir_dataset/images/trainval:./flir_dataset/images/valnc:3names:['pedestrian','bicycle','car']

确保每个子文件夹内的图像和标签文件名一一对应,且已经按照trainval分割好。

三、模型训练

1. 加载预训练模型

从 Ultralytics 加载 YOLOv8 的一个预训练模型作为起点:

fromultralyticsimportYOLO model=YOLO('yolov8s.pt')# 或者选择其他尺寸的模型
2. 开始训练

使用您的数据集对模型进行微调:

results=model.train(data='path/to/data.yaml',# 替换为您的 data.yaml 文件路径epochs=100,# 根据需要调整batch=16,# 调整以适应 GPU 内存imgsz=640,# 图像大小project='runs/detect/flir',name='yolov8s_flir')

四、模型推理

1. 推理单张图片

加载训练好的模型并对新图像进行预测:

fromultralyticsimportYOLOimportcv2fromPILimportImage model=YOLO('runs/detect/flir/yolov8s_flir/weights/best.pt')results=model('path/to/new_image.jpg')# 显示结果forrinresults:im_array=r.plot()# 绘制边界框和标签im=Image.fromarray(im_array[...,::-1])# RGB PIL imageim.show()
2. 批量推理

编写脚本来遍历整个文件夹中的所有图像,并应用上述推理步骤。简单的批量推理示例:仅供参考

importos source_dir='path/to/test_images'# 测试图像所在目录output_dir='runs/detect/output'os.makedirs(output_dir,exist_ok=True)forfilenameinos.listdir(source_dir):iffilename.endswith('.jpg')orfilename.endswith('.png'):img_path=os.path.join(source_dir,filename)results=model(img_path)forrinresults:im_array=r.plot()im=Image.fromarray(im_array[...,::-1])output_path=os.path.join(output_dir,filename)im.save(output_path)print(f"Saved{output_path}")

五、模型评估

在验证集上评估模型性能:

metrics=model.val(data='path/to/data.yaml',split='val')print(f"mAP50:{metrics.box.map50:.4f}")print(f"mAP50-95:{metrics.box.map:.4f}")

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/5 20:17:52

深度解密:5大实战技巧高效掌握Unity IL2CPP逆向工程

深度解密:5大实战技巧高效掌握Unity IL2CPP逆向工程 【免费下载链接】Il2CppDumper Unity il2cpp reverse engineer 项目地址: https://gitcode.com/gh_mirrors/il/Il2CppDumper 还在为Unity手游的IL2CPP编译代码感到困惑?想要深入分析热门手游的…

作者头像 李华
网站建设 2026/6/5 20:17:18

Translumo:打破语言障碍的实时屏幕翻译神器,3分钟上手指南

Translumo:打破语言障碍的实时屏幕翻译神器,3分钟上手指南 【免费下载链接】Translumo Advanced real-time screen translator for games, hardcoded subtitles in videos, static text and etc. 项目地址: https://gitcode.com/gh_mirrors/tr/Translu…

作者头像 李华
网站建设 2026/6/5 20:14:56

ROS 2 pre-release binaries 安全接入与生产级验证指南

1. 项目概述:为什么你该认真对待 pre-release binaries 测试这件事我第一次在 ROS 2 项目里踩进 pre-release 二进制包的坑,是在一个紧急交付前四十八小时。客户现场反馈某个自定义驱动节点在新发布的 Jazzy 版本上偶发崩溃,而我们本地复现环…

作者头像 李华
网站建设 2026/6/5 20:09:09

ComfyUI Essentials完整指南:5个实用技巧解决AI图像处理难题

ComfyUI Essentials完整指南:5个实用技巧解决AI图像处理难题 【免费下载链接】ComfyUI_essentials 项目地址: https://gitcode.com/gh_mirrors/co/ComfyUI_essentials 如果你正在使用ComfyUI进行AI图像创作,可能会发现一些基础但重要的功能在核心…

作者头像 李华
网站建设 2026/6/5 20:05:01

文心5.0 Preview深度解析:长文档理解与复杂指令处理技术突破

1. 项目概述:这不是一次普通升级,而是一次文本理解能力的代际跃迁“全球第二、国内第一!最强文本的文心5.0 Preview一手实测来了”——这个标题里藏着三个关键信号:排名锚定、能力定位、时效优先。它不是在说“又一个新版本”&…

作者头像 李华