news 2026/6/12 15:12:39

AMD Hello-ROCm 学习活动笔记-第一天部署和运行Gemma4大模型

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AMD Hello-ROCm 学习活动笔记-第一天部署和运行Gemma4大模型

题记

在Datawhale微信公众号上看到6月有关大模型专题学习,其中AMD中文教程:Hello-ROCm,正好近来空闲时间比较多,可以利用这个机会,深入实操有关大模型的微调相关的事宜,深入理解数据处理、训练、效果对比。

第一天部署和运行Gemma4大模型实操记录

第一天属于入门体验。没有什么特别的内容,主要是环境的部署和Gemma4的运行。基本上是按照教程一路走下来。现在在云上部署确实方便很多。

云环境简介

这次的Datawhale组织的AMD Hello-ROCm组队学习环境是AMD 云环境平台的算力资源+魔搭,需要注册这2网站的账号,登陆后可以兑换100小时的算力。

自己的实操记录

由于是按照教程照猫画虎,一步一步操作下来的,没有什么特别的。简单记录一下自己的操作结果。

1、检查当前 GPU 是否可用
在终端执行amd-smi命令。环境执行结果

2、确认 PyTorch 能识别 AMD GPU
在终端执行python -c "import torch; print('PyTorch:', torch.__version__); print('ROCm available:', torch.cuda.is_available()); print('Device:', torch.cuda.get_device_name(0) if torch.cuda.is_available() else 'N/A')",执行结果如下:

3、下载 Gemma4 模型
3.1 提升国内环境下的依赖下载速度,先把 pip 源切换到腾讯云镜像
在终端执行pip config set global.index-url https://mirrors.cloud.tencent.com/pypi/simple/,执行结果如下:

3.2 安装魔搭ModelScope
在终端执行pip install modelscope,执行结果如下:

3.3 下载 Gemma4 模型到当前目录
在终端执行modelscope download --model google/gemma-4-E4B-it --cache_dir "./models,执行结果如下:

需要注意的是,实际执行的结果和教程给示例有出入,不一定会在终端看到**100%**的字样,只要能看到终端的命令行提示符,就代表安装成功。

3.4 确认 Gemma4 模型模型文件完整下载成功
在终端执行ls -lh ./models/google/gemma-4-E4B-it/,执行结果如下:

  1. 启动 vLLM 服务
    4.1 在终端执行
uv pip uninstall torchvision# 经测试,在该云环境中,需卸载重新安装这个库才能正常使用uv pipinstallvllm torchvision\--no-cache\--index-url https://mirrors.aliyun.com/pypi/simple/\--extra-index-url https://wheels.vllm.ai/rocm/\-U

执行结果如下:

4.2 启动vllm
在终端执行

vllm serve ./models/google/gemma-4-E4B-it/ --served-model-name gemma-4-E4B-it

执行结果如下:
4.3 打开新终端进行对话测试
在终端执行

vllm chat--urlhttp://localhost:8000/v1--modelgemma-4-E4B-it

执行结果如下:

注意事项

1、实验完成后,记得关闭云环境的实例,不然后一直计算算力。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/12 15:08:51

MPC5200与Lite5200 EVB嵌入式开发实战:从硬件解析到RTOS移植

1. 项目概述:为什么选择MPC5200与Lite5200 EVB?在嵌入式开发这个行当里,选型永远是项目启动时最烧脑也最关键的一步。处理器性能、外设资源、开发工具链的成熟度、生态支持,每一项都直接关系到后续开发的效率、成本,甚…

作者头像 李华
网站建设 2026/6/12 15:07:53

MC9S12XD汽车网关开发:XGATE协处理器与多CAN总线实战解析

1. 项目概述:为什么MC9S12XD系列是汽车电子开发的“硬通货”在汽车电子和工业控制领域摸爬滚打十几年,我经手过的微控制器(MCU)型号少说也有几十种。从早期的8位机到如今动辄几百兆主频的32位ARM Cortex-M系列,技术迭代…

作者头像 李华
网站建设 2026/6/12 15:04:52

嵌入式设备上可直接集成的自适应PID控制源码包

本文还有配套的精品资源,点击获取 简介:一套轻量级、无依赖的C语言自适应PID控制器实现,专为资源受限的嵌入式MCU优化。整个核心逻辑封装在单个pid.c文件中,不依赖RTOS、标准库或浮点运算库,支持定点数运算&#xf…

作者头像 李华
网站建设 2026/6/12 15:04:51

终极Honey Select 2游戏增强补丁:一键解决200+插件兼容性问题

终极Honey Select 2游戏增强补丁:一键解决200插件兼容性问题 【免费下载链接】HS2-HF_Patch Automatically translate, uncensor and update HoneySelect2! 项目地址: https://gitcode.com/gh_mirrors/hs/HS2-HF_Patch 你是否曾经因为Honey Select 2的模组冲…

作者头像 李华
网站建设 2026/6/12 15:03:52

Log-normal分布:乘性增长现象的数学本质与工程实践

1. 为什么你总在财务建模、生物测量和搜索响应时间里撞见它——Log-normal 分布不是“对数正态”的简单拼接你有没有遇到过这样的场景:做用户行为分析时,发现页面加载时间的分布图右边拖着一条长长的尾巴,怎么都削不掉;或者在金融…

作者头像 李华
网站建设 2026/6/12 15:02:51

GAN不只是造假:深入浅出图解SRGAN,看AI如何‘脑补’出高清世界的细节

GAN不只是造假:深入浅出图解SRGAN,看AI如何‘脑补’出高清世界的细节当你用手机拍摄一张照片却发现放大后模糊不清时,是否想过AI能像专业修图师一样还原那些丢失的细节?这正是SRGAN技术的魔力所在。不同于传统插值算法简单粗暴的&…

作者头像 李华