先说结论
本地搭环境更适合需要频繁调试、处理大数据的用户,但纯入门阶段用在线平台更省心。
最简路线:装Miniconda + 换源 + 创建虚拟环境 + 一条命令装PyTorch(根据硬件选版本)。
99%的故障可通过换源、核对CUDA版本、检查解释器路径解决,不必重新安装。
从效率与成本角度,拆解什么时候该本地搭环境、什么时候该用在线方案,并给出一条更轻量的搭建路线。
先说结论:本地AI开发环境不是非搭不可。
过去几年,每次有新手问“怎么开始学AI”,几乎都会收到同一套回答:先去装Anaconda、配CUDA、装PyTorch,跑通一个MNIST才算“入门”。这套流程走下来,顺利的话两小时,不顺利的话两天——而大多数人属于后者。
问题在于:这两小时(或两天)的投入,回报率到底怎么样?如果只是为了跑一个手写数字识别,完全可以在Colab或Kaggle上打开一个Notebook,点一下“连接”,直接开写。数据上传下载慢?对MNIST这种小数据集,几MB的东西,根本不是问题。调试不方便?Jupyter Notebook的交互式调试,其实比本地IDE更直观。免费版有时长限制?训练一个MNIST模型也就几分钟,完全够用。
所以,本地环境真正的价值场景,其实是下面几个:
- 你需要在本地做大量数据预处理,或者使用私有数据,不方便上传到云端。
- 你经常离线工作,或者网速很差,在线平台卡顿严重。
- 你要跑参数量较大的模型(比如7B以上的大模型),免费在线平台的资源不够。
- 你需要用VS Code的完整调试功能,或者依赖一些特殊的本地工具链。
如果以上都不符合,那直接打开Colab开始写,比花两小时搭环境更高效。
但如果你确实需要本地环境,或者就是想练手自己搭一遍,下面这条路线是我认为最轻量、最不容易出错的。
路线:Miniconda + 换源 + 虚拟环境 + PyTorch
装Miniconda(比Anaconda轻很多,只带基础功能)。官网下载对应平台版本,安装时注意:Windows用户建议勾选“Add to PATH”,否则后面要手动加。
换源。这一步最重要,国内不换源下载速度会让你崩溃。执行
conda config --set show_channel_urls yes生成配置文件,然后编辑~/.condarc,替换为清华源。同时配置pip源,新建~/.pip/pip.conf(Windows是C:\Users\用户名\pip\pip.ini),内容写:
[global] index-url = https://pypi.tuna.tsinghua.edu.cn/simple [install] trusted-host = pypi.tuna.tsinghua.edu.cn创建虚拟环境:
conda create -n ai python=3.10。Python版本选3.10,兼容性最好。激活环境:
conda activate ai。安装PyTorch。去PyTorch官网选配置,复制命令。如果你是NVIDIA GPU,选对应CUDA版本(新手推荐CUDA 11.8),如果是CPU或M芯片,选对应选项。注意:如果你已换源,可以把命令末尾的
-c pytorch -c nvidia去掉,用国内源更快。验证:运行
python -c "import torch; print(torch.__version__); print(torch.cuda.is_available() if torch.cuda.is_available() else torch.backends.mps.is_available())"。输出True即成功。
整个流程如果顺利,20分钟就能搞定。如果遇到问题,99%是下面几个原因:
- 装错了版本。比如想装GPU版但装了CPU版。检查方法:
print(torch.version.cuda),如果返回None就是CPU版。 - CUDA版本不对应。驱动版本必须≥CUDA版本,PyTorch编译用的CUDA版本必须和安装的CUDA版本一致。
- 环境变量问题。Windows下
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\bin是否在PATH中?Linux下LD_LIBRARY_PATH是否正确? - VS Code解释器选错了。点击右下角Python版本,选择虚拟环境里的解释器。
这些坑,很多教程都提过,但很少有人告诉你:其实很多问题都可以通过一个简单的操作避免——直接用conda安装PyTorch(不单独装CUDA和cuDNN)。因为conda在安装pytorch-cuda时会自动拉取匹配的cudatoolkit和cudnn到虚拟环境中,不需要你手动去官网下载。虽然这种做法被一些老手诟病“版本固定,不够灵活”,但对新手来说,这是最不容易出错的方式。
再说一个容易被忽略的代价:本地环境维护成本。你可能今天搭好了,过三个月发现某个包的版本冲突,环境崩了,又要重装。如果你有多个项目,还得学会管理多个虚拟环境。相比之下,在线平台完全没有这个问题。
所以,我的建议是:
- 如果你是纯入门,想先感受一下AI编程:直接用Colab或Kaggle,跑几个项目再决定要不要本地搭。
- 如果你已经开始做实际项目,或者对工具链有掌控欲:按上面的轻量路线搭一个,20分钟搞定,后面慢慢加东西。
- 如果你用的是AMD显卡或老旧硬件:别折腾GPU加速了,用CPU版本或者在线平台更省心。
环境搭建只是一个手段,不是目的。如果它挡住了你学习AI的脚步,那就绕开它——先跑起来再说。
最后留一个讨论点
同样是新手入门,你更愿意花两小时搭本地环境,还是直接用Colab/Kaggle在线跑?选哪个?