更新!更好!AMD显卡在原生Windows环境下运行Stable Diffusion:纯血ROCm7 + PyTorch2.9 实现,以及绘世启动器配置指南
本文最后更新于 2025年11月2日 下午
简单说明
在Windows平台上,AMD显卡长期以来在AI绘图领域不如NVIDIA主流显卡普及,主要因为CUDA生态对NVIDIA优化,而ROCm(Radeon Open Compute)则是AMD官方提供的开源高性能计算框架,用于在AMD GPU上运行深度学习模型。随着ROCm对Windows的原生支持提高以及PyTorch的兼容升级,AMD用户现已可以在纯原生Windows环境下运行Stable Diffusion,而无需依赖WSL或虚拟机环境或ZLUDA转译
本文将基于该环境,演示如何配置ROCm+PyTorch并运行Stable Diffusion,以及绘世启动器的配置方法。接下来,我们直接进入环境搭建与教程操作
安装Stable Diffusion WebUI
选择1:直接安装
开始前请确保已安装Git以及Python3.11或3.12,这里仅作简单说明,具体教程请自行搜索
- 新建文件夹并重命名为WebUI,注意路径最好为纯英文路径,例如:
E:\SKzxi\WebUI - 打开终端进入此文件夹,然后使用git clone命令下载你需要的webui
- 下载完成后,先不要启动,需要编辑
webui-user.bat文件,
在echo off下方的第二行添加:在1
set TORCH_ROCM_AOTRITON_ENABLE_EXPERIMENTAL=1COMMANDLINE_ARGS=这一行:
对于Automatic1111,添加(opt-sdp-attention速度非常快但不稳定,也可以不添加)对于Forge/ReForge/ForgeNeo,添加1
--skip-python-version-check --opt-sdp-attention对于ComfyUI,使用1
--skip-python-version-check --cuda-stream --attention-pytorch1
--use-pytorch-cross-attention --reserve-vram 0.5 - 运行
webui-user.bat,等待其完成所有安装并打开浏览器,完成后将其关闭
选择2:秋葉整合包(推荐)
注意
接下来的教程将以forge整合包为例,其他整合包应该也一样(我暂未进行测试),至于直接安装的,请自行类比,思路和过程是同样的
- 按需选择下载 A41整合包 | Forge整合包 | ComfyUI整合包
- 确保下载的压缩包无误,然后解压到任意文件夹
- 注意先不要运行
配置环境
如果是切换至ROCm6 PyTorh2.7(备选)则可以跳过该项
首先需要安装Visual Studio,官网
进入后点击下载 Visual Studio,双击运行下载的程序,安装完成后
来到主页面,点击可用,选择visual studio community 2022,点击后面的安装,然后在弹出的页面选择单个组件,
分别搜索并勾选下列3项(我确定这是编译所需的最小安装,不需要安装C++桌面开发)
1 | |
点击右下角的安装并等待安装完成
切换至ROCm7 PyTorh2.9
确认GFX版本
先确认你的AMD GPU的GFX版本,可以自行查询或问ai
个人建议的方法:使用TechPowerUp网站进行查询,如我的GPU是AMD Radeon 760M,在任意搜索引擎输入AMD Radeon 760M site:techpowerup.com进行搜索,打开对应的网站,确认是你的同款GPU,然后下拉到GPU Notes这一栏,查看Shader ISA这一行,如我的是Shader ISA: GFX11.0 (gfx1103),记住括号里的这个值gfx1103,后面有用
卸载已安装的torch
直接安装的你自己应该知道怎么打开终端
对于整合包用户,打开整合包根目录,找到python这个文件夹,进入,然后在地址栏输入cmd,回车,弹出终端页面(注:后文所说的终端都是这个终端)
然后输入命令回车后输入y确认卸载torch torchvision torchaudio
1 | |
卸载xformers(a卡一般用不上)
1 | |
卸载bnb(a卡完全用不了)
1 | |
安装rocm_torch
说明
这里使用的是开源社区TheRock编译的whl,因为AMD官方只提供了torch-2.8+rocm6.4.4-cp312这一个版本
在终端中输入命令,注意网址中的gfx110X-dgpu需对应你的gfx,如我是gfx1103则选择gfx110X-dgpu,参考该列表将gfx110X-dgpu更改为你对应的gfx版本
- gfx110X-dgpu
- gfx1151
- gfx120X-all
- gfx94X-dcgpu
- gfx950-dcgpu
1 | |
等待直到安装完成
如果出现如下提示,将提示中的路径youpath\python\Scripts添加到环境变量即可
1 | |
验证安装
在终端输入python进入交互模式,然后分别输入import torch print(torch.__version__) print(torch.version.hip)
输出类似如下则安装成功
1 | |
按ctrl+z退出交互模式
切换至ROCm6 PyTorh2.7(备选)
注意
如果切换至ROCm7 PyTorh2.9过程中出现太多问题,建议使用这一方案
但是此方案仅支持gfx110x gfx1151 gfx1201
卸载已安装的torch
直接安装的你自己应该知道怎么打开终端
对于整合包用户,打开整合包根目录,找到python这个文件夹,进入,然后在地址栏输入cmd,回车,弹出终端页面
然后输入命令回车后输入y确认卸载torch torchvision torchaudio
1 | |
卸载xformers(a卡一般用不上)
1 | |
卸载bnb(a卡完全用不了)
1 | |
确认python版本
在终端中输入python --version回车,如我的是python3.11
1 | |
记住你的python版本
下载torch
打开此releases页
然后根据python版本选择需要下载的3个文件,如我是python3.11,需要下载带有cp311的这3个
1 | |
安装torch
在终端中输入python -m pip install ,注意先不要回车
然后找到刚才下载的三个文件,依次将3个文件拖入终端,命令应与下行相似
1 | |
回车后等待安装,出现Successfully installed torch-2.7.0a0+git3f903c3 torchaudio-2.7.0a0+52638ef torchvision-0.22.0+9eb57cd则安装完成
验证安装
在终端输入python进入交互模式,然后分别输入import torch print(torch.__version__) print(torch.version.hip)
输出类似如下则安装成功
1 | |
按ctrl+z退出交互模式
直接安装的到这一步就应该结束了,接下来是整合包用启动器启动还需要进行一些配置
绘世启动器配置指南
双击打开A绘世启动器
设置
最上面的配置模式该为高级或专家(出事了请自己负责,不要怪这怪那的)
高级选项
性能设置这一栏中
生成引擎取消勾选,旁边的GPU选择会变成灰色Cross-Attention 优化方案选择SDP或Sub-Quadratic(推荐SDP)计算精度设置中通常模型精度文本编码器(Text Encoder)模型精度U-Net模型精度VAE 模型精度
都改为半精度(FP16)如果选择
由**决定,forge会默认直接用FP32,其他的暂未测试
然后拉到最下面自定义参数填入
A41整合包(opt-sdp-attention速度非常快但不稳定,也可以不添加)
1 | |
Forge整合包
1 | |
ComfyUI整合包
1 | |
一键启动
点击一键启动
Stable Diffusion 启动!!!
需要注意的是
首次生图或进行高清修复时,系统可能出现严重卡顿甚至导致GPU驱动崩溃,此后的操作通常会恢复正常,但若设置过高修复倍数或执行其他高性能任务仍可能复发
此问题为当前版本已知缺陷,将在TheRock后续更新中修复
建议进行高清修复时同时启用Tiled VAE选项可大幅缓解该问题
这样AMD GPU就可以在Windows原生环境下使用ROCm PyTorch运行Stable Diffusion了