更新!更好!AMD显卡在原生Windows环境下运行Stable Diffusion:纯血ROCm7 + PyTorch2.9 实现,以及绘世启动器配置指南

本文最后更新于 2025年11月2日 下午

简单说明
在Windows平台上,AMD显卡长期以来在AI绘图领域不如NVIDIA主流显卡普及,主要因为CUDA生态对NVIDIA优化,而ROCm(Radeon Open Compute)则是AMD官方提供的开源高性能计算框架,用于在AMD GPU上运行深度学习模型。随着ROCm对Windows的原生支持提高以及PyTorch的兼容升级,AMD用户现已可以在纯原生Windows环境下运行Stable Diffusion,而无需依赖WSL或虚拟机环境或ZLUDA转译
本文将基于该环境,演示如何配置ROCm+PyTorch并运行Stable Diffusion,以及绘世启动器的配置方法。接下来,我们直接进入环境搭建与教程操作

安装Stable Diffusion WebUI

选择1:直接安装

开始前请确保已安装Git以及Python3.11或3.12,这里仅作简单说明,具体教程请自行搜索

  1. 新建文件夹并重命名为WebUI,注意路径最好为纯英文路径,例如:E:\SKzxi\WebUI
  2. 打开终端进入此文件夹,然后使用git clone命令下载你需要的webui
  3. 下载完成后,先不要启动,需要编辑webui-user.bat文件,
    在echo off下方的第二行添加:
    1
    set TORCH_ROCM_AOTRITON_ENABLE_EXPERIMENTAL=1
    COMMANDLINE_ARGS=这一行:
    对于Automatic1111,添加(opt-sdp-attention速度非常快但不稳定,也可以不添加)
    1
    --skip-python-version-check --opt-sdp-attention
    对于Forge/ReForge/ForgeNeo,添加
    1
    --skip-python-version-check --cuda-stream --attention-pytorch
    对于ComfyUI,使用
    1
    --use-pytorch-cross-attention --reserve-vram 0.5
  4. 运行webui-user.bat,等待其完成所有安装并打开浏览器,完成后将其关闭

选择2:秋葉整合包(推荐)

注意
接下来的教程将以forge整合包为例,其他整合包应该也一样(我暂未进行测试),至于直接安装的,请自行类比,思路和过程是同样的

  1. 按需选择下载 A41整合包 | Forge整合包 | ComfyUI整合包
  2. 确保下载的压缩包无误,然后解压到任意文件夹
  3. 注意先不要运行

配置环境

如果是切换至ROCm6 PyTorh2.7(备选)则可以跳过该项

首先需要安装Visual Studio官网
进入后点击下载 Visual Studio,双击运行下载的程序,安装完成后
来到主页面,点击可用,选择visual studio community 2022,点击后面的安装,然后在弹出的页面选择单个组件
分别搜索并勾选下列3项(我确定这是编译所需的最小安装,不需要安装C++桌面开发

1
2
3
MSVC v143 - VS 2022 C++ x64/x86 生成工具(最新)
Windows 11 SDK (10.0.26100.4654) | Windows 10 SDK (10.0.19041.0) #这两个根据你的系统二选一
用于 Windows 的 C++ CMake 工具

点击右下角的安装并等待安装完成

切换至ROCm7 PyTorh2.9

确认GFX版本

先确认你的AMD GPU的GFX版本,可以自行查询或问ai
个人建议的方法:使用TechPowerUp网站进行查询,如我的GPU是AMD Radeon 760M,在任意搜索引擎输入AMD Radeon 760M site:techpowerup.com进行搜索,打开对应的网站,确认是你的同款GPU,然后下拉到GPU Notes这一栏,查看Shader ISA这一行,如我的是Shader ISA: GFX11.0 (gfx1103),记住括号里的这个值gfx1103,后面有用

卸载已安装的torch

直接安装的你自己应该知道怎么打开终端
对于整合包用户,打开整合包根目录,找到python这个文件夹,进入,然后在地址栏输入cmd,回车,弹出终端页面(注:后文所说的终端都是这个终端)
然后输入命令回车后输入y确认卸载torch torchvision torchaudio

1
python -m pip uninstall torch torchvision torchaudio

卸载xformers(a卡一般用不上)

1
python -m pip uninstall xformers

卸载bnb(a卡完全用不了)

1
python -m pip uninstall bitsandbytes

安装rocm_torch

说明
这里使用的是开源社区TheRock编译的whl,因为AMD官方只提供了torch-2.8+rocm6.4.4-cp312这一个版本

在终端中输入命令,注意网址中的gfx110X-dgpu需对应你的gfx,如我是gfx1103则选择gfx110X-dgpu,参考该列表将gfx110X-dgpu更改为你对应的gfx版本

  • gfx110X-dgpu
  • gfx1151
  • gfx120X-all
  • gfx94X-dcgpu
  • gfx950-dcgpu
1
python -m pip install --index-url https://d2awnip2yjpvqn.cloudfront.net/v2/gfx110X-dgpu/ torch torchvision torchaudio

等待直到安装完成

如果出现如下提示,将提示中的路径youpath\python\Scripts添加到环境变量即可

1
2
WARNING: The script XXX is installed in 'youpath\python\Scripts' which is not on PATH.
Consider adding this directory to PATH or, if you prefer to suppress this warning, use -no-warn-script-location

验证安装

在终端输入python进入交互模式,然后分别输入import torch print(torch.__version__) print(torch.version.hip)
输出类似如下则安装成功

1
2
3
4
5
6
7
8
9
E:\sd-webui-forge-aki-v1.0\python>python
Python 3.11.9 (tags/v3.11.9:de54cf5, Apr 2 2024, 10:12:12) [MSC v.1938 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import torch
>>> print(torch.__version__)
2.9.0+rocm7.10.0a20251018
>>> print(torch.version.hip)
7.1.25416-d0220ec212
>>>

ctrl+z退出交互模式

切换至ROCm6 PyTorh2.7(备选)

注意
如果切换至ROCm7 PyTorh2.9过程中出现太多问题,建议使用这一方案
但是此方案仅支持gfx110x gfx1151 gfx1201

卸载已安装的torch

直接安装的你自己应该知道怎么打开终端
对于整合包用户,打开整合包根目录,找到python这个文件夹,进入,然后在地址栏输入cmd,回车,弹出终端页面
然后输入命令回车后输入y确认卸载torch torchvision torchaudio

1
python -m pip uninstall torch torchvision torchaudio

卸载xformers(a卡一般用不上)

1
python -m pip uninstall xformers

卸载bnb(a卡完全用不了)

1
python -m pip uninstall bitsandbytes

确认python版本

在终端中输入python --version回车,如我的是python3.11

1
2
E:\sd-webui-forge-aki-v1.0\python>python --version
Python 3.11.9

记住你的python版本

下载torch

打开此releases
然后根据python版本选择需要下载的3个文件,如我是python3.11,需要下载带有cp311的这3个

1
2
3
torch-2.7.0a0+rocm_git3f903c3-cp311-cp311-win_amd64.whl
torchaudio-2.7.0a0+52638ef-cp311-cp311-win_amd64.whl
torchvision-0.22.0+9eb57cd-cp311-cp311-win_amd64.whl

安装torch

在终端中输入python -m pip install ,注意先不要回车
然后找到刚才下载的三个文件,依次将3个文件拖入终端,命令应与下行相似

1
python -m pip install D:the_rock\torchvision-0.22.0+9eb57cd-cp311-cp311-win_amd64.whl D:\the_rock\torch-2.7.0a0+rocm_git3f903c3-cp311-cp311-win_amd64.whl D:\the_rock\torchaudio-2.7.0a0+52638ef-cp311-cp311-win_amd64.whl

回车后等待安装,出现Successfully installed torch-2.7.0a0+git3f903c3 torchaudio-2.7.0a0+52638ef torchvision-0.22.0+9eb57cd则安装完成

验证安装

在终端输入python进入交互模式,然后分别输入import torch print(torch.__version__) print(torch.version.hip)
输出类似如下则安装成功

1
2
3
4
5
6
7
8
Python 3.11.9 (tags/v3.11.9:de54cf5, Apr  2 2024, 10:12:12) [MSC v.1938 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import torch
>>> print(torch.__version__)
2.7.0a0+git3f903c3
>>> print(torch.version.hip)
6.5.25214-5ea90b8c4
>>>

ctrl+z退出交互模式

直接安装的到这一步就应该结束了,接下来是整合包用启动器启动还需要进行一些配置

绘世启动器配置指南

双击打开A绘世启动器

设置

最上面的配置模式该为高级专家(出事了请自己负责,不要怪这怪那的)

高级选项

性能设置这一栏中

  1. 生成引擎取消勾选,旁边的GPU选择会变成灰色
  2. Cross-Attention 优化方案选择SDPSub-Quadratic(推荐SDP)
  3. 计算精度设置
    • 通常模型精度
    • 文本编码器(Text Encoder)模型精度
    • U-Net模型精度
    • VAE 模型精度
      都改为半精度(FP16)

      如果选择由**决定,forge会默认直接用FP32,其他的暂未测试

然后拉到最下面自定义参数填入
A41整合包(opt-sdp-attention速度非常快但不稳定,也可以不添加)

1
--skip-python-version-check --opt-sdp-attention

Forge整合包

1
--skip-python-version-check --cuda-stream --attention-pytorch

ComfyUI整合包

1
--use-pytorch-cross-attention --reserve-vram 0.5

一键启动

点击一键启动
Stable Diffusion 启动!!!

需要注意的是
首次生图或进行高清修复时,系统可能出现严重卡顿甚至导致GPU驱动崩溃,此后的操作通常会恢复正常,但若设置过高修复倍数或执行其他高性能任务仍可能复发
此问题为当前版本已知缺陷,将在TheRock后续更新中修复
建议进行高清修复时同时启用Tiled VAE选项可大幅缓解该问题

这样AMD GPU就可以在Windows原生环境下使用ROCm PyTorch运行Stable Diffusion了


更新!更好!AMD显卡在原生Windows环境下运行Stable Diffusion:纯血ROCm7 + PyTorch2.9 实现,以及绘世启动器配置指南
http://skzxi.github.io/2025/10/18/amdgpu-windows-stable-diffusion-rocm7-pytorch2-9-launcher/
作者
SKzxi
发布于
2025年10月18日
更新于
2025年11月2日
许可协议