更新！更好！AMD显卡在原生Windows环境下运行Stable Diffusion：纯血ROCm7 + PyTorch2.9 实现，以及绘世启动器配置指南

本文最后更新于 2025年11月2日下午

简单说明
在Windows平台上，AMD显卡长期以来在AI绘图领域不如NVIDIA主流显卡普及，主要因为CUDA生态对NVIDIA优化，而ROCm（Radeon Open Compute）则是AMD官方提供的开源高性能计算框架，用于在AMD GPU上运行深度学习模型。随着ROCm对Windows的原生支持提高以及PyTorch的兼容升级，AMD用户现已可以在纯原生Windows环境下运行Stable Diffusion，而无需依赖WSL或虚拟机环境或ZLUDA转译
本文将基于该环境，演示如何配置ROCm+PyTorch并运行Stable Diffusion，以及绘世启动器的配置方法。接下来，我们直接进入环境搭建与教程操作

安装Stable Diffusion WebUI

选择1：直接安装

开始前请确保已安装Git以及Python3.11或3.12，这里仅作简单说明，具体教程请自行搜索

新建文件夹并重命名为WebUI，注意路径最好为纯英文路径，例如：E:\SKzxi\WebUI
打开终端进入此文件夹，然后使用git clone命令下载你需要的webui
下载完成后，先不要启动，需要编辑webui-user.bat文件，
在echo off下方的第二行添加：
1
set TORCH_ROCM_AOTRITON_ENABLE_EXPERIMENTAL=1
在COMMANDLINE_ARGS=这一行：
对于Automatic1111，添加（opt-sdp-attention速度非常快但不稳定，也可以不添加）
1
--skip-python-version-check --opt-sdp-attention
对于Forge/ReForge/ForgeNeo，添加
1
--skip-python-version-check --cuda-stream --attention-pytorch
对于ComfyUI，使用
1
--use-pytorch-cross-attention --reserve-vram 0.5
运行webui-user.bat，等待其完成所有安装并打开浏览器，完成后将其关闭

选择2：秋葉整合包（推荐）

注意
接下来的教程将以forge整合包为例，其他整合包应该也一样（我暂未进行测试），至于直接安装的，请自行类比，思路和过程是同样的

按需选择下载 A41整合包 | Forge整合包 | ComfyUI整合包
确保下载的压缩包无误，然后解压到任意文件夹
注意先不要运行

配置环境

如果是切换至ROCm6 PyTorh2.7（备选）则可以跳过该项

首先需要安装Visual Studio，官网
进入后点击下载 Visual Studio，双击运行下载的程序，安装完成后
来到主页面，点击可用，选择visual studio community 2022，点击后面的安装，然后在弹出的页面选择单个组件，
分别搜索并勾选下列3项（我确定这是编译所需的最小安装，不需要安装C++桌面开发）

1
2
3

MSVC v143 - VS 2022 C++ x64/x86 生成工具(最新)
Windows 11 SDK (10.0.26100.4654) | Windows 10 SDK (10.0.19041.0) #这两个根据你的系统二选一
用于 Windows 的 C++ CMake 工具

点击右下角的安装并等待安装完成

切换至ROCm7 PyTorh2.9

确认GFX版本

先确认你的AMD GPU的GFX版本，可以自行查询或问ai
个人建议的方法：使用TechPowerUp网站进行查询，如我的GPU是AMD Radeon 760M，在任意搜索引擎输入AMD Radeon 760M site:techpowerup.com进行搜索，打开对应的网站，确认是你的同款GPU，然后下拉到GPU Notes这一栏，查看Shader ISA这一行，如我的是Shader ISA: GFX11.0 (gfx1103),记住括号里的这个值gfx1103，后面有用

卸载已安装的torch

直接安装的你自己应该知道怎么打开终端
对于整合包用户，打开整合包根目录，找到python这个文件夹，进入，然后在地址栏输入cmd，回车，弹出终端页面（注：后文所说的终端都是这个终端）
然后输入命令回车后输入y确认卸载torch torchvision torchaudio

1	`python -m pip uninstall torch torchvision torchaudio`

卸载xformers（a卡一般用不上）

1	`python -m pip uninstall xformers`

卸载bnb（a卡完全用不了）

1	`python -m pip uninstall bitsandbytes`

安装rocm_torch

说明
这里使用的是开源社区TheRock编译的whl，因为AMD官方只提供了torch-2.8+rocm6.4.4-cp312这一个版本

在终端中输入命令，注意网址中的gfx110X-dgpu需对应你的gfx，如我是gfx1103则选择gfx110X-dgpu，参考该列表将gfx110X-dgpu更改为你对应的gfx版本

gfx110X-dgpu
gfx1151
gfx120X-all
gfx94X-dcgpu
gfx950-dcgpu

1	`python -m pip install --index-url https://d2awnip2yjpvqn.cloudfront.net/v2/gfx110X-dgpu/ torch torchvision torchaudio`

等待直到安装完成

如果出现如下提示，将提示中的路径youpath\python\Scripts添加到环境变量即可

1
2

WARNING: The script XXX is installed in 'youpath\python\Scripts' which is not on PATH.
Consider adding this directory to PATH or, if you prefer to suppress this warning, use -no-warn-script-location

验证安装

在终端输入python进入交互模式，然后分别输入import torch print(torch.__version__) print(torch.version.hip)
输出类似如下则安装成功

E:\sd-webui-forge-aki-v1.0\python>python
Python 3.11.9 (tags/v3.11.9:de54cf5, Apr  2 2024, 10:12:12) [MSC v.1938 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import torch
>>> print(torch.__version__)
2.9.0+rocm7.10.0a20251018
>>> print(torch.version.hip)
7.1.25416-d0220ec212
>>>

按ctrl＋z退出交互模式

切换至ROCm6 PyTorh2.7（备选）

注意
如果切换至ROCm7 PyTorh2.9过程中出现太多问题，建议使用这一方案
但是此方案仅支持gfx110x gfx1151 gfx1201

卸载已安装的torch

直接安装的你自己应该知道怎么打开终端
对于整合包用户，打开整合包根目录，找到python这个文件夹，进入，然后在地址栏输入cmd，回车，弹出终端页面
然后输入命令回车后输入y确认卸载torch torchvision torchaudio

1	`python -m pip uninstall torch torchvision torchaudio`

卸载xformers（a卡一般用不上）

1	`python -m pip uninstall xformers`

卸载bnb（a卡完全用不了）

1	`python -m pip uninstall bitsandbytes`

确认python版本

在终端中输入python --version回车，如我的是python3.11

1 2	`E:\sd-webui-forge-aki-v1.0\python>python --version Python 3.11.9`

记住你的python版本

下载torch

打开此releases页
然后根据python版本选择需要下载的3个文件，如我是python3.11，需要下载带有cp311的这3个

1
2
3

torch-2.7.0a0+rocm_git3f903c3-cp311-cp311-win_amd64.whl
torchaudio-2.7.0a0+52638ef-cp311-cp311-win_amd64.whl
torchvision-0.22.0+9eb57cd-cp311-cp311-win_amd64.whl

安装torch

在终端中输入python -m pip install ，注意先不要回车
然后找到刚才下载的三个文件，依次将3个文件拖入终端，命令应与下行相似

python -m pip install D:the_rock\torchvision-0.22.0+9eb57cd-cp311-cp311-win_amd64.whl D:\the_rock\torch-2.7.0a0+rocm_git3f903c3-cp311-cp311-win_amd64.whl D:\the_rock\torchaudio-2.7.0a0+52638ef-cp311-cp311-win_amd64.whl

回车后等待安装，出现Successfully installed torch-2.7.0a0+git3f903c3 torchaudio-2.7.0a0+52638ef torchvision-0.22.0+9eb57cd则安装完成

验证安装

在终端输入python进入交互模式，然后分别输入import torch print(torch.__version__) print(torch.version.hip)
输出类似如下则安装成功

Python 3.11.9 (tags/v3.11.9:de54cf5, Apr  2 2024, 10:12:12) [MSC v.1938 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import torch
>>> print(torch.__version__)
2.7.0a0+git3f903c3
>>> print(torch.version.hip)
6.5.25214-5ea90b8c4
>>>

按ctrl＋z退出交互模式

直接安装的到这一步就应该结束了，接下来是整合包用启动器启动还需要进行一些配置

绘世启动器配置指南

双击打开A绘世启动器

设置

最上面的配置模式该为高级或专家（出事了请自己负责，不要怪这怪那的）

高级选项

性能设置这一栏中

生成引擎取消勾选，旁边的GPU选择会变成灰色
Cross-Attention 优化方案选择SDP或Sub-Quadratic（推荐SDP）
计算精度设置中
- 通常模型精度
- 文本编码器(Text Encoder)模型精度
- U-Net模型精度
- VAE 模型精度
  都改为半精度(FP16)
  
  如果选择由**决定,forge会默认直接用FP32，其他的暂未测试

然后拉到最下面自定义参数填入
A41整合包（opt-sdp-attention速度非常快但不稳定，也可以不添加）

1	`--skip-python-version-check --opt-sdp-attention`

Forge整合包

1	`--skip-python-version-check --cuda-stream --attention-pytorch`

ComfyUI整合包

1	`--use-pytorch-cross-attention --reserve-vram 0.5`

一键启动

点击一键启动
Stable Diffusion 启动！！！

需要注意的是
首次生图或进行高清修复时，系统可能出现严重卡顿甚至导致GPU驱动崩溃，此后的操作通常会恢复正常，但若设置过高修复倍数或执行其他高性能任务仍可能复发
此问题为当前版本已知缺陷，将在TheRock后续更新中修复
建议进行高清修复时同时启用Tiled VAE选项可大幅缓解该问题

这样AMD GPU就可以在Windows原生环境下使用ROCm PyTorch运行Stable Diffusion了

教程

#AMD #ROCm #PyTorch #Stable Diffusion #Windows #绘世启动器

更新！更好！AMD显卡在原生Windows环境下运行Stable Diffusion：纯血ROCm7 + PyTorch2.9 实现，以及绘世启动器配置指南

http://skzxi.github.io/2025/10/18/amdgpu-windows-stable-diffusion-rocm7-pytorch2-9-launcher/

作者

SKzxi

发布于

2025年10月18日

更新于

2025年11月2日

许可协议

fluid主题文章展示下一篇