1本镜像提供AudioX统一音频生成平台的汉化WebUI界面,支持通过文字提示词或输入视频智能生成匹配的配音、音效与背景音乐。推荐30/40系列显卡运行,适用于短视频制作、影视后期、广告配音及多媒体内容创作等场景,为用户提供高效、便捷的一站式AI音效生成解决方案。
1、该镜像支持自启动,初始化后,需要等待服务启动,大概2分钟左右,可以输入命令 tail -50f /root/wan/log.txt 查看启动日志
2、随后点击 SD-WEBUI 按钮即可,上传音色文件或者选择音色,点击生成即可




本页面用于统一音频生成,支持以下常见任务:
AudioX 统一音频生成平台提示词:描述你想生成的声音/音乐(核心输入)视频路径:本地视频文件路径(可选)上传视频文件:直接上传视频(可选)上传音频提示文件 / 音频提示路径:用于特定条件输入(默认隐藏)视频参数
视频起始秒:从视频第几秒开始读取条件生成时长(秒):生成音频的时长采样参数
采样步数:越大通常细节更多,但推理更重预览间隔:中间预览频率(0 表示关闭)CFG 强度:文本约束强度随机种子(-1 为随机):固定种子可复现结果采样器类型:采样算法选择Sigma 最小值 / 最大值、CFG 重缩放:高级采样控制初始音频(默认隐藏):用于在已有音频基础上继续生成开始生成:执行生成输出视频:展示合成后视频(如有)输出音频:展示生成结果音频发送到初始音频:把当前输出送回“初始音频”继续迭代加载示例 可自动填入提示词和推荐参数,快速体验提示词 输入你想要的声音描述(尽量具体)。视频路径 或上传视频开始生成。CFG 强度采样步数随机种子声音主体 + 场景 + 节奏/情绪 + 质感雨夜街道上的脚步声,近距离,带轻微回声轻快电子舞曲,128bpm,明亮合成器,适合派对梦幻Lo-fi,低保真黑胶噪声,舒缓氛围随机种子 从 -1 改成固定数字CFG 强度 和 采样步数采样器类型
认证作者

支持自启动