3修复反推报错,升级到2月11日版
点击右侧“使用该镜像创建实例”
选择显卡,点击立即部署
打开后台
在ACE目录下,点击termial
同时打开启动命令
等待7860出现,回到实例列表,点击ACE1.5

使用方法:
示例描述:
随机样本: 点击 🎲 按钮加载随机示例描述。
自定义模式提供对所有生成参数的完全控制。
使用方法:
从文本描述和/或歌词生成音乐。
用例: 基于提示从头创建新音乐。
必需输入: Caption 或歌词(至少一个)
转换现有音频,保持结构但改变风格。
用例: 创建不同风格的翻唱版本。
必需输入:
关键参数: 音频翻唱强度(0.0-1.0)
重新生成音频的特定时间段。
用例: 修复或修改生成音乐的特定部分。
必需输入:
在现有音频的上下文中生成特定乐器轨道。
用例: 为伴奏添加乐器层。
必需输入:
可用轨道: vocals、backing_vocals、drums、bass、guitar、keyboard、percussion、strings、synth、fx、brass、woodwinds
从混音音频中提取/分离特定乐器轨道。
用例: 音轨分离、分离乐器。
必需输入:
用指定的乐器完成部分轨道。
用例: 自动编排不完整的作品。
必需输入:
从下拉菜单选择生成任务。指令字段会根据选择的任务自动更新。
| 字段 | 说明 |
|---|---|
| 参考音频 | 用于风格参考的可选音频 |
| 源音频 | cover、repaint、lego、extract、complete 任务必需 |
| 转换为代码 | 从源音频提取 5Hz 语义代码 |
可以在此粘贴预计算的音频语义代码来引导生成。使用 转录 按钮分析代码并提取元数据。
期望音乐的文本描述。请具体说明:
示例: "欢快的流行摇滚,电吉他、有力的鼓点和朗朗上口的合成器钩子"
点击 🎲 加载随机示例 caption。
输入带结构标签的歌词:
[Verse 1]
今天走在街上
想着你曾说过的话
[Chorus]
我在前进,我很坚强
这就是我属于的地方
[Verse 2]
...
纯音乐复选框: 勾选此项以生成纯音乐,无论歌词内容如何。
人声语言: 选择人声语言。对于自动检测或纯音乐,使用"unknown"。
格式化按钮: 点击使用 5Hz LM 增强 caption 和歌词。
| 参数 | 默认值 | 说明 |
|---|---|---|
| BPM | 自动 | 每分钟节拍数(30-300) |
| 调性 | 自动 | 音乐调性(例如"C Major"、"Am"、"F# minor") |
| 拍号 | 自动 | 拍号:2(2/4)、3(3/4)、4(4/4)、6(6/8) |
| 音频时长 | 自动/-1 | 目标长度(秒)(10-600)。-1 为自动 |
| 批量大小 | 2 | 要生成的音频变体数量(1-8) |
| 参数 | 默认值 | 说明 |
|---|---|---|
| 推理步数 | 8 | 去噪步数。Turbo:1-20,Base:1-200 |
| 引导比例 | 7.0 | CFG 强度(仅 base 模型)。越高 = 越遵循提示 |
| 种子 | -1 | 随机种子。批量使用逗号分隔的值 |
| 随机种子 | ✓ | 勾选时生成随机种子 |
| 音频格式 | mp3 | 输出格式:mp3、flac |
| 偏移 | 3.0 | 时间步偏移因子(1.0-5.0)。turbo 推荐 3.0 |
| 推理方法 | ode | ode(Euler,更快)或 sde(随机) |
| 自定义时间步 | - | 覆盖时间步(例如"0.97,0.76,0.615,0.5,0.395,0.28,0.18,0.085,0") |
| 参数 | 默认值 | 说明 |
|---|---|---|
| 使用 ADG | ✗ | 启用自适应双引导以获得更好的质量 |
| CFG 区间开始 | 0.0 | 何时开始应用 CFG(0.0-1.0) |
| CFG 区间结束 | 1.0 | 何时停止应用 CFG(0.0-1.0) |
| 参数 | 默认值 | 说明 |
|---|---|---|
| LM 温度 | 0.85 | 采样温度(0.0-2.0)。越高 = 越有创意 |
| LM CFG 比例 | 2.0 | LM 引导强度(1.0-3.0) |
| LM Top-K | 0 | Top-K 采样。0 禁用 |
| LM Top-P | 0.9 | 核采样(0.0-1.0) |
| LM 负面提示 | "NO USER INPUT" | CFG 的负面提示 |
| 选项 | 默认值 | 说明 |
|---|---|---|
| CoT Metas | ✓ | 通过 LM 推理生成元数据 |
| CoT Language | ✓ | 通过 LM 检测人声语言 |
| 约束解码调试 | ✗ | 启用调试日志 |
| 选项 | 默认值 | 说明 |
|---|---|---|
| LM 代码强度 | 1.0 | LM 代码对生成的影响程度(0.0-1.0) |
| 自动评分 | ✗ | 自动计算质量分数 |
| 自动 LRC | ✗ | 自动生成歌词时间戳 |
| LM 批处理块大小 | 8 | 每个 LM 批次的最大项目数(GPU 内存) |
| 控制 | 说明 |
|---|---|
| Think | 启用 5Hz LM 进行代码生成和元数据 |
| ParallelThinking | 启用并行 LM 批处理 |
| CaptionRewrite | 让 LM 增强输入 caption |
| AutoGen | 完成后自动开始下一批次 |
根据批量大小最多显示 8 个音频样本。每个样本包括:
点击"评分 & LRC & LM 代码"展开并查看:
| 控制 | 说明 |
|---|---|
| ◀ 上一批 | 查看上一批 |
| 批次指示器 | 显示当前批次位置(例如"批次 1 / 3") |
| 下一批状态 | 显示后台生成进度 |
| 下一批 ▶ | 查看下一批(如果 AutoGen 开启则触发生成) |
点击 应用这些设置到 UI 将当前批次的所有生成参数恢复到输入字段。适用于迭代优化好的结果。
"批次结果和生成详情"折叠面板包含:
认证作者
