控制台

立即注册

HY-Motion1.0腾讯混元开源的文本到3D动作生成模型汉化构建by科哥

0元/小时

v1.0

HY-Motion1.0腾讯混元开源的文本到3D动作生成模型汉化构建by科哥

镜像简介

腾讯混元HY-Motion 1.0是什么

腾讯混元HY-Motion 1.0（混元Motion 1.0）是腾讯混元团队开源的十亿参数级文本到 3D 动作生成大模型。
基于 Diffusion Transformer（DiT）架构与流匹配机制，仅需一句自然语言描述
能生成高保真、流畅多样的 3D 角色骨骼动画。模型采用全阶段训练策略，
包括在超 3000 小时多样化动作数据上预训练、在 400 小时精选高质量数据上微调，
以及通过强化学习结合人类反馈和奖励模型进行优化。覆盖 6 大类超 200 种动作，
输出为 SMPL-H 骨骼格式，支持原子动作、组合序列及并发动作生成。在性能评估中，
指令遵循能力达 78.6%，动作质量平均 3.43 分（5 分制），全面超越 MoMask、DART 等开源基线。
源码地址：https://github.com/Tencent-Hunyuan/HY-Motion-1.0

镜像使用指南

1、在社区镜像区域，选择镜像： 2、在打开的新页面点击“使用该镜像创建实例”： 3、选择一个合适的显卡【GPU】根据情况选择，点击“开始部署”，然后等待部署完成：

4、实例运行后打开ComfyUI即可

操作页面截图

HY-Motion-1.0 用户使用手册

webUI 二次开发 by 科哥 | 微信：312088415 最后更新: 2025-12-30

一、界面概览

打开 WebUI 后，你会看到一个简洁的界面，主要分为三个区域：

┌─────────────────────────────────────────────────────────────┐
│                    【标题区域 - 紫蓝渐变】                    │
│              HY-Motion-1.0: 文本生成动作                      │
│                   *腾讯混元 3D 数字人团队*                    │
└─────────────────────────────────────────────────────────────┘

┌──────────────┬──────────────────────────────────────────────┐
│  【左侧面板】  │              【右侧 3D 可视化区域】              │
│              │                                              │
│  控制输入区   │           动作预览和播放                        │
│              │                                              │
└──────────────┴──────────────────────────────────────────────┘

┌─────────────────────────────────────────────────────────────┐
│                  【版权信息 - 紫蓝渐变】                      │
│          webUI二次开发 by 科哥 | 微信：312088415              │
└─────────────────────────────────────────────────────────────┘

二、基础使用流程

2.1 生成你的第一个动作

步骤 1: 输入文本描述

在左侧 "📝 输入文本" 框中，用英文描述你想要生成的动作。

推荐格式: A person ... （一个人...）

示例：

A person walks forward.
（一个人向前走。）

A person jumps up.
（一个人向上跳。）

A person dances jazz, jumping rhythmically.
（一个人跳爵士舞，有节奏地跳跃。）

步骤 2: 调整动作时长

拖动 "⏱️ 动作时长（秒）" 滑块，设置动作持续时间（0.5~12 秒）

步骤 3: 点击生成

点击 "🚀 生成动作" 按钮，等待片刻，右侧 3D 区域会显示生成的动作。

2.2 使用预设示例

点击 "📚 测试示例" 下拉菜单，选择预设的动作示例：

中文英文双语显示
选择后会自动填充文本并设置合适的时长
然后直接点击 "🚀 生成动作" 即可

2.3 查看和播放动作

生成完成后，右侧 3D 可视化区域会显示：

3D 人物模型: 展示生成的动作
进度条: 拖动可以跳转到任意帧
帧计数器: 显示当前帧 / 总帧数
自动播放: 动作会自动循环播放

操作提示:

鼠标左键拖动: 旋转视角
鼠标滚轮: 缩放
鼠标右键拖动: 平移
点击画面: 暂停/播放
双击画面: 重置到起始帧

三、高级设置

点击 "🔧 高级设置" 展开更多选项：

3.1 随机种子列表

"🎯 随机种子列表（逗号分隔）"

格式: 0,1,2,3 （逗号分隔的数字）
作用: 控制生成动作的随机性
相同的种子 + 相同的文本 = 相同的动作
"🎲 随机按钮": 快速生成 4 个随机种子

使用场景:

想要不同变化: 使用不同种子
想要复现某个动作: 记住该种子值

3.2 CFG 强度

"⚙️ CFG 强度" (1.0 ~ 10.0)

全称: Classifier-Free Guidance
作用: 控制生成动作对文本的忠实度
数值越高: 动作越严格遵循文本描述
数值越低: 动作越多样化/随机

推荐值:

初次尝试: 5.0 (默认值)
动作不准确: 尝试 7.0 ~ 10.0
想要更多变化: 尝试 1.0 ~ 3.0

四、常见动作描述参考

4.1 基础动作

英文描述	中文含义
A person walks forward.	一个人向前走。
A person runs forward.	一个人向前跑去。
A person jumps up.	一个人向上跳。
A person sits down on a chair.	一个人坐在椅子上。
A person stands up from the chair.	一个人从椅子上站起来。

4.2 复杂动作

英文描述	中文含义
A person dances jazz, jumping rhythmically.	一个人跳爵士舞，有节奏地跳跃。
A person performs a squat.	一个人做深蹲。
A person plays the piano.	一个人弹钢琴。
A person kicks a soccer ball.	一个人踢足球。
A person swings a golf club.	一个人挥动高尔夫球杆。

4.3 交互动作

英文描述	中文含义
A person picks up an object from ground.	一个人从地面捡起物品。
A person speaks, gesturing with both hands.	一个人说话，双手做手势。
A person waves their right hand.	一个人挥手。

五、使用技巧

5.1 获得更好的生成效果

使用标准的 A person ... 格式开头
描述具体: A person walks quickly 比 A person moves 更好
合理设置时长: 简单动作 3-5 秒，复杂动作 6-10 秒
调整 CFG 强度: 动作不准确时提高 CFG 值

5.2 多样化尝试

保持文本不变，修改种子 获得不同变体
多个种子（如 0,1,2,3）会同时生成多个版本
在预设示例基础上修改文本

5.3 保存结果

FBX 文件: 如果模型支持，生成后可下载 FBX 格式文件
录制: 使用屏幕录制软件保存动作动画

六、状态信息说明

"📊 状态信息" 区域会显示当前状态：

状态信息	含义
`输入文本后直接点击 [🚀 生成动作] 即可。`	准备就绪
`正在生成动作，请稍候...`	正在处理
`🎉 动作生成完成！`	生成成功
`❌ 动作生成失败：...`	生成失败，请检查输入

七、常见问题

Q1: 生成时间很长，正常吗？

A: 正常。首次生成需要加载模型，可能需要 1-2 分钟。后续生成会快一些。

Q2: 生成的动作和描述不太一样？

A: 尝试：

提高 CFG 强度 到 7.0 或更高
检查文本描述是否清晰
尝试不同的种子

Q3: 动作看起来很僵硬？

A: 这是模型的局限性，可以尝试：

换个种子
调整动作时长
使用更具体的描述

Q4: 支持中文输入吗？

A: 可以尝试，但英文描述的效果通常更好。

Q5: 可以生成多人动作吗？

A: 当前版本主要支持单人动作。

八、快捷键

快捷键	功能
`Space`	暂停/播放
`←`	上一帧
`→`	下一帧
`Home`	重置到起始帧

九、反馈与支持

问题反馈: 欢迎提出问题和建议
二次开发: 科哥 | 微信：312088415

祝你使用愉快！

科哥在UCloud镜像列表【不断更新中】：

https://kege-aigc.feishu.cn/docx/L3FVdQl7kom8Ckx7QiicQj2VnEd

bug反馈可以加入科哥专属群交流➕ 广告勿进！

描述图片内容

@鸡你太美

认证作者

镜像信息

已使用13 次

运行时长

22 H

镜像大小

60GB

最后更新时间

2026-04-27

支持卡型

48G RTX40系RTX40系A800H20A100RTX50系

框架版本

PyTorch-2.8

CUDA版本

12.8

应用

JupyterLab: 8888

版本

v1.0

2026-04-27

PyTorch:2.8 | CUDA:12.8 | 大小:60.00GB

隶属于优刻得科技股份有限公司

股票代码：688158

优刻得是中立、安全的云计算服务平台

友情链接 :

优刻得

产品

GPU实例 GPU镜像社区模型API服务 Coding Plan

快速入口

文档中心 API文档用户协议

镜像合集

AI4S 数字人 TTS语音 Wan2.2 视频超分

HY-Motion1.0腾讯混元开源的文本到3D动作生成模型 汉化构建by科哥

镜像简介

腾讯混元HY-Motion 1.0是什么

镜像使用指南

操作页面截图

HY-Motion-1.0 用户使用手册

一、界面概览

二、基础使用流程

2.1 生成你的第一个动作

2.2 使用预设示例

2.3 查看和播放动作

三、高级设置

3.1 随机种子列表

3.2 CFG 强度

四、常见动作描述参考

4.1 基础动作

4.2 复杂动作

4.3 交互动作

五、使用技巧

5.1 获得更好的生成效果

5.2 多样化尝试

5.3 保存结果

六、状态信息说明

七、常见问题

Q1: 生成时间很长，正常吗？

Q2: 生成的动作和描述不太一样？

Q3: 动作看起来很僵硬？

Q4: 支持中文输入吗？

Q5: 可以生成多人动作吗？

八、快捷键

九、反馈与支持

科哥在UCloud镜像列表【不断更新中】：

bug反馈可以加入科哥专属群交流➕ 广告勿进！​

HY-Motion1.0腾讯混元开源的文本到3D动作生成模型汉化构建by科哥

bug反馈可以加入科哥专属群交流➕ 广告勿进！