登录
HY-Motion1.0腾讯混元开源的文本到3D动作生成模型 汉化构建by科哥
HY-Motion1.0腾讯混元开源的文本到3D动作生成模型 汉化构建by科哥
star0
0/小时
v1.0
最新

镜像名称

  • HY-Motion1.0腾讯混元开源的文本到3D动作生成模型 汉化构建by科哥

镜像简介

腾讯混元HY-Motion 1.0是什么

  • 腾讯混元HY-Motion 1.0(混元Motion 1.0)是腾讯混元团队开源的十亿参数级文本到 3D 动作生成大模型。
  • 基于 Diffusion Transformer(DiT)架构与流匹配机制,仅需一句自然语言描述
  • 能生成高保真、流畅多样的 3D 角色骨骼动画。模型采用全阶段训练策略,
  • 包括在超 3000 小时多样化动作数据上预训练、在 400 小时精选高质量数据上微调,
  • 以及通过强化学习结合人类反馈和奖励模型进行优化。覆盖 6 大类超 200 种动作,
  • 输出为 SMPL-H 骨骼格式,支持原子动作、组合序列及并发动作生成。在性能评估中,
  • 指令遵循能力达 78.6%,动作质量平均 3.43 分(5 分制),全面超越 MoMask、DART 等开源基线。
  • 源码地址:https://github.com/Tencent-Hunyuan/HY-Motion-1.0

bug反馈可以加入科哥专属群交流➕ 广告勿进!​

描述图片内容

科哥在UCloud镜像列表【不断更新中】:


image.png image.png

image.png

image.png


HY-Motion-1.0 用户使用手册

webUI 二次开发 by 科哥 | 微信:312088415 最后更新: 2025-12-30


一、界面概览

打开 WebUI 后,你会看到一个简洁的界面,主要分为三个区域:

┌─────────────────────────────────────────────────────────────┐
│                    【标题区域 - 紫蓝渐变】                    │
│              HY-Motion-1.0: 文本生成动作                      │
│                   *腾讯混元 3D 数字人团队*                    │
└─────────────────────────────────────────────────────────────┘

┌──────────────┬──────────────────────────────────────────────┐
│  【左侧面板】  │              【右侧 3D 可视化区域】              │
│              │                                              │
│  控制输入区   │           动作预览和播放                        │
│              │                                              │
└──────────────┴──────────────────────────────────────────────┘

┌─────────────────────────────────────────────────────────────┐
│                  【版权信息 - 紫蓝渐变】                      │
│          webUI二次开发 by 科哥 | 微信:312088415              │
└─────────────────────────────────────────────────────────────┘

二、基础使用流程

2.1 生成你的第一个动作

步骤 1: 输入文本描述

在左侧 "📝 输入文本" 框中,用英文描述你想要生成的动作。

推荐格式: A person ... (一个人...)

示例:

A person walks forward.
(一个人向前走。)

A person jumps up.
(一个人向上跳。)

A person dances jazz, jumping rhythmically.
(一个人跳爵士舞,有节奏地跳跃。)

步骤 2: 调整动作时长

拖动 "⏱️ 动作时长(秒)" 滑块,设置动作持续时间(0.5~12 秒)

步骤 3: 点击生成

点击 "🚀 生成动作" 按钮,等待片刻,右侧 3D 区域会显示生成的动作。


2.2 使用预设示例

点击 "📚 测试示例" 下拉菜单,选择预设的动作示例:

  • 中文英文双语显示
  • 选择后会自动填充文本并设置合适的时长
  • 然后直接点击 "🚀 生成动作" 即可

2.3 查看和播放动作

生成完成后,右侧 3D 可视化区域会显示:

  • 3D 人物模型: 展示生成的动作
  • 进度条: 拖动可以跳转到任意帧
  • 帧计数器: 显示当前帧 / 总帧数
  • 自动播放: 动作会自动循环播放

操作提示:

  • 鼠标左键拖动: 旋转视角
  • 鼠标滚轮: 缩放
  • 鼠标右键拖动: 平移
  • 点击画面: 暂停/播放
  • 双击画面: 重置到起始帧

三、高级设置

点击 "🔧 高级设置" 展开更多选项:

3.1 随机种子列表

"🎯 随机种子列表(逗号分隔)"

  • 格式: 0,1,2,3 (逗号分隔的数字)
  • 作用: 控制生成动作的随机性
  • 相同的种子 + 相同的文本 = 相同的动作
  • "🎲 随机按钮": 快速生成 4 个随机种子

使用场景:

  • 想要不同变化: 使用不同种子
  • 想要复现某个动作: 记住该种子值

3.2 CFG 强度

"⚙️ CFG 强度" (1.0 ~ 10.0)

  • 全称: Classifier-Free Guidance
  • 作用: 控制生成动作对文本的忠实度
  • 数值越高: 动作越严格遵循文本描述
  • 数值越低: 动作越多样化/随机

推荐值:

  • 初次尝试: 5.0 (默认值)
  • 动作不准确: 尝试 7.0 ~ 10.0
  • 想要更多变化: 尝试 1.0 ~ 3.0

四、常见动作描述参考

4.1 基础动作

英文描述中文含义
A person walks forward.一个人向前走。
A person runs forward.一个人向前跑去。
A person jumps up.一个人向上跳。
A person sits down on a chair.一个人坐在椅子上。
A person stands up from the chair.一个人从椅子上站起来。

4.2 复杂动作

英文描述中文含义
A person dances jazz, jumping rhythmically.一个人跳爵士舞,有节奏地跳跃。
A person performs a squat.一个人做深蹲。
A person plays the piano.一个人弹钢琴。
A person kicks a soccer ball.一个人踢足球。
A person swings a golf club.一个人挥动高尔夫球杆。

4.3 交互动作

英文描述中文含义
A person picks up an object from ground.一个人从地面捡起物品。
A person speaks, gesturing with both hands.一个人说话,双手做手势。
A person waves their right hand.一个人挥手。

五、使用技巧

5.1 获得更好的生成效果

  1. 使用标准的 A person ... 格式开头
  2. 描述具体: A person walks quicklyA person moves 更好
  3. 合理设置时长: 简单动作 3-5 秒,复杂动作 6-10 秒
  4. 调整 CFG 强度: 动作不准确时提高 CFG 值

5.2 多样化尝试

  • 保持文本不变,修改种子 获得不同变体
  • 多个种子(如 0,1,2,3)会同时生成多个版本
  • 在预设示例基础上修改文本

5.3 保存结果

  • FBX 文件: 如果模型支持,生成后可下载 FBX 格式文件
  • 录制: 使用屏幕录制软件保存动作动画

六、状态信息说明

"📊 状态信息" 区域会显示当前状态:

状态信息含义
输入文本后直接点击 [🚀 生成动作] 即可。准备就绪
正在生成动作,请稍候...正在处理
🎉 动作生成完成!生成成功
❌ 动作生成失败:...生成失败,请检查输入

七、常见问题

Q1: 生成时间很长,正常吗?

A: 正常。首次生成需要加载模型,可能需要 1-2 分钟。后续生成会快一些。

Q2: 生成的动作和描述不太一样?

A: 尝试:

  • 提高 CFG 强度 到 7.0 或更高
  • 检查文本描述是否清晰
  • 尝试不同的种子

Q3: 动作看起来很僵硬?

A: 这是模型的局限性,可以尝试:

  • 换个种子
  • 调整动作时长
  • 使用更具体的描述

Q4: 支持中文输入吗?

A: 可以尝试,但英文描述的效果通常更好。

Q5: 可以生成多人动作吗?

A: 当前版本主要支持单人动作。


八、快捷键

快捷键功能
Space暂停/播放
上一帧
下一帧
Home重置到起始帧

九、反馈与支持

  • 问题反馈: 欢迎提出问题和建议
  • 二次开发: 科哥 | 微信:312088415

祝你使用愉快!

@科哥AIGC
科哥AIGC认证作者
镜像信息
已使用0
运行时长
0 H
镜像大小
60GB
最后更新时间
2025-12-31
支持卡型
48G RTX40系RTX40系A800H20A100RTX50系
+6
框架版本
PyTorch-2.8
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v1.0
2025-12-31
PyTorch:2.8 | CUDA:12.8 | 大小:60.00GB