镜像社区
部署GPU实例
模型API
文档中心
常见问题(FAQ)
WebUI
深度学习
其他
混元世界大模型-v1.0
HunyuanWorld 1.0 是由腾讯混元团队开发并开源的创新3D世界生成框架,它代表了计算机视觉和图形学领域的一项重大突破。该框架旨在解决现有3D世界生成方法中的局限性,通过融合基于视频的方法的多样性与基于三维几何方法的一致性,提供了一种新的解决方案1。 核心功能上,HunyuanWorld 1.0 提供了以下三大优势: 沉浸式体验:利用全景图像作为360°的世界代理,提供了全方位的沉浸式视觉体验。 工业级兼容性:支持将生成的3D场景导出为标准网格格式,可以无缝集成到现有的3D建模软件和游戏引擎中,如Blender、Unreal Engine和Unity等,增强了模型的实用性和灵活性。 增强交互性:采用解耦式的物体表示方法,实现了对场景中物体的单独编辑和交互,提高了用户的操作自由度和创造力。 在技术实现方面,HunyuanWorld 1.0 利用了先进的语义分层3D网格表征技术和两阶段生成范式,即首先通过一个特制的3D感知变分自编码器(VAE)来理解3D世界,然后使用扩散Transformer(DiT)进行创造性的3D世界构建。这种架构不仅能够从文本描述或图片输入中生成高质量的3D全景图,还能够处理复杂的场景分解与重建任务,从而确保生成世界的连贯性和细节丰富度15。 此外,HunyuanWorld 1.0 的应用场景广泛,涵盖了虚拟现实(VR)、物理仿真、游戏开发以及交互式内容创作等多个领域。其强大的功能和高度的兼容性使得它成为了推动这些行业发展的重要工具,预示着AI驱动的3D内容创作新时代的到来7。 综上所述,HunyuanWorld 1.0 不仅是一个技术上的飞跃,也是一个开启未来无限可能的关键里程碑,为创作者提供了前所未有的能力去探索和创建数字世界。
0/小时
v1.1
v1.0

混元世界大模型-v1.0

简介

HunyuanWorld 1.0 是由腾讯混元团队开发并开源的创新3D世界生成框架,它代表了计算机视觉和图形学领域的一项重大突破。该框架旨在解决现有3D世界生成方法中的局限性,通过融合基于视频的方法的多样性与基于三维几何方法的一致性,提供了一种新的解决方案1。

核心功能上,HunyuanWorld 1.0 提供了以下三大优势:

沉浸式体验:利用全景图像作为360°的世界代理,提供了全方位的沉浸式视觉体验。 工业级兼容性:支持将生成的3D场景导出为标准网格格式,可以无缝集成到现有的3D建模软件和游戏引擎中,如Blender、Unreal Engine和Unity等,增强了模型的实用性和灵活性。 增强交互性:采用解耦式的物体表示方法,实现了对场景中物体的单独编辑和交互,提高了用户的操作自由度和创造力。 在技术实现方面,HunyuanWorld 1.0 利用了先进的语义分层3D网格表征技术和两阶段生成范式,即首先通过一个特制的3D感知变分自编码器(VAE)来理解3D世界,然后使用扩散Transformer(DiT)进行创造性的3D世界构建。这种架构不仅能够从文本描述或图片输入中生成高质量的3D全景图,还能够处理复杂的场景分解与重建任务,从而确保生成世界的连贯性和细节丰富度15。

此外,HunyuanWorld 1.0 的应用场景广泛,涵盖了虚拟现实(VR)、物理仿真、游戏开发以及交互式内容创作等多个领域。其强大的功能和高度的兼容性使得它成为了推动这些行业发展的重要工具,预示着AI驱动的3D内容创作新时代的到来7。

综上所述,HunyuanWorld 1.0 不仅是一个技术上的飞跃,也是一个开启未来无限可能的关键里程碑,为创作者提供了前所未有的能力去探索和创建数字世界。

使用说明

环境启动与使用操作 启动实例后,点击JupyterLab跳转页面 image.png

进入页面后双击笔记,查看简易说明

image.png

访问cmd终端,运行webui

cd /workspace/HunyuanWorld-1.0
python app.py

image.png

回到实例页面,点击 SD Webui跳转gradio页面进行使用

image.png image.png 测试效果如下

image.png

下载模型到本地电脑 回到笔记页面,双击index.html,然后点击左上角Trust HTML

image.png

批量选中模型打开

image.png

就可以预览了

image.png

交流

粉丝Q群:587663288
AI群:996470582

官方说明文档


"一沙一世界,一花一天堂"

https://github.com/user-attachments/assets/4745e6b5-18b5-45be-bd0c-cca3e390c0ad

🔥 最新消息

  • July 26, 2025: 👋 我们开源了HunyuanWorld-1.0的技术报告, 欢迎阅读并与我们一起讨论!
  • July 26, 2025: 🤗 我们发布了第一个开源、可仿真、沉浸式的3D世界生成模型, HunyuanWorld-1.0!

微信群 and Discord 社区

加入我们的 微信群Discord 社区 讨论,获取最新进展以及帮助吧。

微信群小红书XDiscord

☯️ HunyuanWorld 1.0

概览

如何从文本或图像中创建具有沉浸感和可交互性的三维世界,始终是计算机视觉与图形学领域的核心挑战。现有世界生成方法主要分为两类:基于视频的方法虽能提供丰富的多样性,却缺乏三维一致性且渲染效率低下;基于三维几何的方法虽能保证几何一致性,却受限于训练数据不足和内存效率低下的表征方式。为突破这些局限,我们提出HunyuanWorld 1.0框架——一种融合双方优势的创新方案,能够根据文本与图像条件生成兼具沉浸感、可探索性与交互性的三维世界。本方法具有三大核心优势:(1)通过全景世界代理实现360°沉浸式体验;(2)支持网格导出功能,可与现有计算机图形管线无缝兼容;(3)采用解耦式物体表征以增强交互性。该框架的核心在于语义分层的三维网格表征技术,通过将全景图像作为360°世界代理进行语义感知的世界解构与重建,从而生成多样化的三维场景。大量实验表明,本方法在生成连贯、可探索且可交互的三维世界方面达到最先进水平,同时可广泛应用于虚拟现实、物理仿真、游戏开发及交互式内容创作等领域。

模型架构

Tencent HunyuanWorld-1.0 采用生成式架构,结合全景图像合成与分层3D重建技术,实现了高质量、沉浸式的可漫游3D场景生成。该模型通过语义分层的3D场景表征与生成算法,同时支持"文生世界"和"图生世界"两种生成方式。生成的多样化风格3D场景可导出为3D网格资产,最大程度兼容现有图形渲染管线。

性能评估

我们针对HunyuanWorld 1.0与其他开源全景图生成方法及3D世界生成方法进行了系统性对比评估。量化实验结果表明,HunyuanWorld 1.0在视觉质量与几何一致性方面显著超越基线模型。

文生全景图:

MethodBRISQUE(⬇)NIQE(⬇)Q-Align(⬆)CLIP-T(⬆)
Diffusion36069.57.51.820.9
MVDiffusion47.97.12.421.5
PanFusion56.67.62.221.0
LayerPano3D49.66.53.721.5
HunyuanWorld 1.040.85.84.424.3

图生全景图:

MethodBRISQUE(⬇)NIQE(⬇)Q-Align(⬆)CLIP-I(⬆)
Diffusion36071.47.81.973.9
MVDiffusion47.77.02.780.8
HunyuanWorld 1.045.25.84.385.1
镜像信息
@Ikaros
已使用
0
镜像大小130GB
最近编辑2025-08-05
支持卡型
H20A800A100
+3
框架版本
PyTorch-2.5.1
CUDA版本
12.4
应用
JupyterLab: 8888
版本
v1.1
2025-08-07
PyTorch:2.5.1 | CUDA:12.4 | 大小:130.00GB
v1.0
2025-08-05
PyTorch:2.5.1 | CUDA:12.4 | 大小:130.00GB