登录
镜像社区
我的收藏
快捷筛选
官方镜像免费镜像支持自启动
LLM
DeepSeekQwenGLMGemmallama文本生成机器翻译推理框架模型训练
AI绘画
SDFluxComfyUICogViewLoraWanHunyuan图像修复图生文Qwen-image视频生成图片生成
AIGC
语音合成语音识别数字人具身智能音乐语音克隆AI编程语音分离语音翻译视频剪辑
计算机视觉
目标检测语义分割图像分类三维重建视觉场景识别
科学计算
物理模拟数据分析量子计算生物信息分子动力蛋白结构预测
其他
其他
carousel
默认排序
数字人
RecommendCount
最强AI数字人InfiniteTalk-图片和视频数字人
最强AI数字人InfiniteTalk-图片和视频数字人
280
@与AI同行
与AI同行认证作者
5562
19903H
更新时间2025-11-25
支持自启动
支持图片数字人、视频数字人、双人数字人,支持说话+唱歌对口型、长视频、完整歌曲生成、批量生成、高清放大!
支持图片数字人、视频数字人、双人数字人,支持说话+唱歌对口型、长视频、完整歌曲生成、批量生成、高清放大!
0/小时
数字人
RecommendCount
LiveTalking
LiveTalking
57
@lipku
lipku认证作者
2985
42757H
更新时间2026-01-04
LiveTalking镜像提供实时交互数字人解决方案,支持ERNerf、MuseTalk、Wav2Lip,实现单张人脸照片驱动的超低延迟(<100ms)唇形同步、表情及头部运动控制。
LiveTalking镜像提供实时交互数字人解决方案,支持ERNerf、MuseTalk、Wav2Lip,实现单张人脸照片驱动的超低延迟(<100ms)唇形同步、表情及头部运动控制。
0/小时
语音合成语音克隆
RecommendCount
SVC-Fusion
SVC-Fusion
53
@aiguoliuguo
aiguoliuguo认证作者
2741
11475H
更新时间2026-01-04
本整合包将整合So-Vits-SVC4.1、DDSP-SVC-6.3/6.1/6.0、ReFlow-VAE-SVC多种SVC模型训练及推理
本整合包将整合So-Vits-SVC4.1、DDSP-SVC-6.3/6.1/6.0、ReFlow-VAE-SVC多种SVC模型训练及推理
0/小时
语音合成语音克隆
RecommendCount
GPT-Sovits_V4
GPT-Sovits_V4
41
@红血球AE3803
红血球AE3803认证作者
2301
12504H
更新时间2025-12-23
GPT-SoVITS V4 是 RVC-Boss 开源的极致低门槛 TTS/变声器,仅需 1 分钟干声即可训练高相似音色,支持中英日韩粤五语种零样本与跨语言推理
GPT-SoVITS V4 是 RVC-Boss 开源的极致低门槛 TTS/变声器,仅需 1 分钟干声即可训练高相似音色,支持中英日韩粤五语种零样本与跨语言推理
0/小时
模型训练视频生成其他
LTX2官方训练器Lora训练
LTX2官方训练器Lora训练
0
@梦影Erislia
4
0H
更新时间2026-01-12
LTX2官方训练器的lora训练支持,内置模型t2v,小白可以一键运行,也可以根据官方文档进行进阶操作
LTX2官方训练器的lora训练支持,内置模型t2v,小白可以一键运行,也可以根据官方文档进行进阶操作
0/小时
数字人
ltx-2全能lora运镜comfyui工作流文生视频图生视频一键运行 构建by科哥
ltx-2全能lora运镜comfyui工作流文生视频图生视频一键运行 构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
5
0H
更新时间2026-01-11
支持自启动
ltx-2全能lora运镜comfyui工作流文生视频图生视频一键运行 构建by科哥
ltx-2全能lora运镜comfyui工作流文生视频图生视频一键运行 构建by科哥
0/小时
Qwen-image
Tongbi-支持Qwen-Image和Qwen-Image-Edit
Tongbi-支持Qwen-Image和Qwen-Image-Edit
33
@十字鱼
十字鱼认证作者
187
2005H
更新时间2026-01-11
支持自启动
阿里通义千问开源最强图像模型,强大的文字渲染能力,强大的图像编辑能力
阿里通义千问开源最强图像模型,强大的文字渲染能力,强大的图像编辑能力
0/小时
Wan图片生成视频生成
闪电AI视频、图片生成镜像
闪电AI视频、图片生成镜像
0
@cola
4
8H
更新时间2026-01-12
支持自启动
基于lightx2v框架加速的视频、图片生成服务,快速生成视频图片,基于模型wan2.2、qwen-image、z-image
基于lightx2v框架加速的视频、图片生成服务,快速生成视频图片,基于模型wan2.2、qwen-image、z-image
0.1/小时
数字人
TurboDiffusion清华大学等推出的视频生成加速框架 webUI二次修改构建by科哥
TurboDiffusion清华大学等推出的视频生成加速框架 webUI二次修改构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
21
14H
更新时间2026-01-10
支持自启动
实现将ai视频生成速度提升百倍!基于wan2.1,wan2.2
实现将ai视频生成速度提升百倍!基于wan2.1,wan2.2
0/小时
图像修复图片生成
nano banana谷歌香蕉在线绘画在线改图修改图片模型香蕉模型
nano banana谷歌香蕉在线绘画在线改图修改图片模型香蕉模型
0
@科哥AIGC
科哥AIGC认证作者
4
0H
更新时间2026-01-10
支持自启动
nano banana谷歌香蕉在线绘画在线改图修改图片模型香蕉模型
nano banana谷歌香蕉在线绘画在线改图修改图片模型香蕉模型
0/小时
语音合成
【音谷官方】indextts2-api
【音谷官方】indextts2-api
2
@音谷官方
18
58H
更新时间2026-01-12
支持自启动
【音谷官方】音谷对应的API
【音谷官方】音谷对应的API
0.01/小时
视频生成SD数字人
LTX-2 WebUI版
LTX-2 WebUI版
2
@鹄仙
鹄仙认证作者
10
10H
更新时间2026-01-10
基于wangp的LTX-2,WebUI版
基于wangp的LTX-2,WebUI版
0/小时
数字人
LiveTalking_GPT-SOVITS-V2_Ollama_洛曦AI数字人
LiveTalking_GPT-SOVITS-V2_Ollama_洛曦AI数字人
16
@Ikaros
208
1414H
更新时间2026-01-12
LiveTalking + GPT-SOVITS V2 + Ollama + FunASR 洛曦AI定制版,实时语音对话数字人 + 直播版数字人
LiveTalking + GPT-SOVITS V2 + Ollama + FunASR 洛曦AI定制版,实时语音对话数字人 + 直播版数字人
0/小时
视频生成
开源版Veo3!LTX2-视频生成合集,文生视频、图生视频、视频人物配音+口型同步、直出1080P,高清细节放大、提示词增强、支持线条+深度+姿势控制!
开源版Veo3!LTX2-视频生成合集,文生视频、图生视频、视频人物配音+口型同步、直出1080P,高清细节放大、提示词增强、支持线条+深度+姿势控制!
11
@与AI同行
与AI同行认证作者
52
46H
更新时间2026-01-09
支持自启动
开源版Veo3!LTX2-视频生成合集,文生视频、图生视频、视频人物配音+口型同步、直出1080P,高清细节放大、提示词增强、支持线条+深度+姿势控制!
开源版Veo3!LTX2-视频生成合集,文生视频、图生视频、视频人物配音+口型同步、直出1080P,高清细节放大、提示词增强、支持线条+深度+姿势控制!
0/小时
ComfyUI视频生成图片生成
ComfyUI云端整合包LTX-2特别版
ComfyUI云端整合包LTX-2特别版
3
@鹄仙
鹄仙认证作者
33
25H
更新时间2026-01-08
支持LTX-2 scail wan2.2系列
支持LTX-2 scail wan2.2系列
0/小时
数字人ComfyUI视频生成
 LTX-2:首个开源音画同步生成模型,提示词遵从比肩Sora,理解分镜脚本,一键AI成片!
LTX-2:首个开源音画同步生成模型,提示词遵从比肩Sora,理解分镜脚本,一键AI成片!
1
@社恐的知识树
社恐的知识树认证作者
24
26H
更新时间2026-01-09
LTX-2 是由 Lightricks 开源的 DiT 架构音频-视频基础模型,核心特点是:在同一个模型里同步生成视频与音频,超强提示词理解,支持多镜头脚本,关键词自动匹配视频风格,一键AI成片!
LTX-2 是由 Lightricks 开源的 DiT 架构音频-视频基础模型,核心特点是:在同一个模型里同步生成视频与音频,超强提示词理解,支持多镜头脚本,关键词自动匹配视频风格,一键AI成片!
0/小时
语音合成
Voice Sculptor捏声音基于LLaSA和CosyVoice2的指令化语音合成语音模型 二次开发构建by科哥
Voice Sculptor捏声音基于LLaSA和CosyVoice2的指令化语音合成语音模型 二次开发构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
5
1H
更新时间2026-01-08
支持自启动
Voice Sculptor捏声音基于LLaSA和CosyVoice2的指令化语音合成语音模型 二次开发构建by科哥
Voice Sculptor捏声音基于LLaSA和CosyVoice2的指令化语音合成语音模型 二次开发构建by科哥
0/小时
ComfyUI视频生成Qwen-image
LTX-2.0音画同步视频生成|Z-Image-Turbo&Qwen-Image-Edit1图片编辑
LTX-2.0音画同步视频生成|Z-Image-Turbo&Qwen-Image-Edit1图片编辑
3
@老徐Ai研习社
老徐Ai研习社认证作者
18
24H
更新时间2026-01-08
支持自启动
LTX-2.0音画同步视频生成
LTX-2.0音画同步视频生成
0/小时
数字人ComfyUI视频生成
LTX-2 Audio-Video:开源首个 · 音画同步生成
LTX-2 Audio-Video:开源首个 · 音画同步生成
2
@AI-KSK
AI-KSK认证作者
31
48H
更新时间2026-01-07
双官方流程全覆盖:同时支持 ComfyUI 官方 LTX 工作流示例 + Lightricks 官方 ComfyUI-LTXVideo 自定义节点与全部示例工作流
双官方流程全覆盖:同时支持 ComfyUI 官方 LTX 工作流示例 + Lightricks 官方 ComfyUI-LTXVideo 自定义节点与全部示例工作流
0/小时
ComfyUIWan视频生成
Comfy二次元跑图生视频DaSiWa和vace跳舞
Comfy二次元跑图生视频DaSiWa和vace跳舞
2
@梦影Erislia
37
73H
更新时间2026-01-06
Comfy二次元跑图生视频DaSiWa和vace跳舞
Comfy二次元跑图生视频DaSiWa和vace跳舞
0/小时
音乐
NotaGen基于 LLM 范式的高音乐性古典符号化音乐生成模型 二次开发构建by科哥
NotaGen基于 LLM 范式的高音乐性古典符号化音乐生成模型 二次开发构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
1
0H
更新时间2026-01-06
支持自启动
NotaGen基于 LLM 范式的高音乐性古典符号化音乐生成模型 二次开发构建by科哥
NotaGen基于 LLM 范式的高音乐性古典符号化音乐生成模型 二次开发构建by科哥
0/小时
语音识别
SenseVoice多语言语音识别情感识别系统  二次开发构建by科哥
SenseVoice多语言语音识别情感识别系统 二次开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
3
0H
更新时间2026-01-05
支持自启动
SenseVoice多语言语音识别情感识别系统 二次开发构建by科哥
SenseVoice多语言语音识别情感识别系统 二次开发构建by科哥
0/小时
语音翻译
FunASR中文语音识别音频转文本声音转文本系统 二次webui开发构建by科哥
FunASR中文语音识别音频转文本声音转文本系统 二次webui开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
2
0H
更新时间2026-01-05
支持自启动
音频声音识别系统
音频声音识别系统
0/小时
语音分离
SAM Audio一个Meta开源的音频分割模型声音分离音频音乐分离应用 二次开发构建by科哥
SAM Audio一个Meta开源的音频分割模型声音分离音频音乐分离应用 二次开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
17
23H
更新时间2026-01-05
支持自启动
可从复杂的音频混合中分离出特定的声音
可从复杂的音频混合中分离出特定的声音
0/小时
图像修复
UNet Universal Matting基于UNet模型抠图批量抠图 webUI一键抠图 构建by科哥
UNet Universal Matting基于UNet模型抠图批量抠图 webUI一键抠图 构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
2
0H
更新时间2026-01-06
支持自启动
基于UNet模型抠图批量抠图 webUI一键抠图 构建by科哥
基于UNet模型抠图批量抠图 webUI一键抠图 构建by科哥
0/小时
ComfyUIQwen-imageFlux
ComfyUI_最新26年01月-Niugee-牛哥整合包-V2
ComfyUI_最新26年01月-Niugee-牛哥整合包-V2
4
@NiuGee
NiuGee认证作者
49
57H
更新时间2026-01-08
整合26年最新版本ComfyUI,已下载好常用图像模型,修改端口到7860方便管理界面一键启动
整合26年最新版本ComfyUI,已下载好常用图像模型,修改端口到7860方便管理界面一键启动
0/小时
视频生成
最强AI生成长视频,Wan2.2-SVI2Pro整合包!一次性生成一分钟视频,一次性生成30s分镜视频!
最强AI生成长视频,Wan2.2-SVI2Pro整合包!一次性生成一分钟视频,一次性生成30s分镜视频!
5
@与AI同行
与AI同行认证作者
69
137H
更新时间2026-01-04
支持自启动
最强AI生成长视频,Wan2.2-SVI2Pro整合包!一次性生成一分钟视频,一次性生成30s分镜视频!
最强AI生成长视频,Wan2.2-SVI2Pro整合包!一次性生成一分钟视频,一次性生成30s分镜视频!
0/小时
ComfyUI视频生成Wan
ComfyUI云端整合包2601
ComfyUI云端整合包2601
2
@鹄仙
鹄仙认证作者
30
110H
更新时间2026-01-09
长视频系列升级 不仅仅是SVI2 pro 长视频、LongCat数字人
长视频系列升级 不仅仅是SVI2 pro 长视频、LongCat数字人
0/小时
Qwen模型训练Lora
Qwen 2512的Lora训练,内置模型,一键训练AI-Toolkit
Qwen 2512的Lora训练,内置模型,一键训练AI-Toolkit
4
@梦影Erislia
24
85H
更新时间2026-01-04
Qwen 2512的Lora训练,内置模型,一键训练AI-Toolkit
Qwen 2512的Lora训练,内置模型,一键训练AI-Toolkit
0/小时
图片生成
banana-slides基于谷歌人工智能ai制作幻灯片ai制作ppt制作幻灯片 构建by科哥
banana-slides基于谷歌人工智能ai制作幻灯片ai制作ppt制作幻灯片 构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
4
0H
更新时间2026-01-04
支持自启动
banana-slides基于谷歌人工智能ai制作幻灯片ai制作ppt制作幻灯片 构建by科哥
banana-slides基于谷歌人工智能ai制作幻灯片ai制作ppt制作幻灯片 构建by科哥
0/小时
ComfyUIQwen-image图片生成
Qwen-Image-2512模型_QwenVL3反推_SeedVR2放大多合一
Qwen-Image-2512模型_QwenVL3反推_SeedVR2放大多合一
1
@社恐的知识树
社恐的知识树认证作者
25
63H
更新时间2026-01-03
集成千问图像2512模型+QwenVL3图像视频反推API+最强放大SeedVR2多合一工作流,Comfyui-v0.7.0
集成千问图像2512模型+QwenVL3图像视频反推API+最强放大SeedVR2多合一工作流,Comfyui-v0.7.0
0/小时
视频剪辑其他
magic-tryon图片视频虚拟试装换装模特换衣 二次webui开发构建by科哥
magic-tryon图片视频虚拟试装换装模特换衣 二次webui开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
5
0H
更新时间2026-01-03
支持自启动
magic-tryon图片视频虚拟试装换装模特换衣
magic-tryon图片视频虚拟试装换装模特换衣
0/小时
数字人其他
sora2文生视频、图生视频工作流
sora2文生视频、图生视频工作流
25
@科哥AIGC
科哥AIGC认证作者
163
1106H
更新时间2026-01-03
支持自启动
sora2文生视频图生视频工作流comfyui无卡模式在线sora使用独一份
sora2文生视频图生视频工作流comfyui无卡模式在线sora使用独一份
0/小时
图片生成
图文创作神器一句话一张图片生成小红书图文 构建by科哥
图文创作神器一句话一张图片生成小红书图文 构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
2
0H
更新时间2026-01-02
支持自启动
图文创作神器一句话一张图片生成小红书图文
图文创作神器一句话一张图片生成小红书图文
0/小时
LoraQwen-imageWan
AiToolKit汉化版
AiToolKit汉化版
26
@Doc_workBox
305
3457H
更新时间2026-01-02
支持自启动
Aitoolkit汉化版,自适应UI方便手机端查看训练进度
Aitoolkit汉化版,自适应UI方便手机端查看训练进度
0.1/小时
图片生成
阿里千问开源Qwen-Image-2512图像生成模型 二次开发构建by科哥
阿里千问开源Qwen-Image-2512图像生成模型 二次开发构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
4
4H
更新时间2026-01-02
支持自启动
需要80gb显存运行该项目
需要80gb显存运行该项目
0/小时
物理模拟分子动力量子计算
gromacs_deepmd机器学习训练水分子力场
gromacs_deepmd机器学习训练水分子力场
0
@tty
0
0H
更新时间2026-01-01
内含deepmd机器学习力场训练水分子,gromacs调用运行例子
内含deepmd机器学习力场训练水分子,gromacs调用运行例子
0/小时
物理模拟量子计算分子动力
deepmd_lammps训练和运行镜像
deepmd_lammps训练和运行镜像
0
@tty
5
6H
更新时间2026-01-01
内含ch4简单例子,也可用来训练自己的模型,3080ti版本
内含ch4简单例子,也可用来训练自己的模型,3080ti版本
0/小时
三维重建
HY-Motion1.0腾讯混元开源的文本到3D动作生成模型 汉化构建by科哥
HY-Motion1.0腾讯混元开源的文本到3D动作生成模型 汉化构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
2
1H
更新时间2025-12-31
HY-Motion1.0腾讯混元开源的文本到3D动作生成模型 汉化构建by科哥
HY-Motion1.0腾讯混元开源的文本到3D动作生成模型 汉化构建by科哥
0/小时
ComfyUI视频生成Wan
wan2.1-scail动作迁移
wan2.1-scail动作迁移
5
@匹夫
匹夫认证作者
45
53H
更新时间2025-12-31
wan2.1-scail动作迁移
wan2.1-scail动作迁移
0/小时
图片生成Qwen-image模型训练
Qwen‑Image‑Edit‑2511-LoRA训练 x AI Toolkit
Qwen‑Image‑Edit‑2511-LoRA训练 x AI Toolkit
4
@AI-KSK
AI-KSK认证作者
41
262H
更新时间2026-01-01
这是一个集成了 Qwen-Image-Edit-2511模型与 AI Toolkit 训练框架的预配置环境,旨在支持用户高效微调出具备精准图像编辑、风格迁移及多主体一致性能力的定制化 LoRA 模型。
这是一个集成了 Qwen-Image-Edit-2511模型与 AI Toolkit 训练框架的预配置环境,旨在支持用户高效微调出具备精准图像编辑、风格迁移及多主体一致性能力的定制化 LoRA 模型。
0/小时
语音克隆
 ChatterBox多语言语音合成语言克隆声音克隆 webui二次开发构建by科哥
ChatterBox多语言语音合成语言克隆声音克隆 webui二次开发构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
9
1H
更新时间2025-12-31
支持自启动
支持23个国家的语言声音克隆
支持23个国家的语言声音克隆
0/小时
其他
LatentSync 1.6 纯净版
LatentSync 1.6 纯净版
2
@knzskl
3
0H
更新时间2025-12-31
字节跳动、北京交通大学联合推出的端到端唇形同步框架。Latent Sync利用稳定扩散和TREPA的力量,为动态和逼真的视频生成提供精确的高分辨率唇形同步。
字节跳动、北京交通大学联合推出的端到端唇形同步框架。Latent Sync利用稳定扩散和TREPA的力量,为动态和逼真的视频生成提供精确的高分辨率唇形同步。
0/小时
SD模型训练其他
SDXL及系列衍生模型训练,内置WD打标编辑,任意C站模型导入,小白也能轻松上手,AI-Toolkit
SDXL及系列衍生模型训练,内置WD打标编辑,任意C站模型导入,小白也能轻松上手,AI-Toolkit
5
@梦影Erislia
72
402H
更新时间2025-12-30
SDXL及系列衍生模型训练,内置WD打标编辑,任意C站模型导入,小白也能轻松上手,AI-Toolkit
SDXL及系列衍生模型训练,内置WD打标编辑,任意C站模型导入,小白也能轻松上手,AI-Toolkit
0/小时
图片生成Qwen-image
超强AI图片编辑,QwenEdit-2511合集,单图/双图编辑, 超强人脸一致性,精准涂抹编辑、无色差/位移,一键生成24张姿势图、九宫格分镜
超强AI图片编辑,QwenEdit-2511合集,单图/双图编辑, 超强人脸一致性,精准涂抹编辑、无色差/位移,一键生成24张姿势图、九宫格分镜
16
@与AI同行
与AI同行认证作者
139
296H
更新时间2025-12-30
支持自启动
超强AI图片编辑,QwenEdit-2511合集,单图/双图编辑, 超强人脸一致性,精准涂抹编辑、无色差/位移,一键生成24张姿势图、九宫格分镜
超强AI图片编辑,QwenEdit-2511合集,单图/双图编辑, 超强人脸一致性,精准涂抹编辑、无色差/位移,一键生成24张姿势图、九宫格分镜
0/小时
视频生成图片生成ComfyUI
启梦光影高质量出图二合一
启梦光影高质量出图二合一
0
@麦子AI
7
0H
更新时间2025-12-29
支持自启动
高质量文生图、图生视频。适配40系和50系显卡
高质量文生图、图生视频。适配40系和50系显卡
0.15/小时
视频剪辑数字人
StoryMem基于wan2.2逐镜脚本生成高连贯电影级1分钟多镜头叙事视频 二次开发构建by科哥
StoryMem基于wan2.2逐镜脚本生成高连贯电影级1分钟多镜头叙事视频 二次开发构建by科哥
3
@科哥AIGC
科哥AIGC认证作者
11
6H
更新时间2025-12-29
支持自启动
StoryMem基于wan2.2逐镜脚本生成高连贯电影级1分钟多镜头叙事视频 二次开发构建by科哥
StoryMem基于wan2.2逐镜脚本生成高连贯电影级1分钟多镜头叙事视频 二次开发构建by科哥
0/小时
ComfyUI图片生成其他
ComfyUI学习版_torch_2.8.0
ComfyUI学习版_torch_2.8.0
2
@Lucas老师
21
47H
更新时间2025-12-28
支持自启动
此版本镜像,5090、4090、3090、3080Ti等系列显卡可用,P40显卡不可用
此版本镜像,5090、4090、3090、3080Ti等系列显卡可用,P40显卡不可用
0/小时
ComfyUI图片生成其他
ComfyUI学习版镜像_torch-2.7.1
ComfyUI学习版镜像_torch-2.7.1
3
@Lucas老师
7
7H
更新时间2025-12-28
支持自启动
ComfyUI学习版镜像_torch-2.7.1,高性价比镜像,可开P40显卡,5090显卡勿用,会报错
ComfyUI学习版镜像_torch-2.7.1,高性价比镜像,可开P40显卡,5090显卡勿用,会报错
0/小时
ComfyUIQwen-image
qwen-image工作流合集edit2511-z-image-turbo
qwen-image工作流合集edit2511-z-image-turbo
5
@匹夫
匹夫认证作者
27
34H
更新时间2025-12-28
qwen-image工作流合集
qwen-image工作流合集
0/小时
语音合成
VoxCPM1.5面壁智能开源的端到端语音合成模型附训练lora训练器 构建by科哥
VoxCPM1.5面壁智能开源的端到端语音合成模型附训练lora训练器 构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
8
1H
更新时间2025-12-28
支持自启动
语音合成模型+训练lora训练器
语音合成模型+训练lora训练器
0/小时
其他模型训练Lora
Qwen-2511和Z图像的Lora训练AI-TOOLKIT
Qwen-2511和Z图像的Lora训练AI-TOOLKIT
4
@梦影Erislia
15
73H
更新时间2025-12-28
Qwen-2511和Z图像的Lora训练AI-TOOLKIT
Qwen-2511和Z图像的Lora训练AI-TOOLKIT
0/小时
视觉场景识别
Egox任意视频一键转第一人称视角视频基于wan2.1模型 webui二次开发构建by科哥
Egox任意视频一键转第一人称视角视频基于wan2.1模型 webui二次开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
7
8H
更新时间2025-12-28
支持自启动
将任意视频一键转第一人称视角视频
将任意视频一键转第一人称视角视频
0/小时
ComfyUI视频生成图片生成
启梦光影VIP快速出图二合一
启梦光影VIP快速出图二合一
0
@麦子AI
1
0H
更新时间2025-12-28
支持自启动
2s出图,超级快。注意!本镜像需要部署在50系列显卡上。
2s出图,超级快。注意!本镜像需要部署在50系列显卡上。
0.15/小时
数字人
One-to-All-Animation单图片转换动画视频数字人视频动作模仿器 构建by科哥
One-to-All-Animation单图片转换动画视频数字人视频动作模仿器 构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
5
4H
更新时间2025-12-28
支持自启动
单图片转换动画视频数字人视频动作模仿器
单图片转换动画视频数字人视频动作模仿器
0/小时
数字人具身智能
personaLive实时数字人系统
personaLive实时数字人系统
2
@有趣的80后程序员
有趣的80后程序员认证作者
13
2H
更新时间2025-12-27
支持自启动
实时数字人系统,直播室直接生成分身,低延迟
实时数字人系统,直播室直接生成分身,低延迟
0/小时
图片生成
Qwen-Image-Edit-2511阿里通义推出的全能图像编辑模型 webui二次修改构建by科哥
Qwen-Image-Edit-2511阿里通义推出的全能图像编辑模型 webui二次修改构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
24
4H
更新时间2025-12-27
支持自启动
图片编辑模型 一致性更加好 中文支持更好
图片编辑模型 一致性更加好 中文支持更好
0/小时
模型训练文本生成
DocCaptioner 打标器
DocCaptioner 打标器
2
@Doc_workBox
13
12H
更新时间2025-12-26
支持自启动
Doc的打标器,支持 Qwen3vl及 API 调用
Doc的打标器,支持 Qwen3vl及 API 调用
0.1/小时
语音克隆语音合成
超强AI音色克隆,VoxCPM-V1.5,支持超长文本生成、批量生成,支持音色保存、多音字修改、语速调节,速度超快!
超强AI音色克隆,VoxCPM-V1.5,支持超长文本生成、批量生成,支持音色保存、多音字修改、语速调节,速度超快!
10
@与AI同行
与AI同行认证作者
75
70H
更新时间2025-12-26
支持自启动
超强AI音色克隆,VoxCPM-V1.5,支持超长文本生成、批量生成,支持音色保存、多音字修改、语速调节,速度超快!
超强AI音色克隆,VoxCPM-V1.5,支持超长文本生成、批量生成,支持音色保存、多音字修改、语速调节,速度超快!
0/小时
模型训练
WD14智能打标-Kohya_ss
WD14智能打标-Kohya_ss
0
@大胡
3
1H
更新时间2025-12-26
Kohya_ss完美环境,内置WD14模型免下载,修复依赖报错,开箱即用。
Kohya_ss完美环境,内置WD14模型免下载,修复依赖报错,开箱即用。
1/小时
语音合成语音克隆
SVC-WebUI
SVC-WebUI
32
@乔大峰
乔大峰认证作者
679
5503H
更新时间2025-12-26
一键训练SVC模型,支持上传压缩干声文件,训练完成发送提醒,一键清空训练环境,追求的就是高效率
一键训练SVC模型,支持上传压缩干声文件,训练完成发送提醒,一键清空训练环境,追求的就是高效率
0/小时
ComfyUIWanQwen-image
2025.12全新模型ComfyUI整合包
2025.12全新模型ComfyUI整合包
7
@老徐Ai研习社
老徐Ai研习社认证作者
60
230H
更新时间2025-12-26
支持自启动
ComfyUI2025.12整合包
ComfyUI2025.12整合包
0/小时
ComfyUIWan数字人
数字人-语音克隆-wan2.2视频换人换装-Qwen-Image-Edit2509整合包
数字人-语音克隆-wan2.2视频换人换装-Qwen-Image-Edit2509整合包
28
@老徐Ai研习社
老徐Ai研习社认证作者
358
1279H
更新时间2026-01-03
支持自启动
数字人-语音克隆-wan2.2视频换人换装-Qwen-Image-Edit2509整合包
数字人-语音克隆-wan2.2视频换人换装-Qwen-Image-Edit2509整合包
0/小时
ComfyUI视频生成图片生成
ComfyUI云端整合包2512
ComfyUI云端整合包2512
10
@鹄仙
鹄仙认证作者
35
145H
更新时间2026-01-09
ComfyUI云端整合包2512 支持Z-Image 混元1.5,新增到63个插件,带文件管理系统
ComfyUI云端整合包2512 支持Z-Image 混元1.5,新增到63个插件,带文件管理系统
0/小时
ComfyUI
那颗星星自制香蕉pro和sora2工作流
那颗星星自制香蕉pro和sora2工作流
16
@那颗星星
154
1480H
更新时间2025-12-24
支持自启动
内含我所有自制的comfyui节点和工作流,轻松使用nanobananapro和Sora2
内含我所有自制的comfyui节点和工作流,轻松使用nanobananapro和Sora2
0/小时
SDQwen-image视频生成
千问2511与动作迁移三剑客
千问2511与动作迁移三剑客
1
@鹄仙
鹄仙认证作者
11
23H
更新时间2025-12-27
一个基于Wan2GP的图像编辑与动作迁移视频生成的WebUI项目
一个基于Wan2GP的图像编辑与动作迁移视频生成的WebUI项目
0/小时
WanComfyUI视频生成
TurboDiffusion 100–200×加速ComfyUI-Wan图到视频生成
TurboDiffusion 100–200×加速ComfyUI-Wan图到视频生成
6
@AI-KSK
AI-KSK认证作者
91
252H
更新时间2025-12-25
这是一个超快的AI视频生成工具,1分钟就能把图片变成短视频,速度是普通AI的200倍。
这是一个超快的AI视频生成工具,1分钟就能把图片变成短视频,速度是普通AI的200倍。
0/小时
物理模拟分子动力
Gromacs系列
Gromacs系列
7
@苍耳阿猫
苍耳阿猫认证作者
156
3416H
更新时间2025-12-24
该镜像集成开源高性能分子动力学模拟软件,通过强化多精度算法与GPU并行加速(支持NVIDIA/AMD显卡)实现纳秒级生物大分子运动模拟,优化AI辅助建模与超大体系计算效率,提供跨平台开箱即用解决方案
该镜像集成开源高性能分子动力学模拟软件,通过强化多精度算法与GPU并行加速(支持NVIDIA/AMD显卡)实现纳秒级生物大分子运动模拟,优化AI辅助建模与超大体系计算效率,提供跨平台开箱即用解决方案
0/小时
语音合成语音识别语音克隆
VoxCPM1.5雨落版整合包
VoxCPM1.5雨落版整合包
4
@雨落实战
雨落实战认证作者
48
78H
更新时间2025-12-24
支持自启动
VoxCPM1.5的雨落版整合包
VoxCPM1.5的雨落版整合包
0/小时
FluxWanComfyUI
Bob同学的comfyui云端镜像系列
Bob同学的comfyui云端镜像系列
75
@Bob同学
Bob同学认证作者
1283
4134H
更新时间2025-12-25
支持自启动
此版本内置 (Wan2.2\Flux\Kontext)系列的全部基础模型及工作流
此版本内置 (Wan2.2\Flux\Kontext)系列的全部基础模型及工作流
0/小时
其他
PromptFill专为AI绘画设计的开源结构化提示词生成工具 构建by科哥
PromptFill专为AI绘画设计的开源结构化提示词生成工具 构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
3
0H
更新时间2025-12-24
支持自启动
专为AI绘画设计的开源结构化提示词生成工具
专为AI绘画设计的开源结构化提示词生成工具
0/小时
模型训练
Flux 炼丹炉-25GB模型预装-开箱即用 Kohya_ss FP8
Flux 炼丹炉-25GB模型预装-开箱即用 Kohya_ss FP8
2
@大胡
10
7H
更新时间2025-12-24
预装完整 Kohya_ss 环境及 25GB Flux Dev/FP8 核心模型(含T5/CLIP/VAE),无需配置和下载,开机上传素材即可开始训练。
预装完整 Kohya_ss 环境及 25GB Flux Dev/FP8 核心模型(含T5/CLIP/VAE),无需配置和下载,开机上传素材即可开始训练。
1/小时
ComfyUI数字人视频生成
最强长视频数字人:LongCat-Avatar尝鲜版,其他热门生图、视频也都备好了!
最强长视频数字人:LongCat-Avatar尝鲜版,其他热门生图、视频也都备好了!
6
@老许爱吃肉丶
17
97H
更新时间2025-12-23
支持自启动
最强长视频数字人:LongCat-Avatar尝鲜版,其他热门生图、视频也都备好了!
最强长视频数字人:LongCat-Avatar尝鲜版,其他热门生图、视频也都备好了!
0.2/小时
ComfyUI视频生成数字人
SOTA级音频驱动数字人-LongCat-Video-Avatar
SOTA级音频驱动数字人-LongCat-Video-Avatar
2
@AI-KSK
AI-KSK认证作者
25
37H
更新时间2025-12-22
实现身份永续、动作自然的数字人生成
实现身份永续、动作自然的数字人生成
0/小时
视频生成数字人
AI数字人LongCatAvatar,超强口型+表情+姿势效果,支持长视频!
AI数字人LongCatAvatar,超强口型+表情+姿势效果,支持长视频!
30
@与AI同行
与AI同行认证作者
219
186H
更新时间2026-01-04
支持自启动
AI数字人LongCatAvatar,超强口型+表情+姿势效果,支持长视频!
AI数字人LongCatAvatar,超强口型+表情+姿势效果,支持长视频!
0/小时
图片生成视频生成
SHARP–苹果开源的3D场景生成AI模型图片转3d模型 二次开发构建by科哥
SHARP–苹果开源的3D场景生成AI模型图片转3d模型 二次开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
9
72H
更新时间2025-12-23
支持自启动
SHARP–苹果开源的3D场景生成AI模型图片转3d模型
SHARP–苹果开源的3D场景生成AI模型图片转3d模型
0/小时
语音识别
GLM-ASR智谱开源的语音识别、语音转文本模型  二次开发构建By科哥
GLM-ASR智谱开源的语音识别、语音转文本模型 二次开发构建By科哥
0
@科哥AIGC
科哥AIGC认证作者
1
0H
更新时间2025-12-23
支持自启动
智谱开源的语音识别语音转文本声音转文本模型
智谱开源的语音识别语音转文本声音转文本模型
0/小时
蛋白结构预测分子动力生物信息
Rosetta
Rosetta
1
@苍耳阿猫
苍耳阿猫认证作者
2
1H
更新时间2025-12-23
Rosetta
Rosetta
0/小时
语音合成视频剪辑
AI短视频生成系统ai视频ai语音合成si视频创作系统 构建by科哥
AI短视频生成系统ai视频ai语音合成si视频创作系统 构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
9
3H
更新时间2025-12-23
支持自启动
零门槛,零剪辑经验,让视频创作成为一句话的事
零门槛,零剪辑经验,让视频创作成为一句话的事
0/小时
其他
ai小说ai在线写作系统ai智能写作系统 构建by科哥
ai小说ai在线写作系统ai智能写作系统 构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
7
32H
更新时间2025-12-22
支持自启动
ai小说ai在线写作系统ai智能写作系统
ai小说ai在线写作系统ai智能写作系统
0/小时
模型训练
ai-toolkit炼丹炉,支持多种常见模型训练,内置多种模型
ai-toolkit炼丹炉,支持多种常见模型训练,内置多种模型
2
@MumuOpenK
25
175H
更新时间2025-12-21
支持自启动
ai-toolkit炼丹炉(汉化版)
ai-toolkit炼丹炉(汉化版)
0.1/小时
语音克隆
智谱开源的AI文本转语音模型支持声音克隆GLM-TTS 语音合成系统 二次开发构建by科哥
智谱开源的AI文本转语音模型支持声音克隆GLM-TTS 语音合成系统 二次开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
20
12H
更新时间2025-12-21
支持自启动
智谱开源的AI文本转语音模型支持声音克隆GLM-TTS 语音合成系统 二次开发构建by科哥
智谱开源的AI文本转语音模型支持声音克隆GLM-TTS 语音合成系统 二次开发构建by科哥
0/小时
ComfyUIQwen-image图片生成
Twinflow双流加速千问生图1秒1张
Twinflow双流加速千问生图1秒1张
4
@smthem
13
14H
更新时间2025-12-20
支持自启动
最快千问生图方法,顶配1秒1张
最快千问生图方法,顶配1秒1张
0/小时
其他
next-ai-draw-io
next-ai-draw-io
0
@苍耳阿猫
苍耳阿猫认证作者
0
0H
更新时间2025-12-19
next-ai-draw-io
next-ai-draw-io
0/小时
三维重建ComfyUI
Trellis2代一键图片生成3D模型
Trellis2代一键图片生成3D模型
7
@smthem
58
110H
更新时间2025-12-19
支持自启动
一键图片生成3D模型,输出glb和obj格式,带贴图和法线,自动脱底
一键图片生成3D模型,输出glb和obj格式,带贴图和法线,自动脱底
0/小时
Wan视频生成
TurboDiffusion-ultra-fast-wan
TurboDiffusion-ultra-fast-wan
5
@有趣的80后程序员
有趣的80后程序员认证作者
54
90H
更新时间2025-12-18
让阿里wan模型的视频生成速度提升200倍
让阿里wan模型的视频生成速度提升200倍
0/小时
语音克隆
cosyvoce3阿里最新开源声音克隆应用普通话粤语英语日语方言更加精准情感丰富 二次开发构建By科哥
cosyvoce3阿里最新开源声音克隆应用普通话粤语英语日语方言更加精准情感丰富 二次开发构建By科哥
4
@科哥AIGC
科哥AIGC认证作者
32
25H
更新时间2025-12-18
支持自启动
cosyvoce3阿里最新开源声音克隆应用普通话粤语英语日语方言更加精准情感丰富 二次开发构建By科哥
cosyvoce3阿里最新开源声音克隆应用普通话粤语英语日语方言更加精准情感丰富 二次开发构建By科哥
0/小时
分子动力
cp2k
cp2k
0
@苍耳阿猫
苍耳阿猫认证作者
2
14H
更新时间2025-12-18
cp2k-v2025.2
cp2k-v2025.2
0/小时
语音合成语音克隆
CosyVoice3,多音字控制,音色保存,接口API调用,流式接口,音频降噪
CosyVoice3,多音字控制,音色保存,接口API调用,流式接口,音频降噪
3
@刘悦的技术博客
刘悦的技术博客认证作者
89
182H
更新时间2025-12-18
支持自启动
CosyVoice3,多音字控制,音色保存,接口API调用,流式接口,音频降噪
CosyVoice3,多音字控制,音色保存,接口API调用,流式接口,音频降噪
0/小时
ComfyUI
电商换装到视频-全流程
电商换装到视频-全流程
1
@积木comfyui
20
18H
更新时间2025-12-18
支持自启动
换装-换模特-换姿势-换背景-打光-放大-模特图生视频-全流程
换装-换模特-换姿势-换背景-打光-放大-模特图生视频-全流程
0/小时
GLM文本生成
Nemotron3
Nemotron3
0
@敢敢のwings
敢敢のwings认证作者
0
0H
更新时间2025-12-18
Nemotron 3系列是NVIDIA推出的开放模型家族,包含开放权重、训练数据和训练配方,旨在为构建专业化AI智能体提供领先的效率和准确性。
Nemotron 3系列是NVIDIA推出的开放模型家族,包含开放权重、训练数据和训练配方,旨在为构建专业化AI智能体提供领先的效率和准确性。
0/小时
分子动力
DeePMD-kit
DeePMD-kit
0
@苍耳阿猫
苍耳阿猫认证作者
1
0H
更新时间2025-12-16
DeePMD-kit-v3.1.2
DeePMD-kit-v3.1.2
0/小时
分子动力
LAMMPS
LAMMPS
0
@苍耳阿猫
苍耳阿猫认证作者
11
202H
更新时间2025-12-16
lammps
lammps
0/小时
Wan视频生成数字人
LiveAvatar
LiveAvatar
5
@十字鱼
十字鱼认证作者
11
18H
更新时间2025-12-16
支持自启动
流式实时音频驱动头像生成,无限长度
流式实时音频驱动头像生成,无限长度
0/小时
其他
AI命理预测系统ai算命系统ai大模型算命系统 二次开发构建by科哥
AI命理预测系统ai算命系统ai大模型算命系统 二次开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
12
15H
更新时间2025-12-15
使用最新的ai大模型结合中国传统命理系统开发 可以无卡模式运行这个项目
使用最新的ai大模型结合中国传统命理系统开发 可以无卡模式运行这个项目
0/小时
目标检测语义分割图像分类视觉场景识别
PaddleOCR-VL
PaddleOCR-VL
16
@十字鱼
十字鱼认证作者
92
401H
更新时间2025-12-14
支持自启动
支持 109 种语言 擅长识别文本、表格、公式和图表
支持 109 种语言 擅长识别文本、表格、公式和图表
0/小时
GLM数字人语音合成
GLM-TTS
GLM-TTS
6
@十字鱼
十字鱼认证作者
31
37H
更新时间2025-12-13
支持自启动
可控且富有情感表达的零样本TTS
可控且富有情感表达的零样本TTS
0/小时
其他
知鱼-焕焕镜像
知鱼-焕焕镜像
0
@
4
124H
更新时间2025-12-13
支持自启动
数字人视频生成/Digital Human Video Generation
数字人视频生成/Digital Human Video Generation
0/小时
GLM
Open-AutoGLM
Open-AutoGLM
0
@敢敢のwings
敢敢のwings认证作者
1
1H
更新时间2025-12-13
支持自启动
Open-AutoGLM是由智谱AI在2024年10月推出的开源手机操作智能体框架
Open-AutoGLM是由智谱AI在2024年10月推出的开源手机操作智能体框架
0/小时
GLM
AutoGLM-Phone-9B
AutoGLM-Phone-9B
0
@Ikaros
3
8H
更新时间2025-12-12
支持自启动
AutoGLM-Phone-9B一键启动镜像
AutoGLM-Phone-9B一键启动镜像
0/小时
ComfyUIFluxWan
ComfyUI学习版,内置多种基础模型-MumuOpenK
ComfyUI学习版,内置多种基础模型-MumuOpenK
5
@MumuOpenK
70
245H
更新时间2025-12-12
支持自启动
内置多种基础模型,快速开启comfyui体验
内置多种基础模型,快速开启comfyui体验
0/小时
图片生成模型训练
AI图片ZImage模型训练,一键启动WebUI、无需配置
AI图片ZImage模型训练,一键启动WebUI、无需配置
12
@与AI同行
与AI同行认证作者
109
333H
更新时间2025-12-11
支持自启动
AI图片ZImage模型训练,一键启动WebUI、无需配置
AI图片ZImage模型训练,一键启动WebUI、无需配置
0/小时
图像修复
Wan2.2-14B加速版TTP图片放大ttp加速插画图片放大图片高清图片细节放大 科哥构建
Wan2.2-14B加速版TTP图片放大ttp加速插画图片放大图片高清图片细节放大 科哥构建
0
@科哥AIGC
科哥AIGC认证作者
8
7H
更新时间2025-12-10
支持自启动
专注图片细节放大工作流
专注图片细节放大工作流
0/小时
Flux图片生成图像修复
LongCat-Image
LongCat-Image
3
@十字鱼
十字鱼认证作者
14
6H
更新时间2025-12-09
支持自启动
美团龙猫开源图像模型,包含LongCat-Image文生图和LongCat-Image-Edit图像编辑
美团龙猫开源图像模型,包含LongCat-Image文生图和LongCat-Image-Edit图像编辑
0/小时
模型训练ComfyUILora
z-image-turbo lora炼丹炉ai-toolkit lora模型训练器
z-image-turbo lora炼丹炉ai-toolkit lora模型训练器
25
@老徐Ai研习社
老徐Ai研习社认证作者
306
1843H
更新时间2025-12-10
支持自启动
z-image-turbo lora炼丹炉ai-toolkit lora模型训练器
z-image-turbo lora炼丹炉ai-toolkit lora模型训练器
0/小时
语音合成
indextts2-IndexTTS2 最新 V23版本的全面升级情感控制更好 构建by科哥
indextts2-IndexTTS2 最新 V23版本的全面升级情感控制更好 构建by科哥
16
@科哥AIGC
科哥AIGC认证作者
308
681H
更新时间2025-12-08
支持自启动
V23版本的全面升级情感控制更好
V23版本的全面升级情感控制更好
0/小时
数字人
Heygem数字人视频生成系统批量版webui版 二次开发构建by科哥
Heygem数字人视频生成系统批量版webui版 二次开发构建by科哥
7
@科哥AIGC
科哥AIGC认证作者
67
199H
更新时间2025-12-08
支持自启动
一键批量生成 一键打包下载视频
一键批量生成 一键打包下载视频
0/小时
其他
PaddleOCR在线webui文字文稿识别多种识别pdf文字识别 二次开发构建by科哥
PaddleOCR在线webui文字文稿识别多种识别pdf文字识别 二次开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
12
29H
更新时间2025-12-08
支持自启动
PaddleOCR在线webui文字文稿识别多种识别pdf文字识别 二次开发构建by科哥
PaddleOCR在线webui文字文稿识别多种识别pdf文字识别 二次开发构建by科哥
0/小时
ComfyUI图片生成
LongCat:双语超强图像生成与编辑,引领写实与精准创作新标准。
LongCat:双语超强图像生成与编辑,引领写实与精准创作新标准。
1
@AI-KSK
AI-KSK认证作者
3
0H
更新时间2025-12-08
LongCat 是美团开源的双语图像生成与编辑模型,具备高效写实表现、强中文渲染与精准一致性编辑能力,在开源领域表现领先。
LongCat 是美团开源的双语图像生成与编辑模型,具备高效写实表现、强中文渲染与精准一致性编辑能力,在开源领域表现领先。
0/小时
数字人语音克隆语音分离
VoxCPM
VoxCPM
5
@十字鱼
十字鱼认证作者
37
48H
更新时间2025-12-08
支持自启动
面壁智能开源语音克隆 全新1.5版本
面壁智能开源语音克隆 全新1.5版本
0/小时
语音合成语音克隆语音识别
VoxCPM 1.5B
VoxCPM 1.5B
2
@鹄仙
鹄仙认证作者
40
17H
更新时间2025-12-07
全新VoxCPM1.5B,增强长音频输出稳定性
全新VoxCPM1.5B,增强长音频输出稳定性
0/小时
音乐
MSST-WebUI音乐音频分离器背景音乐音频分离器n合一 二次开发构建by科哥
MSST-WebUI音乐音频分离器背景音乐音频分离器n合一 二次开发构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
47
333H
更新时间2025-12-07
支持自启动
MSST-WebUI音乐音频分离器背景音乐音频分离器n合一
MSST-WebUI音乐音频分离器背景音乐音频分离器n合一
0/小时
数字人视频剪辑
facefusion3.5.1离线全部模型最新TensorRT加速官方原版图片换脸视频换脸高清图片 构建By科哥
facefusion3.5.1离线全部模型最新TensorRT加速官方原版图片换脸视频换脸高清图片 构建By科哥
10
@科哥AIGC
科哥AIGC认证作者
132
176H
更新时间2025-12-07
支持自启动
facefusion3.5.0离线全部模型最新TensorRT加速官方原版图片换脸视频换脸高清图片 构建By科哥
facefusion3.5.0离线全部模型最新TensorRT加速官方原版图片换脸视频换脸高清图片 构建By科哥
0/小时
语音合成
VibeVoice语音合成系统二次webui开发构建by科哥
VibeVoice语音合成系统二次webui开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
4
0H
更新时间2025-12-07
支持自启动
基于微软 VibeVoice 的实时语音合成
基于微软 VibeVoice 的实时语音合成
0/小时
其他模型训练Qwen
Qwen-Edit 2509的Lora训练AI-toolkit
Qwen-Edit 2509的Lora训练AI-toolkit
4
@梦影Erislia
24
153H
更新时间2025-12-06
Qwen-Edit 2509,qwen-edit和z-image的Lora训练DiffusionPipe
Qwen-Edit 2509,qwen-edit和z-image的Lora训练DiffusionPipe
0/小时
语音合成数字人具身智能
Imtalker
Imtalker
2
@有趣的80后程序员
有趣的80后程序员认证作者
22
27H
更新时间2025-12-05
支持自启动
语音驱动数字人、支持生成超长语音
语音驱动数字人、支持生成超长语音
0/小时
视频生成
最新视频动作迁移,SteadyDancer,南京大学&腾讯开源!
最新视频动作迁移,SteadyDancer,南京大学&腾讯开源!
14
@与AI同行
与AI同行认证作者
119
183H
更新时间2025-12-05
支持自启动
最新视频动作迁移,SteadyDancer整合包!南京大学&腾讯开源,支持视频动作迁移,支持长视频、批量队列生成、高清放大
最新视频动作迁移,SteadyDancer整合包!南京大学&腾讯开源,支持视频动作迁移,支持长视频、批量队列生成、高清放大
0/小时
文本生成语义分割图像分类目标检测
SAM3 常见使用案例大全
SAM3 常见使用案例大全
0
@敢敢のwings
敢敢のwings认证作者
6
1H
更新时间2025-12-05
SAM 3提出的PCS任务从根本上突破了这一限制,模型需要检测、分割并追踪输入图像或视频中所有符合该概念的实例。
SAM 3提出的PCS任务从根本上突破了这一限制,模型需要检测、分割并追踪输入图像或视频中所有符合该概念的实例。
0/小时
数字人
Fay数字人-3.1.1
Fay数字人-3.1.1
2
@郭泽斌
郭泽斌认证作者
183
560H
更新时间2025-12-05
Fay数字人3.1.1最小可运行版。fay是一个帮助数字人(2.5d、3d、移动、pc、网页)或大语言模型(openai兼容、deepseek)连通业务系统的mcp框架。
Fay数字人3.1.1最小可运行版。fay是一个帮助数字人(2.5d、3d、移动、pc、网页)或大语言模型(openai兼容、deepseek)连通业务系统的mcp框架。
0/小时
ComfyUI视频生成图片生成
娱乐AI,唱歌跳舞,一应俱全
娱乐AI,唱歌跳舞,一应俱全
4
@老猫本猫
44
58H
更新时间2025-12-05
支持自启动
娱乐AI,唱歌跳舞,一应俱全
娱乐AI,唱歌跳舞,一应俱全
0/小时
ComfyUI视频生成图片生成
人物,商品,背景,随心所欲替换。
人物,商品,背景,随心所欲替换。
7
@老猫本猫
211
271H
更新时间2025-12-05
支持自启动
人物,商品,背景,随心所欲替换。
人物,商品,背景,随心所欲替换。
0/小时
QwenQwen-image图片生成
Z-Image
Z-Image
9
@十字鱼
十字鱼认证作者
68
520H
更新时间2025-12-05
支持自启动
Z-Image是一个拥有6B参数的强大且高效的图像生成模型。
Z-Image是一个拥有6B参数的强大且高效的图像生成模型。
0/小时
ComfyUI视频生成Wan
长视频SteadyDancer动作迁移
长视频SteadyDancer动作迁移
17
@ifelse
102
214H
更新时间2025-12-05
支持自启动
去闪长视频SteadyDancer动作迁移
去闪长视频SteadyDancer动作迁移
0/小时
图片生成
Ovis-Image阿里开源文本生图像大模型在线webui体验版 构建二次开发by科哥
Ovis-Image阿里开源文本生图像大模型在线webui体验版 构建二次开发by科哥
1
@科哥AIGC
科哥AIGC认证作者
6
1H
更新时间2025-12-05
支持自启动
Ovis-Image阿里开源文本生图像大模型在线webui体验版
Ovis-Image阿里开源文本生图像大模型在线webui体验版
0/小时
视频生成
UltraVideo生成高质量超高清1k到4K视频 webUI二次开发构建By科哥
UltraVideo生成高质量超高清1k到4K视频 webUI二次开发构建By科哥
1
@科哥AIGC
科哥AIGC认证作者
14
4H
更新时间2025-12-05
基于wan2.1UltraVideo生成高质量超高清1k到4K视频
基于wan2.1UltraVideo生成高质量超高清1k到4K视频
0/小时
DeepSeekQwenGLM
vLLM-Omni
vLLM-Omni
0
@敢敢のwings
敢敢のwings认证作者
2
6H
更新时间2025-12-05
vLLM项目团队推出了vLLM-Omni框架,这是一个专门为全模态模型设计的高性能推理系统,旨在将vLLM在文本推理领域积累的性能优势,扩展到包含图像、音频、视频在内的完整多模态生态。
vLLM项目团队推出了vLLM-Omni框架,这是一个专门为全模态模型设计的高性能推理系统,旨在将vLLM在文本推理领域积累的性能优势,扩展到包含图像、音频、视频在内的完整多模态生态。
0/小时
图片生成
超强AI图片ZImage-支持批量生成、SeedVR2高清放大
超强AI图片ZImage-支持批量生成、SeedVR2高清放大
37
@与AI同行
与AI同行认证作者
554
1585H
更新时间2025-12-23
支持自启动
阿里ZImageTurbo图片生成整合包,图片真实感、细节全面提升,支持批量生成、SeedVR2高清放大,支持NSFW, 最低6G显存可用!
阿里ZImageTurbo图片生成整合包,图片真实感、细节全面提升,支持批量生成、SeedVR2高清放大,支持NSFW, 最低6G显存可用!
0/小时
其他
MetaGR
MetaGR
0
@Anaconda
0
0H
更新时间2025-12-04
Meta的生成式推荐论文开源仓库的实现。
Meta的生成式推荐论文开源仓库的实现。
0/小时
Qwen-image图片生成
Z-Image-Turbo LoRA训练-AI Toolkit-极致风格化
Z-Image-Turbo LoRA训练-AI Toolkit-极致风格化
5
@AI-KSK
AI-KSK认证作者
108
527H
更新时间2025-12-04
支持 Z-Image-Turbo LoRA 快速训练的 AI Toolkit 镜像
支持 Z-Image-Turbo LoRA 快速训练的 AI Toolkit 镜像
0/小时
语音合成语音克隆
IndexTTS2整合包雨落版
IndexTTS2整合包雨落版
85
@雨落实战
雨落实战认证作者
981
2105H
更新时间2025-12-03
支持自启动
IndexTTS2.0整合包雨落版本,欢迎使用
IndexTTS2.0整合包雨落版本,欢迎使用
0/小时
Wan视频生成
SteadyDancer-FP8量化,视频动作迁移,支持5090新卡,支持A800计算卡,基于Comfyui,workflow,工作流,批量任务
SteadyDancer-FP8量化,视频动作迁移,支持5090新卡,支持A800计算卡,基于Comfyui,workflow,工作流,批量任务
6
@刘悦的技术博客
刘悦的技术博客认证作者
53
50H
更新时间2025-12-04
支持自启动
SteadyDancer-FP8量化,视频动作迁移,支持5090新卡,支持A800计算卡,基于Comfyui,workflow,工作流,批量任务
SteadyDancer-FP8量化,视频动作迁移,支持5090新卡,支持A800计算卡,基于Comfyui,workflow,工作流,批量任务
0/小时
模型训练图片生成其他
Z-image Lora训练,小白也能轻松上手,AI-toolkit
Z-image Lora训练,小白也能轻松上手,AI-toolkit
19
@梦影Erislia
273
1381H
更新时间2026-01-04
Z-image Lora训练,小白也能轻松上手,AI-toolkit
Z-image Lora训练,小白也能轻松上手,AI-toolkit
0/小时
图片生成
AI艺术二维码生成器在线生成个性二维码 二次开发构建by科哥
AI艺术二维码生成器在线生成个性二维码 二次开发构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
0
0H
更新时间2025-12-02
支持自启动
AI艺术二维码生成器在线生成个性二维码
AI艺术二维码生成器在线生成个性二维码
0/小时
图片生成图生文Wan
Z-Image-Turbo-GGUF,局部重绘,文生图,图生图,Qwen3-vl自动提示词,支持5090新卡,支持A800,批量任务队列
Z-Image-Turbo-GGUF,局部重绘,文生图,图生图,Qwen3-vl自动提示词,支持5090新卡,支持A800,批量任务队列
7
@刘悦的技术博客
刘悦的技术博客认证作者
87
67H
更新时间2025-12-02
支持自启动
Z-Image-Turbo-GGUF,局部重绘,文生图,图生图,Qwen3-vl自动提示词,支持5090新卡,支持A800,批量任务队列
Z-Image-Turbo-GGUF,局部重绘,文生图,图生图,Qwen3-vl自动提示词,支持5090新卡,支持A800,批量任务队列
0/小时
LoraQwen模型训练
Qwen-Image的Lora训练DiffusionPipe
Qwen-Image的Lora训练DiffusionPipe
1
@梦影Erislia
11
5H
更新时间2025-12-02
使用diffusion pipe进行qwen image的lora训练,小白也可简单上手,上传image即可开始训练
使用diffusion pipe进行qwen image的lora训练,小白也可简单上手,上传image即可开始训练
0/小时
数字人视频生成
HeyGem数字人最新多人面部驱动数字人,支持5090新卡,支持A800计算卡,修复黑框问题,GFP面部超分,修复超长视频上下游阻塞问题
HeyGem数字人最新多人面部驱动数字人,支持5090新卡,支持A800计算卡,修复黑框问题,GFP面部超分,修复超长视频上下游阻塞问题
12
@刘悦的技术博客
刘悦的技术博客认证作者
139
426H
更新时间2025-12-02
支持自启动
HeyGem数字人最新多人面部驱动数字人,支持5090新卡,支持A800计算卡,修复黑框问题,GFP面部超分,修复超长视频上下游阻塞问题
HeyGem数字人最新多人面部驱动数字人,支持5090新卡,支持A800计算卡,修复黑框问题,GFP面部超分,修复超长视频上下游阻塞问题
0/小时
图片生成
阿里通义开源Z-Image文生图片无限制wenbui中文特别版 构建by科哥
阿里通义开源Z-Image文生图片无限制wenbui中文特别版 构建by科哥
5
@科哥AIGC
科哥AIGC认证作者
46
70H
更新时间2025-12-02
支持自启动
文生图片无限制wenbui中文特别版
文生图片无限制wenbui中文特别版
0/小时
ComfyUI图片生成视频生成
ComyUI批量z-image出图 SeedVR2 TTP放大 4K  Wan2.2图生视频
ComyUI批量z-image出图 SeedVR2 TTP放大 4K Wan2.2图生视频
3
@ifelse
76
336H
更新时间2025-12-03
支持自启动
ComyUI批量z-image出图 SeedVR2 TTP放大 4K Wan2.2图生视频
ComyUI批量z-image出图 SeedVR2 TTP放大 4K Wan2.2图生视频
0/小时
图片生成
aitookit_z-image_lora_train镜像
aitookit_z-image_lora_train镜像
16
@有趣的80后程序员
有趣的80后程序员认证作者
179
1226H
更新时间2025-12-11
aitookit_z-image_lora_train镜像
aitookit_z-image_lora_train镜像
0/小时
数字人
echomimic_v3阿里蚂蚁团队开源图片加声音生成说话数字人视频基于Comfyui加速和二次高清输出 构建By科哥
echomimic_v3阿里蚂蚁团队开源图片加声音生成说话数字人视频基于Comfyui加速和二次高清输出 构建By科哥
1
@科哥AIGC
科哥AIGC认证作者
26
519H
更新时间2025-11-29
echomimic_v3阿里蚂蚁团队开源图片加声音生成说话数字人视频基于Comfyui加速和二次高清输出 构建By科哥
echomimic_v3阿里蚂蚁团队开源图片加声音生成说话数字人视频基于Comfyui加速和二次高清输出 构建By科哥
0/小时
ComfyUIQwen-image图片生成
Z-Image-Turbo 最真实的生图模型
Z-Image-Turbo 最真实的生图模型
14
@匹夫
匹夫认证作者
115
247H
更新时间2025-12-02
Z-Image-Turbo 最真实的生图模型
Z-Image-Turbo 最真实的生图模型
0/小时
文本生成数据分析DeepSeek
Crawl4AI:基于AI的网络爬虫和数据抓取工具
Crawl4AI:基于AI的网络爬虫和数据抓取工具
4
@AI画师大阳
AI画师大阳认证作者
12
27H
更新时间2025-12-02
支持自启动
Crawl4AI:基于AI的网络爬虫和数据抓取工具
Crawl4AI:基于AI的网络爬虫和数据抓取工具
0/小时
Flux图片生成图像修复
FLUX.2 [dev]
FLUX.2 [dev]
6
@十字鱼
十字鱼认证作者
38
20H
更新时间2025-11-28
支持自启动
FLUX.2 [dev] 是一个拥有32B参数的流匹配Transformer模型,能够生成和编辑图像。
FLUX.2 [dev] 是一个拥有32B参数的流匹配Transformer模型,能够生成和编辑图像。
0/小时
ComfyUI图片生成Flux
flux.2工作流合集-加图片放大工作流
flux.2工作流合集-加图片放大工作流
11
@匹夫
匹夫认证作者
97
193H
更新时间2025-11-27
flux.2工作流合集-及图片高清放大工作流
flux.2工作流合集-及图片高清放大工作流
0/小时
ComfyUIQwen-image图片生成
Z-Image-Turbo · 8步极速 · 无限制生成
Z-Image-Turbo · 8步极速 · 无限制生成
4
@AI-KSK
AI-KSK认证作者
107
260H
更新时间2025-11-27
Z-Image-Turbo 是一款仅用 8 步即可生成旗舰级图像的高效扩散模型,具备快速生成、双语文本渲染、强指令理解与创意编辑能力,是当前开源图像模型中兼具速度与质量的优秀代表。
Z-Image-Turbo 是一款仅用 8 步即可生成旗舰级图像的高效扩散模型,具备快速生成、双语文本渲染、强指令理解与创意编辑能力,是当前开源图像模型中兼具速度与质量的优秀代表。
0/小时
ComfyUI图片生成
flux2最新发布f8优化极速版3090显卡可玩含sora2工作流 构建by科哥
flux2最新发布f8优化极速版3090显卡可玩含sora2工作流 构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
11
1H
更新时间2025-11-27
支持自启动
flux2最新发布f8优化极速版3090显卡可玩含sora2工作流 构建by科哥
flux2最新发布f8优化极速版3090显卡可玩含sora2工作流 构建by科哥
0/小时
ComfyUI
ComfyUI基础镜像纯净版0.3.50
ComfyUI基础镜像纯净版0.3.50
7
@龙没耳
龙没耳认证作者
29
66H
更新时间2025-11-28
支持自启动
ComfyUI基础镜像纯净版0.3.50
ComfyUI基础镜像纯净版0.3.50
0/小时
DeepSeek机器翻译Qwen
PDFMathTranslate-next基于 AI 完整保留排版的 PDF 文档全文双语翻译
PDFMathTranslate-next基于 AI 完整保留排版的 PDF 文档全文双语翻译
4
@AI画师大阳
AI画师大阳认证作者
44
420H
更新时间2025-11-26
支持自启动
基于 AI 完整保留排版的 PDF 文档全文双语翻译
基于 AI 完整保留排版的 PDF 文档全文双语翻译
0/小时
Flux图片生成ComfyUI
FLUX.2:下一代视觉生成引擎
FLUX.2:下一代视觉生成引擎
1
@AI-KSK
AI-KSK认证作者
31
74H
更新时间2025-12-04
Flux.2 是 2025 年最全面、最专业、最强大的统一视觉生成模型之一。
Flux.2 是 2025 年最全面、最专业、最强大的统一视觉生成模型之一。
0/小时
ComfyUI图片生成Qwen-image
aha的ComfyUI镜像——姿态编辑
aha的ComfyUI镜像——姿态编辑
5
@叫我aha就好
75
150H
更新时间2025-11-26
SDPose_OOD+Pose_editor+qwen image edit 2509,姿态估计与编辑,随心所欲修改姿态
SDPose_OOD+Pose_editor+qwen image edit 2509,姿态估计与编辑,随心所欲修改姿态
0/小时
Hunyuan视频生成
HunyuanVideo 1.5开源视频生成模型-ComfyUI实现
HunyuanVideo 1.5开源视频生成模型-ComfyUI实现
4
@AI-KSK
AI-KSK认证作者
40
65H
更新时间2025-11-26
该镜像集成了刚刚开源的 HunyuanVideo 1.5 模型
该镜像集成了刚刚开源的 HunyuanVideo 1.5 模型
0/小时
ComfyUIWanQwen-image
ComfyUI整合镜像
ComfyUI整合镜像
6
@鹄仙
鹄仙认证作者
39
135H
更新时间2026-01-09
一个Comfy UI的整合包,自用版,带插件和部分模型
一个Comfy UI的整合包,自用版,带插件和部分模型
0/小时
文本生成DeepSeek
Deepseek orc webui在线图片识别文字pdf文件转文字 七种识别文字 构建by科哥
Deepseek orc webui在线图片识别文字pdf文件转文字 七种识别文字 构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
30
459H
更新时间2025-11-25
Deepseek orc webui在线图片识别文字pdf文件转文字
Deepseek orc webui在线图片识别文字pdf文件转文字
0/小时
Hunyuan图片生成
ComfyUI-SAM3-Hunyuan3D-Part-SAM3DBody工作流集合 构建By科哥
ComfyUI-SAM3-Hunyuan3D-Part-SAM3DBody工作流集合 构建By科哥
0
@科哥AIGC
科哥AIGC认证作者
9
21H
更新时间2025-11-25
支持自启动
sam3是谷歌开源的一个项目图像拆分,3D渲染等
sam3是谷歌开源的一个项目图像拆分,3D渲染等
0/小时
Hunyuan视频生成ComfyUI
HunyuanVideo-1.5
HunyuanVideo-1.5
3
@十字鱼
十字鱼认证作者
19
48H
更新时间2025-11-24
支持自启动
一个领先的超轻量级视频生成模型
一个领先的超轻量级视频生成模型
0/小时
语音合成
AI听书 IndexTTS vllm加速版
AI听书 IndexTTS vllm加速版
5
@CyberWon
34
53H
更新时间2025-11-24
低成本高质量快速生成有声书。
低成本高质量快速生成有声书。
0.01/小时
ComfyUIQwen-image图片生成
一张图生成多角度工作流-万物融合工作流升级版
一张图生成多角度工作流-万物融合工作流升级版
11
@匹夫
匹夫认证作者
81
186H
更新时间2025-11-24
一张图生成多角度工作流-万物融合工作流升级版
一张图生成多角度工作流-万物融合工作流升级版
0/小时
视频生成
超强AI图生视频RemixV2-支持批量生成、首尾帧视频、高清放大
超强AI图生视频RemixV2-支持批量生成、首尾帧视频、高清放大
33
@与AI同行
与AI同行认证作者
470
1518H
更新时间2025-11-24
支持自启动
AI生成视频,Wan2.2-RemixV2整合包,支持图生视频、首尾帧视频,支持批量单图视频、批量首尾帧,支持高清放大、加载Lora、NSFW,最低8G显存可用
AI生成视频,Wan2.2-RemixV2整合包,支持图生视频、首尾帧视频,支持批量单图视频、批量首尾帧,支持高清放大、加载Lora、NSFW,最低8G显存可用
0/小时
语音合成
错金流TTS地表炸天TTS工具,一百多款自然人声,极速复刻
错金流TTS地表炸天TTS工具,一百多款自然人声,极速复刻
4
@独立工作者
33
138H
更新时间2025-11-19
地表炸天TTS工具,一百多款自然人声,极速复刻
地表炸天TTS工具,一百多款自然人声,极速复刻
0/小时
视频生成图像修复
FlashVSR 视频高清放大工具
FlashVSR 视频高清放大工具
14
@AI画师大阳
AI画师大阳认证作者
270
657H
更新时间2025-12-22
支持自启动
FlashVSR 视频高清放大工具
FlashVSR 视频高清放大工具
0/小时
语音合成
XKPLUS2
XKPLUS2
0
@REDCOPY
4
0H
更新时间2025-11-24
支持自启动
加速优化版
加速优化版
0.76/小时
语音合成
XKPLUS1
XKPLUS1
1
@REDCOPY
4
22H
更新时间2025-11-24
支持自启动
30系显卡优化版
30系显卡优化版
0.46/小时
语音合成
云端88888888
云端88888888
0
@REDCOPY
2
22H
更新时间2025-11-17
支持自启动
3080Ti专用
3080Ti专用
0.46/小时
语音合成
语音88888888
语音88888888
0
@REDCOPY
3
10H
更新时间2025-11-17
支持自启动
3080Ti专用
3080Ti专用
0.76/小时
视频生成
超强视频替换人物MoCha
超强视频替换人物MoCha
20
@与AI同行
与AI同行认证作者
183
228H
更新时间2025-11-24
支持自启动
最新视频替换人物,MoCha-Preview 整合包,支持视频替换人物,卡通动漫效果更佳,支持添加批量任务, 支持高清修复
最新视频替换人物,MoCha-Preview 整合包,支持视频替换人物,卡通动漫效果更佳,支持添加批量任务, 支持高清修复
0/小时
目标检测文本生成
video-subtitle-extractor视频字幕提取器 全智能加速优化版 构建by科哥
video-subtitle-extractor视频字幕提取器 全智能加速优化版 构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
11
19H
更新时间2025-11-24
一键提取视频字幕 加速优化
一键提取视频字幕 加速优化
0/小时
语音合成语音克隆推理框架
Step-Audio-EditX
Step-Audio-EditX
2
@十字鱼
十字鱼认证作者
18
15H
更新时间2025-11-14
支持自启动
一个强大的 3B 参数、基于 LLM 的强化学习音频编辑模型,擅长编辑情感、说话风格和副语言,并具有稳健的零样本文本转语音功能
一个强大的 3B 参数、基于 LLM 的强化学习音频编辑模型,擅长编辑情感、说话风格和副语言,并具有稳健的零样本文本转语音功能
0/小时
语音合成语音克隆
VibeVoice:富有表现力的长篇多人对话语音合成工具
VibeVoice:富有表现力的长篇多人对话语音合成工具
6
@AI画师大阳
AI画师大阳认证作者
60
130H
更新时间2025-11-24
支持自启动
富有表现力的长篇多人对话语音合成工具
富有表现力的长篇多人对话语音合成工具
0/小时
语音合成语音克隆
IndexTTS2 B站开源超强语音克隆
IndexTTS2 B站开源超强语音克隆
261
@十字鱼
十字鱼认证作者
1699
5028H
更新时间2025-12-04
支持自启动
B站开源超强语音克隆,在情感表达和时长控制方面取得突破的自回归零样本文本合成系统
B站开源超强语音克隆,在情感表达和时长控制方面取得突破的自回归零样本文本合成系统
0/小时
ComfyUIWan视频生成
Remix-Wan2.2一体化多功能创作镜像
Remix-Wan2.2一体化多功能创作镜像
21
@AI-KSK
AI-KSK认证作者
168
546H
更新时间2025-11-24
一体化整合Remix-Wan 2.2 文生视频、图生视频、首尾帧生成与 Qwen3 自动提示词的多功能创作镜像
一体化整合Remix-Wan 2.2 文生视频、图生视频、首尾帧生成与 Qwen3 自动提示词的多功能创作镜像
0/小时
视频生成
AI视频消除万物-支持消除人物、物体、水印、字幕等
AI视频消除万物-支持消除人物、物体、水印、字幕等
29
@与AI同行
与AI同行认证作者
368
448H
更新时间2025-11-24
支持自启动
AI视频消除万物整合包,支持消除人物、物体、水印、字幕等,支持较长视频、添加队列任务,打开即用,一键运行!
AI视频消除万物整合包,支持消除人物、物体、水印、字幕等,支持较长视频、添加队列任务,打开即用,一键运行!
0/小时
视频生成图片生成ComfyUI
ChromoEdit-GGUF模型,,图片修改,图像修改,图生视频,支持5090新卡,comfyui,工作流,workflow
ChromoEdit-GGUF模型,,图片修改,图像修改,图生视频,支持5090新卡,comfyui,工作流,workflow
6
@刘悦的技术博客
刘悦的技术博客认证作者
35
22H
更新时间2025-11-24
支持自启动
ChromoEdit-GGUF模型,,图片修改,图像修改,图生视频,支持5090新卡,comfyui,工作流,workflow
ChromoEdit-GGUF模型,,图片修改,图像修改,图生视频,支持5090新卡,comfyui,工作流,workflow
0/小时
视频生成数字人Wan
InfiniteTalk数字人视频制作软件,图片转视频,视频人物配音
InfiniteTalk数字人视频制作软件,图片转视频,视频人物配音
28
@AI画师大阳
AI画师大阳认证作者
445
694H
更新时间2025-11-11
支持自启动
InfiniteTalk 是一个无限长度的对话视频生成模型,支持音频驱动的视频到视频和图像到视频的生成
InfiniteTalk 是一个无限长度的对话视频生成模型,支持音频驱动的视频到视频和图像到视频的生成
0/小时
ComfyUIFluxWan
Diffusion_pipe_in_ComfyUI天冬
Diffusion_pipe_in_ComfyUI天冬
3
@天冬
12
43H
更新时间2025-11-11
支持自启动
为 ComfyUI 提供了完整的 Diffusion 模型训练和微调功能。这个项目允许用户在 ComfyUI 的图形界面中配置和启动各种先进 AI 模型的训练,支持 LoRA 和全量微调
为 ComfyUI 提供了完整的 Diffusion 模型训练和微调功能。这个项目允许用户在 ComfyUI 的图形界面中配置和启动各种先进 AI 模型的训练,支持 LoRA 和全量微调
0/小时
语音合成语音识别语音克隆
Step-Audio-EditX
Step-Audio-EditX
3
@鹄仙
鹄仙认证作者
16
28H
更新时间2025-11-24
一个音频编辑项目,“情绪编辑”“风格编辑”“语气编辑”和“降噪变速”
一个音频编辑项目,“情绪编辑”“风格编辑”“语气编辑”和“降噪变速”
0/小时
ComfyUI视频生成图片生成
猫哥的商业化AI,SORA2
猫哥的商业化AI,SORA2
18
@老猫本猫
731
1457H
更新时间2025-11-24
支持自启动
SORA2文生视频,图生视频
SORA2文生视频,图生视频
0/小时
其他数据分析
AI-Trader港大开源的AI自动交易竞赛框架 汉化构建By科哥
AI-Trader港大开源的AI自动交易竞赛框架 汉化构建By科哥
1
@科哥AIGC
科哥AIGC认证作者
4
1H
更新时间2025-11-24
股市有风险 投资请谨慎!
股市有风险 投资请谨慎!
0/小时
图片生成Qwen-image
Qwen-Image-Edit-2509多图编辑及人物一致性生成
Qwen-Image-Edit-2509多图编辑及人物一致性生成
3
@AI画师大阳
AI画师大阳认证作者
127
168H
更新时间2025-11-08
支持自启动
Qwen-Image-Edit-2509精准多图内容编辑及人物一致性图片生成
Qwen-Image-Edit-2509精准多图内容编辑及人物一致性图片生成
0/小时
视频生成
超强Sora2视频去水印
超强Sora2视频去水印
40
@与AI同行
与AI同行认证作者
212
437H
更新时间2025-11-07
支持自启动
超强Sora2视频去水印
超强Sora2视频去水印
0/小时
ComfyUIWan视频生成
SDPOSE 超复杂骨骼识别系统 X Lynx + InfiniteTalk + VACE + Wan 无限时长视频转绘体系
SDPOSE 超复杂骨骼识别系统 X Lynx + InfiniteTalk + VACE + Wan 无限时长视频转绘体系
2
@AI-KSK
AI-KSK认证作者
28
46H
更新时间2025-11-24
以 SDPOSE 为核心,融合 Lynx、InfiniteTalk、VACE 与Wan ,构建出一个可无限时长、骨骼级精度的人体视频转绘与智能生成体系
以 SDPOSE 为核心,融合 Lynx、InfiniteTalk、VACE 与Wan ,构建出一个可无限时长、骨骼级精度的人体视频转绘与智能生成体系
0/小时
图像修复视频生成Wan
ComfyUI_FlashVSR 实时视频超分,支持1分钟以上视频超分
ComfyUI_FlashVSR 实时视频超分,支持1分钟以上视频超分
6
@smthem
103
115H
更新时间2025-11-27
支持自启动
实时视频超分项目,显存如果够大,所有视频超分到4K
实时视频超分项目,显存如果够大,所有视频超分到4K
0/小时
Qwen视觉场景识别
Qwen3-vl-abliterated视觉模型,视频理解,多图理解,批量任务,反推提示词
Qwen3-vl-abliterated视觉模型,视频理解,多图理解,批量任务,反推提示词
11
@刘悦的技术博客
刘悦的技术博客认证作者
65
984H
更新时间2025-11-14
支持自启动
Qwen3-vl-abliterated视觉模型,视频理解,多图理解,批量任务,反推提示词
Qwen3-vl-abliterated视觉模型,视频理解,多图理解,批量任务,反推提示词
0/小时
Wan视频生成图片生成
animate完美一致性人物迁移
animate完美一致性人物迁移
12
@
117
194H
更新时间2025-11-24
支持自启动
无惧镜头切换人物迁移
无惧镜头切换人物迁移
0/小时
ComfyUI视频生成
4步骤完成风格转绘vlog
4步骤完成风格转绘vlog
3
@鹄仙
鹄仙认证作者
5
74H
更新时间2026-01-09
支持自启动
4步骤完成风格转绘vlog
4步骤完成风格转绘vlog
0/小时
Wan模型训练Lora
Wan2.2-Lora训练diffusionpipe
Wan2.2-Lora训练diffusionpipe
7
@梦影Erislia
48
111H
更新时间2025-11-30
Wan2.2Lora训练diffusionpipe
Wan2.2Lora训练diffusionpipe
0/小时
Wan视频生成图片生成
ChronoEdit
ChronoEdit
1
@十字鱼
十字鱼认证作者
4
3H
更新时间2025-11-04
支持自启动
面向图像编辑和世界模拟的时序推理
面向图像编辑和世界模拟的时序推理
0/小时
ComfyUIWan视频生成
wan2.2视频编辑人物替换背景替换
wan2.2视频编辑人物替换背景替换
36
@老徐Ai研习社
老徐Ai研习社认证作者
566
1218H
更新时间2025-11-24
支持自启动
视频编辑人物替换背景替换局部修改
视频编辑人物替换背景替换局部修改
0/小时
语音克隆
SoulX-Podcast:能说方言、带情绪的真实感长播客生成工具 构建by科哥
SoulX-Podcast:能说方言、带情绪的真实感长播客生成工具 构建by科哥
5
@科哥AIGC
科哥AIGC认证作者
46
63H
更新时间2025-11-24
支持自启动
SoulX-Podcast:能说方言、带情绪的真实感长播客生成工具
SoulX-Podcast:能说方言、带情绪的真实感长播客生成工具
0/小时
Wan视频生成数字人
Wan2.2-Animate-14B动作模仿及视频人物替换
Wan2.2-Animate-14B动作模仿及视频人物替换
27
@AI画师大阳
AI画师大阳认证作者
302
369H
更新时间2025-11-24
支持自启动
Wan2.2-Animate-14B一张图片模仿视频人物动作及替换视频中人物
Wan2.2-Animate-14B一张图片模仿视频人物动作及替换视频中人物
0/小时
语音合成语音克隆语音识别
SoulX-Podcast-1.7B语音合成,接口API调用,多人播客合成,方言合成,语速调节,支持笑声咳嗽指令,支持5090新卡,音色保存
SoulX-Podcast-1.7B语音合成,接口API调用,多人播客合成,方言合成,语速调节,支持笑声咳嗽指令,支持5090新卡,音色保存
6
@刘悦的技术博客
刘悦的技术博客认证作者
64
110H
更新时间2025-11-14
支持自启动
SoulX-Podcast-1.7B语音合成,接口API调用,多人播客合成,方言合成,语速调节,支持笑声咳嗽指令,支持5090新卡,音色保存
SoulX-Podcast-1.7B语音合成,接口API调用,多人播客合成,方言合成,语速调节,支持笑声咳嗽指令,支持5090新卡,音色保存
0/小时
图片生成
最强AI图片编辑-QwenImageEdit加速版-支持换装、换姿势、批量生成、高清放大
最强AI图片编辑-QwenImageEdit加速版-支持换装、换姿势、批量生成、高清放大
15
@与AI同行
与AI同行认证作者
204
253H
更新时间2025-11-02
支持自启动
最强AI图片编辑-QwenImageEdit-支持换装、换姿势、批量生成、SeedVR2高清放大
最强AI图片编辑-QwenImageEdit-支持换装、换姿势、批量生成、SeedVR2高清放大
0/小时
数字人视频生成
facefusion3.4.1图片视频换脸神器 汉化版构建by科哥
facefusion3.4.1图片视频换脸神器 汉化版构建by科哥
19
@科哥AIGC
科哥AIGC认证作者
75
92H
更新时间2025-11-24
facefusion3.4官方原版
facefusion3.4官方原版
0/小时
Flux图片生成Lora
DYPE超大分辨率1600万像素图像生成,ComfyUI插件实现
DYPE超大分辨率1600万像素图像生成,ComfyUI插件实现
1
@smthem
11
35H
更新时间2025-11-02
支持自启动
消费级显卡开始生成4096*4096的超大尺寸图片
消费级显卡开始生成4096*4096的超大尺寸图片
0/小时
ComfyUIWan视频生成
wan2.2视频瞳孔转场
wan2.2视频瞳孔转场
0
@skyrimprey
5
167H
更新时间2025-11-24
挂载wan2.2瞳孔转场lora,实现专业的视频转场效果
挂载wan2.2瞳孔转场lora,实现专业的视频转场效果
0/小时
图像修复
最强照片上色DDColor-牛哥定制版
最强照片上色DDColor-牛哥定制版
2
@NiuGee
NiuGee认证作者
15
130H
更新时间2026-01-08
支持自启动
🎨 DDColor 牛哥镜像版 - 黑白图像智能上色 牛哥针对DDColor黑白图像上色模型制作的一手镜像,这应该是目前效果最好的黑白照片智能上色解决方案之一。
🎨 DDColor 牛哥镜像版 - 黑白图像智能上色 牛哥针对DDColor黑白图像上色模型制作的一手镜像,这应该是目前效果最好的黑白照片智能上色解决方案之一。
0/小时
Qwen语音合成语音克隆
IndexTTS2/GPT-SoVITS+Srt-AI-Voice-Assistant多角色字幕长文本一键配音镜像
IndexTTS2/GPT-SoVITS+Srt-AI-Voice-Assistant多角色字幕长文本一键配音镜像
24
@数列解析几何一生之敌
数列解析几何一生之敌认证作者
222
846H
更新时间2026-01-06
支持自启动
Srt-AI-Voice-Assistant配音辅助工具搭配IndexTTS2/GSV的镜像
Srt-AI-Voice-Assistant配音辅助工具搭配IndexTTS2/GSV的镜像
0/小时
视频生成
超强AI生成视频-SmoothMix-V2合集-效果超强
超强AI生成视频-SmoothMix-V2合集-效果超强
24
@与AI同行
与AI同行认证作者
290
1033H
更新时间2025-10-30
支持自启动
SmoothMix-V2合集-效果超强,支持文生视频、图生视频、首尾帧、批量首尾帧视频,支持NSFW、高清修复!
SmoothMix-V2合集-效果超强,支持文生视频、图生视频、首尾帧、批量首尾帧视频,支持NSFW、高清修复!
0/小时
ComfyUI视频生成
美团LongCat-ComfyUI|文生视频·图生视频·视频延续|长视频生成
美团LongCat-ComfyUI|文生视频·图生视频·视频延续|长视频生成
5
@AI-KSK
AI-KSK认证作者
83
324H
更新时间2025-10-31
这是一个集成了美团LongCat模型与ComfyUI的镜像,提供文生视频、图生视频和视频延续三大功能,核心优势在于能生成长时间且质量稳定的视频。
这是一个集成了美团LongCat模型与ComfyUI的镜像,提供文生视频、图生视频和视频延续三大功能,核心优势在于能生成长时间且质量稳定的视频。
0/小时
视频生成
超强AI生成视频-Lightx2v-I2V-超强动态、分镜效果
超强AI生成视频-Lightx2v-I2V-超强动态、分镜效果
13
@与AI同行
与AI同行认证作者
149
426H
更新时间2025-10-29
支持自启动
超强AI生成视频-Lightx2v-I2V-超强动态、分镜效果。支持图生视频,首尾帧、批量首尾帧视频、批量生成、高清修复
超强AI生成视频-Lightx2v-I2V-超强动态、分镜效果。支持图生视频,首尾帧、批量首尾帧视频、批量生成、高清修复
0/小时
ComfyUI视频生成
美团Longcat-video视频模型
美团Longcat-video视频模型
1
@社恐的知识树
社恐的知识树认证作者
14
102H
更新时间2025-10-29
支持自启动
美团开源的长视频生成模型-Longcat,ComfyUI抢先体验版,后续优化后继续更新!
美团开源的长视频生成模型-Longcat,ComfyUI抢先体验版,后续优化后继续更新!
0/小时
视频生成数字人
LatentSync抖音出品高质量对口型软件
LatentSync抖音出品高质量对口型软件
27
@AI画师大阳
AI画师大阳认证作者
514
1077H
更新时间2025-10-29
支持自启动
高质量对口型工具
高质量对口型工具
0/小时
图像修复图片生成视频生成
FlashVSR_Ultra_Fast,图片视频超清放大,支持批量任务,支持5090新卡
FlashVSR_Ultra_Fast,图片视频超清放大,支持批量任务,支持5090新卡
27
@刘悦的技术博客
刘悦的技术博客认证作者
496
711H
更新时间2025-11-14
支持自启动
FlashVSR_Ultra_Fast,图片视频超清放大,支持批量任务,支持5090新卡
FlashVSR_Ultra_Fast,图片视频超清放大,支持批量任务,支持5090新卡
0/小时
视频生成ComfyUIWan
一键视频转绘Ditto
一键视频转绘Ditto
4
@鹄仙
鹄仙认证作者
43
43H
更新时间2025-12-04
把视频整体转会成其他风格
把视频整体转会成其他风格
0/小时
ComfyUI图片生成视频生成
积木comfyui
积木comfyui
5
@积木comfyui
35
44H
更新时间2025-10-29
支持自启动
简单易懂,用核心原理展示工作流
简单易懂,用核心原理展示工作流
0/小时
Wan视频生成
Video-As-Prompt
Video-As-Prompt
1
@十字鱼
十字鱼认证作者
1
1H
更新时间2025-10-28
支持自启动
统一语义控制的视频生成
统一语义控制的视频生成
0/小时
Qwen-imageComfyUIWan
Pony V7 × Qwen AIO × Smooth 2.0无限制生产|图像 / 编辑 / 视频 一体化
Pony V7 × Qwen AIO × Smooth 2.0无限制生产|图像 / 编辑 / 视频 一体化
5
@AI-KSK
AI-KSK认证作者
75
528H
更新时间2025-10-28
这是一个整合图像生成、图像编辑和视频生产的 AI 创作工具。
这是一个整合图像生成、图像编辑和视频生产的 AI 创作工具。
0/小时
数字人
LiveTalking-V1.5
LiveTalking-V1.5
1
@有黑眼圈的小竹熊
116
768H
更新时间2025-11-13
实时数字人解决方案
实时数字人解决方案
0.3/小时
ComfyUIWan视频生成
Comfyui_Ditto
Comfyui_Ditto
2
@skyrimprey
8
2H
更新时间2025-10-24
Ditto:基于指令的视频编辑框架,可以用于视频内元素的风格转换 本镜像为https://github.com/EzioBy/Ditto的Comfyui实现
Ditto:基于指令的视频编辑框架,可以用于视频内元素的风格转换 本镜像为https://github.com/EzioBy/Ditto的Comfyui实现
0/小时
其他Qwen
MinerU:高质量PDF转Markdown/JSON
MinerU:高质量PDF转Markdown/JSON
3
@AI画师大阳
AI画师大阳认证作者
108
466H
更新时间2025-10-24
支持自启动
快速高效的将PDF文档转为Markdown/JSON文件
快速高效的将PDF文档转为Markdown/JSON文件
0/小时
视频生成
超强AI视频风格重绘-Ditto-支持长视频、批量生成
超强AI视频风格重绘-Ditto-支持长视频、批量生成
6
@与AI同行
与AI同行认证作者
54
54H
更新时间2025-10-23
支持自启动
超强AI视频重绘Ditto-支持长视频、批量生成,支持视频风格转换、动漫转真人视频,超级方便!
超强AI视频重绘Ditto-支持长视频、批量生成,支持视频风格转换、动漫转真人视频,超级方便!
0/小时
三维重建图片生成
微软TRELLIS图片/文本转3D模型资产
微软TRELLIS图片/文本转3D模型资产
2
@AI画师大阳
AI画师大阳认证作者
64
225H
更新时间2025-12-04
支持自启动
高质量图片/文本转3D网格模型
高质量图片/文本转3D网格模型
0/小时
DeepSeek目标检测语义分割图像分类
DeepSeek-OCR
DeepSeek-OCR
14
@十字鱼
十字鱼认证作者
50
583H
更新时间2025-10-24
上下文光学压缩
上下文光学压缩
0/小时
Qwen-image图片生成ComfyUI
Qwen-image-Nunchaku智能扩图,AI绘图,关键词扩图,图像填充,图像延展,支持5090新卡
Qwen-image-Nunchaku智能扩图,AI绘图,关键词扩图,图像填充,图像延展,支持5090新卡
3
@刘悦的技术博客
刘悦的技术博客认证作者
24
22H
更新时间2025-11-14
支持自启动
Qwen-image-Nunchaku智能扩图,AI绘图,关键词扩图,图像填充,图像延展,支持5090新卡
Qwen-image-Nunchaku智能扩图,AI绘图,关键词扩图,图像填充,图像延展,支持5090新卡
0/小时
数字人ComfyUIWan
ComfyUI_infiniteTalk数字人工作流
ComfyUI_infiniteTalk数字人工作流
29
@好奇漫步
504
1235H
更新时间2025-10-22
本镜像包含ComfyUI许多工作流,目前优先测试部署完毕infiniteTalk数字人工作流、Wan2.2生视频工作流、HoMo数字人工作流等,后续会继续部署完善更多的工作流。
本镜像包含ComfyUI许多工作流,目前优先测试部署完毕infiniteTalk数字人工作流、Wan2.2生视频工作流、HoMo数字人工作流等,后续会继续部署完善更多的工作流。
0/小时
ComfyUIWanQwen-image
Qwen-image以及WAN视频系列,打开即用!
Qwen-image以及WAN视频系列,打开即用!
7
@老许爱吃肉丶
107
1147H
更新时间2025-10-21
支持自启动
comfyui工作流,Qwen-image以及WAN2.1/2.2视频,都已经部署好,里面内置工作流,打开即可使用!
comfyui工作流,Qwen-image以及WAN2.1/2.2视频,都已经部署好,里面内置工作流,打开即可使用!
0/小时
视频生成
最快AI视频高清修复FlashVSR-支持批量生成
最快AI视频高清修复FlashVSR-支持批量生成
42
@与AI同行
与AI同行认证作者
1203
5005H
更新时间2025-10-21
支持自启动
最快AI视频高清修复FlashVSR
最快AI视频高清修复FlashVSR
0/小时
视频剪辑
FlashVSR视频高清放大webUI狂暴优化版 一键启用多倍放大 二次开发构建by科哥
FlashVSR视频高清放大webUI狂暴优化版 一键启用多倍放大 二次开发构建by科哥
6
@科哥AIGC
科哥AIGC认证作者
88
145H
更新时间2025-10-21
FlashVSR视频高清放大webUI狂暴优化版 一键启用多倍放大
FlashVSR视频高清放大webUI狂暴优化版 一键启用多倍放大
0/小时
Wan视频生成ComfyUI
Smooth Wan 2.2 动态↑速度↑NSFW↑文生/图生视频&首尾帧
Smooth Wan 2.2 动态↑速度↑NSFW↑文生/图生视频&首尾帧
39
@AI-KSK
AI-KSK认证作者
454
3527H
更新时间2025-10-22
Smooth是最新的被社区广泛认可的Wan 2.2无限制合并模型
Smooth是最新的被社区广泛认可的Wan 2.2无限制合并模型
0/小时
视觉场景识别语义分割图像分类
baidu-paddle-ocr
baidu-paddle-ocr
2
@有趣的80后程序员
有趣的80后程序员认证作者
38
95H
更新时间2025-10-20
ocr模型天花板、支持109种语言、公式、表格、图标
ocr模型天花板、支持109种语言、公式、表格、图标
0/小时
图像修复图片生成Wan
Flash-VSR-1.3B 图片/视频超清放大
Flash-VSR-1.3B 图片/视频超清放大
5
@刘悦的技术博客
刘悦的技术博客认证作者
69
29H
更新时间2025-11-14
支持自启动
Flash-VSR-1.3B,图片/视频超清放大,支持5090新显卡,支持批量任务
Flash-VSR-1.3B,图片/视频超清放大,支持5090新显卡,支持批量任务
0/小时
Qwen目标检测
Rex-Omni
Rex-Omni
2
@十字鱼
十字鱼认证作者
9
225H
更新时间2025-10-19
支持自启动
通过下一个点预测来检测任何事物
通过下一个点预测来检测任何事物
0/小时
Wan视频生成
Wan2.2-SmoothMix 更丝滑的图生视频
Wan2.2-SmoothMix 更丝滑的图生视频
16
@刘悦的技术博客
刘悦的技术博客认证作者
176
135H
更新时间2025-11-14
支持自启动
Wan2.2-SmoothMix,更丝滑的图生视频,首尾帧连贯动画,4步采样,支持5090新卡
Wan2.2-SmoothMix,更丝滑的图生视频,首尾帧连贯动画,4步采样,支持5090新卡
0/小时
Wan2.2-KJ氦气加速ComfyUI 6步极速版(唯一正版授权)
Wan2.2-KJ氦气加速ComfyUI 6步极速版(唯一正版授权)
16
@龙没耳
龙没耳认证作者
407
2764H
更新时间2025-10-20
支持自启动
Wan2.2KJ氦气加速6步极速版唯一正版授权镜像——AI来事&龙没耳联合推出
Wan2.2KJ氦气加速6步极速版唯一正版授权镜像——AI来事&龙没耳联合推出
0/小时
数字人ComfyUI
Animate-v2-最强人物替换工作流
Animate-v2-最强人物替换工作流
25
@匹夫
匹夫认证作者
266
512H
更新时间2025-10-20
支持自启动
Animate-v2-最强人物替换工作流
Animate-v2-最强人物替换工作流
0/小时
Flux图片生成
DreamOmni2 ComfyUI 量化版
DreamOmni2 ComfyUI 量化版
1
@鹄仙
鹄仙认证作者
28
66H
更新时间2025-11-07
支持自启动
超级强大的图像编辑项目
超级强大的图像编辑项目
0/小时
ComfyUI视频生成Wan
OVI一款使用提示生成音频音效,或者完整的有声视频开源模型
OVI一款使用提示生成音频音效,或者完整的有声视频开源模型
1
@社恐的知识树
社恐的知识树认证作者
17
8H
更新时间2025-10-16
一个类似Veo3 Sora的开源模型,使用提示词自动生成音频视频
一个类似Veo3 Sora的开源模型,使用提示词自动生成音频视频
0/小时
视频生成Wan
最强视频编辑-阿里WanAnimate-Q8超高精度-合集
最强视频编辑-阿里WanAnimate-Q8超高精度-合集
105
@与AI同行
与AI同行认证作者
1903
7563H
更新时间2025-10-20
支持自启动
最强视频编辑-阿里Wan-Animate-Q8超高精度-合集
最强视频编辑-阿里Wan-Animate-Q8超高精度-合集
0/小时
ComfyUI视频生成Wan
视频重绘_跳舞姿势视频迁移Wan2.2图生视频
视频重绘_跳舞姿势视频迁移Wan2.2图生视频
11
@梦影Erislia
71
102H
更新时间2025-10-15
视频重绘_跳舞姿势视频迁移Wan2.2图生视频
视频重绘_跳舞姿势视频迁移Wan2.2图生视频
0/小时
ComfyUI
电商-AI模特/饰品/眼镜/假发模特,ComfyUI一键启动镜像
电商-AI模特/饰品/眼镜/假发模特,ComfyUI一键启动镜像
11
@AI美研所
150
472H
更新时间2025-10-20
支持自启动
适用电商的ComfyUI镜像环境,包括:饰品佩戴、 多姿势,多角度, 一致性模特工作流,一键换装工作流,眼镜模特工作流,假发模特工作流镜像;本镜像采取一键打包形式,不用输入一句命令,点击几次即可
适用电商的ComfyUI镜像环境,包括:饰品佩戴、 多姿势,多角度, 一致性模特工作流,一键换装工作流,眼镜模特工作流,假发模特工作流镜像;本镜像采取一键打包形式,不用输入一句命令,点击几次即可
0/小时
Wan视频生成ComfyUI
Wan-Lynx 面部信息迁移图生视频+人脸一致性保持
Wan-Lynx 面部信息迁移图生视频+人脸一致性保持
12
@刘悦的技术博客
刘悦的技术博客认证作者
58
40H
更新时间2025-11-14
支持自启动
Wan-Lynx,面部信息迁移图生视频,人脸一致性保持,6步采样,支持5090新卡,支持批量任务,Comfyui,工作流
Wan-Lynx,面部信息迁移图生视频,人脸一致性保持,6步采样,支持5090新卡,支持批量任务,Comfyui,工作流
0/小时
图片生成图生文
Ming-UniVision
Ming-UniVision
2
@十字鱼
十字鱼认证作者
14
4H
更新时间2025-10-12
支持自启动
使用连续统一分词器进行联合图像理解和生成
使用连续统一分词器进行联合图像理解和生成
0/小时
WanComfyUI视频生成
Wan2.2-N版-文生图生视频VACE-10流整合
Wan2.2-N版-文生图生视频VACE-10流整合
22
@AI-KSK
AI-KSK认证作者
257
643H
更新时间2025-10-20
支持自启动
Smooth&Remix&AllInOne-N版合并模型的一键镜像
Smooth&Remix&AllInOne-N版合并模型的一键镜像
0/小时
DeepSeekQwenGLM
PDFMathTranslate
PDFMathTranslate
4
@十字鱼
十字鱼认证作者
5
3H
更新时间2025-10-11
支持自启动
基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务
基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务
0/小时
语音合成
indextts2-IndexTTS2 最新 V23 版本的全面升级
indextts2-IndexTTS2 最新 V23 版本的全面升级
20
@科哥AIGC
科哥AIGC认证作者
281
997H
更新时间2025-10-20
IndexTTS2 最新 V23 版本的全面升级
IndexTTS2 最新 V23 版本的全面升级
0/小时
三维重建其他
腾讯混元3d-Omni在线生成Hunyuan3D-Omni轻量版3d模型生成命令行版 构建by科哥
腾讯混元3d-Omni在线生成Hunyuan3D-Omni轻量版3d模型生成命令行版 构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
23
315H
更新时间2025-10-07
24gb可以运行该应用
24gb可以运行该应用
0/小时
Wan视频生成
Ovi 来啦!开源免费,体验一下类似 SORA 2 的视频+音频生成
Ovi 来啦!开源免费,体验一下类似 SORA 2 的视频+音频生成
7
@AI-KSK
AI-KSK认证作者
53
20H
更新时间2025-11-07
认识一下 Ovi —— 一个很像 SORA 2 的免费 AI 模型。它能生成带声音的完整视频,让你探索下一代 AI 创作的无限可能!
认识一下 Ovi —— 一个很像 SORA 2 的免费 AI 模型。它能生成带声音的完整视频,让你探索下一代 AI 创作的无限可能!
0/小时
Hunyuan图片生成
HunyuanImage-3.0
HunyuanImage-3.0
9
@十字鱼
十字鱼认证作者
49
60H
更新时间2025-10-06
支持自启动
腾讯开源80B图像生成模型 原生多模态 自回归框架
腾讯开源80B图像生成模型 原生多模态 自回归框架
0/小时
视频生成Wan
Ovi 音频视频生成
Ovi 音频视频生成
9
@十字鱼
十字鱼认证作者
53
21H
更新时间2025-10-20
支持自启动
用于音频视频生成的双主干交叉模态融合
用于音频视频生成的双主干交叉模态融合
0/小时
语音合成语音克隆
GPT-SoVITS
GPT-SoVITS
43
@aiguoliuguo
aiguoliuguo认证作者
1769
9103H
更新时间2025-10-06
GPT-SoVITS-V4(v2Pro,v2ProPlus),所需素材少,训练耗时短,情绪可控。
GPT-SoVITS-V4(v2Pro,v2ProPlus),所需素材少,训练耗时短,情绪可控。
0/小时
语音分离
MSST
MSST
23
@aiguoliuguo
aiguoliuguo认证作者
1564
2938H
更新时间2025-10-05
MSST-webUI版本,更简单,加入一键处理,效率更高,更好用的干声分离以及去和声混响的项目,可以作为传统UVR的上位替代,并兼容UVR的模型,简单且快。
MSST-webUI版本,更简单,加入一键处理,效率更高,更好用的干声分离以及去和声混响的项目,可以作为传统UVR的上位替代,并兼容UVR的模型,简单且快。
0/小时
语音合成语音克隆
index-tts2高质量声音克隆语音合成软件
index-tts2高质量声音克隆语音合成软件
26
@AI画师大阳
AI画师大阳认证作者
446
1794H
更新时间2025-10-31
支持自启动
index-tts2高质量声音克隆语音合成软件
index-tts2高质量声音克隆语音合成软件
0/小时
ComfyUI视频生成Wan
WAN22增强版-eddy-ode采样,文生视频/图生视频
WAN22增强版-eddy-ode采样,文生视频/图生视频
17
@AI-KSK
AI-KSK认证作者
187
213H
更新时间2025-10-20
视频生产更精细、更流畅、更智能、更快速、更具视觉表现力。
视频生产更精细、更流畅、更智能、更快速、更具视觉表现力。
0/小时
三维重建
腾讯混元3D2.1生成3d模型hunyuan 3d 构建by科哥
腾讯混元3D2.1生成3d模型hunyuan 3d 构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
17
74H
更新时间2025-10-01
24gb最低显存
24gb最低显存
0/小时
图片生成SD图像修复
超强图片编辑工具OmniGen2,一句话修改图片内容
超强图片编辑工具OmniGen2,一句话修改图片内容
11
@AI画师大阳
AI画师大阳认证作者
75
74H
更新时间2025-09-30
支持自启动
一句话快速精准修改图片内容
一句话快速精准修改图片内容
0/小时
数字人
StableAvatar快速生成对口型数字人视频  12gb显卡爆改by科哥
StableAvatar快速生成对口型数字人视频 12gb显卡爆改by科哥
6
@科哥AIGC
科哥AIGC认证作者
54
55H
更新时间2025-09-30
对口型数字人视频wan2.1优化项目 12gb显卡爆改by科哥
对口型数字人视频wan2.1优化项目 12gb显卡爆改by科哥
0/小时
三维重建
hunyuan3D part腾讯开源3D模型分离图片3D建模应用 汉化构建By科哥
hunyuan3D part腾讯开源3D模型分离图片3D建模应用 汉化构建By科哥
0
@科哥AIGC
科哥AIGC认证作者
6
1H
更新时间2025-09-30
需要80gb显卡使用A800测试通过。
需要80gb显卡使用A800测试通过。
0/小时
ComfyUI视频生成Wan
Lynx字节跳动高保真人脸视频生成方法comfyUI镜像
Lynx字节跳动高保真人脸视频生成方法comfyUI镜像
2
@smthem
6
22H
更新时间2025-09-29
非量化版LYNX,非KJ版,24G显存才能跑
非量化版LYNX,非KJ版,24G显存才能跑
0/小时
ComfyUIWan数字人
顶级中文数字人套件-Easy-IndexTTS2 · FireRedTTS · InfiniteTalk
顶级中文数字人套件-Easy-IndexTTS2 · FireRedTTS · InfiniteTalk
9
@AI-KSK
AI-KSK认证作者
102
963H
更新时间2025-10-03
克隆目标声音,保留音色、语气与情感;将静态图片与音频驱动生成动态视频。
克隆目标声音,保留音色、语气与情感;将静态图片与音频驱动生成动态视频。
0/小时
语音合成语音克隆
IndexTTS-V2  DeepSpeed编译加速版
IndexTTS-V2 DeepSpeed编译加速版
72
@刘悦的技术博客
刘悦的技术博客认证作者
863
1797H
更新时间2025-11-14
支持自启动
支持异步批量任务,支持接口API并发请求,语速调节,音色保存,情绪控制
支持异步批量任务,支持接口API并发请求,语速调节,音色保存,情绪控制
0/小时
视频剪辑图像修复视频生成
SeedVR2-视频高清放大工作流
SeedVR2-视频高清放大工作流
16
@科哥AIGC
科哥AIGC认证作者
168
192H
更新时间2025-09-30
支持自启动
二次高清放大视频!3b、7b模型gguf量化加速版 不易爆显存 镜像by科哥
二次高清放大视频!3b、7b模型gguf量化加速版 不易爆显存 镜像by科哥
0/小时
其他推理框架
bunkws
bunkws
1
@杭州国芯微
19
1273H
更新时间2025-09-26
Bunkws 是杭州国芯微自研的一款端到端唤醒词训练框架
Bunkws 是杭州国芯微自研的一款端到端唤醒词训练框架
0/小时
数字人视频剪辑Wan
Wan-2.2-Animate视频主体替换,支持批量任务队列
Wan-2.2-Animate视频主体替换,支持批量任务队列
36
@刘悦的技术博客
刘悦的技术博客认证作者
255
239H
更新时间2025-11-14
支持自启动
Wan-2.2-Animate视频主体替换,支持批量任务队列,初始化后,等待服务启动,大概2分钟左右,随后点击SD-WEBUI按钮即可
Wan-2.2-Animate视频主体替换,支持批量任务队列,初始化后,等待服务启动,大概2分钟左右,随后点击SD-WEBUI按钮即可
0/小时
数字人语音合成语音克隆
Niugee-IndexTTS-V2
Niugee-IndexTTS-V2
30
@NiuGee
NiuGee认证作者
232
580H
更新时间2025-09-28
支持自启动
目前情感效果最好,没有幻觉的文本转语音AI工具
目前情感效果最好,没有幻觉的文本转语音AI工具
0/小时
语音合成语音识别语音克隆
VoxCPM-小而美的TTS
VoxCPM-小而美的TTS
4
@鹄仙
鹄仙认证作者
34
288H
更新时间2025-12-07
比IndexTTS更小的语音生成模型,支持语音克隆、文生语音
比IndexTTS更小的语音生成模型,支持语音克隆、文生语音
0/小时
ComfyUIQwen-image图片生成
Qwen-Image-Edit-2509 三图融合,4步采样
Qwen-Image-Edit-2509 三图融合,4步采样
19
@刘悦的技术博客
刘悦的技术博客认证作者
130
166H
更新时间2025-11-14
支持自启动
Qwen-Image-Edit-2509三图融合.4步采样,支持自定义多重Lora嵌套,AI图片编辑修改,支持批量任务队列
Qwen-Image-Edit-2509三图融合.4步采样,支持自定义多重Lora嵌套,AI图片编辑修改,支持批量任务队列
0/小时
ComfyUI
培训师的comfyUI
培训师的comfyUI
4
@鹄仙
鹄仙认证作者
59
399H
更新时间2026-01-09
组合了图像生成、视频生成、数字人的面向培训师群体的ComfyUI
组合了图像生成、视频生成、数字人的面向培训师群体的ComfyUI
0/小时
ComfyUI视频生成图片生成
Qwen edit+Wan2.2 出图+视频的神! 平替Banana
Qwen edit+Wan2.2 出图+视频的神! 平替Banana
20
@不止设计工作室
240
1271H
更新时间2025-09-23
qwen edit满血模型部署!替代banana,结合comfyui工作流轻松实现出图、p图、视频生成
qwen edit满血模型部署!替代banana,结合comfyui工作流轻松实现出图、p图、视频生成
0/小时
视频生成数字人
MultiTalk-生成音乐MV
MultiTalk-生成音乐MV
25
@乔大峰
乔大峰认证作者
60
145H
更新时间2025-09-23
支持自启动
MultiTalk-只需上传图片和音频,帮你生成音乐MV
MultiTalk-只需上传图片和音频,帮你生成音乐MV
0/小时
ComfyUIWan视频生成
WanAnimate
WanAnimate
15
@十字鱼
十字鱼认证作者
88
111H
更新时间2025-11-06
支持自启动
Wan2.2-Animate 动作迁移&人物替换 迟来的AnimateAnyone
Wan2.2-Animate 动作迁移&人物替换 迟来的AnimateAnyone
0/小时
ComfyUI视频生成Wan
Wan-Animate-ComfyUI:角色动画生成与角色替换
Wan-Animate-ComfyUI:角色动画生成与角色替换
8
@AI-KSK
AI-KSK认证作者
89
245H
更新时间2025-10-03
Wan-Animate 是阿里巴巴通义实验室提出的一个统一框架,用于 角色动画生成与角色替换。
Wan-Animate 是阿里巴巴通义实验室提出的一个统一框架,用于 角色动画生成与角色替换。
0/小时
语音合成语音克隆
VoxCPM-来自面壁智能和清华的语音生成模型
VoxCPM-来自面壁智能和清华的语音生成模型
3
@科哥AIGC
科哥AIGC认证作者
23
17H
更新时间2025-09-30
支持自启动
几秒音频即可克隆声音 构建by科哥
几秒音频即可克隆声音 构建by科哥
0/小时
Wan视频生成ComfyUI
Wan2.2官方VACE-ComfyUI七大视频生成编辑工作流
Wan2.2官方VACE-ComfyUI七大视频生成编辑工作流
5
@AI-KSK
AI-KSK认证作者
126
294H
更新时间2025-09-22
开源的​​统一视频生成与编辑框架​​,Wan2.2-VACE-Fun​​一个模型即可支持文生视频、图生视频、视频编辑、局部修改、等多项任务
开源的​​统一视频生成与编辑框架​​,Wan2.2-VACE-Fun​​一个模型即可支持文生视频、图生视频、视频编辑、局部修改、等多项任务
0/小时
数字人视频剪辑
humo-HuMo清华大学联合字节推出的多模态视频生成框架 二改by科哥
humo-HuMo清华大学联合字节推出的多模态视频生成框架 二改by科哥
6
@科哥AIGC
科哥AIGC认证作者
14
54H
更新时间2025-09-22
支持自启动
优化1.7b可以24gb显存运行起来了!
优化1.7b可以24gb显存运行起来了!
0/小时
语音合成语音克隆
FireRedTTS2
FireRedTTS2
10
@十字鱼
十字鱼认证作者
38
754H
更新时间2025-09-19
支持自启动
面向播客和聊天机器人的长对话语音生成
面向播客和聊天机器人的长对话语音生成
0/小时
ComfyUIWan
阿里Wan2.2-14B图生视频超高画质-Q8
阿里Wan2.2-14B图生视频超高画质-Q8
55
@与AI同行
与AI同行认证作者
744
3941H
更新时间2025-09-19
支持自启动
AI生成视频Wan2.2图生视频,使用量化版Wan2.2-I2V-A14B模型
AI生成视频Wan2.2图生视频,使用量化版Wan2.2-I2V-A14B模型
0/小时
视频生成Wan
Wan-2.2-Fun-Vace视频主体替换
Wan-2.2-Fun-Vace视频主体替换
7
@刘悦的技术博客
刘悦的技术博客认证作者
48
50H
更新时间2025-11-14
支持自启动
Wan-2.2-Fun-Vace,视频主体替换、跳舞视频主体替换、广告模特替换
Wan-2.2-Fun-Vace,视频主体替换、跳舞视频主体替换、广告模特替换
0/小时
Wan视频生成数字人
HuMo: 基于协作多模态条件的人体中心视频生成
HuMo: 基于协作多模态条件的人体中心视频生成
5
@Ikaros
12
17H
更新时间2025-09-18
HuMo是一个统一的、以人为中心的视频生成框架,旨在从多模态输入(包括文本、图像和音频)生成高质量、细粒度且可控的人体视频。它支持强大的文本提示跟随、一致的主体保持和同步的音频驱动动作。
HuMo是一个统一的、以人为中心的视频生成框架,旨在从多模态输入(包括文本、图像和音频)生成高质量、细粒度且可控的人体视频。它支持强大的文本提示跟随、一致的主体保持和同步的音频驱动动作。
0/小时
语音合成语音识别语音分离
FireRedASR语音识别、语音转文字 构建by科哥
FireRedASR语音识别、语音转文字 构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
22
14H
更新时间2025-09-30
支持自启动
FireRedASR语音识别系统语音转文字语音转文本千问开源 构建by科哥
FireRedASR语音识别系统语音转文字语音转文本千问开源 构建by科哥
0/小时
语音识别语音翻译语音合成
FunASR在线语音识别/语音生成   二次开发构建by科哥
FunASR在线语音识别/语音生成 二次开发构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
21
26H
更新时间2025-09-30
来自阿里开源 科哥二次构建开发webui
来自阿里开源 科哥二次构建开发webui
0/小时
语音合成
VibeVoice – 微软推出的开源文本转语音模型 汉化构建by科哥
VibeVoice – 微软推出的开源文本转语音模型 汉化构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
24
12H
更新时间2025-09-30
支持自启动
可以一次性合成4人的对话播客
可以一次性合成4人的对话播客
0/小时
SD
SD高质量CG绘画
SD高质量CG绘画
6
@AI画师大阳
AI画师大阳认证作者
107
322H
更新时间2025-09-17
支持自启动
SD高质量CG绘画
SD高质量CG绘画
0/小时
其他
alchemy
alchemy
1
@杭州国芯微
0
0H
更新时间2025-09-17
用于训练alchemy kws模型
用于训练alchemy kws模型
0/小时
语义分割图像分类目标检测
SAM 2:图像和视频中的任何内容分割
SAM 2:图像和视频中的任何内容分割
0
@Ikaros
7
9H
更新时间2025-09-17
SAM 2:图像和视频中的任何内容分割。比如切出视频中的人物、物体等,可以对目标和背景进行扣除换色等效果设置。
SAM 2:图像和视频中的任何内容分割。比如切出视频中的人物、物体等,可以对目标和背景进行扣除换色等效果设置。
0/小时
数字人
AnchorCrafter:通过人体-物体交互视频生成动画化您的产品销售数字人
AnchorCrafter:通过人体-物体交互视频生成动画化您的产品销售数字人
9
@Ikaros
16
33H
更新时间2025-09-17
AnchorCrafter,生成带货数字人视频。通过人体-物体交互视频生成动画化您的产品销售数字人
AnchorCrafter,生成带货数字人视频。通过人体-物体交互视频生成动画化您的产品销售数字人
0/小时
数字人
OpenAvatarChat——十字鱼镜像
OpenAvatarChat——十字鱼镜像
45
@十字鱼
十字鱼认证作者
495
6078H
更新时间2025-09-16
支持自启动
阿里开源实时交互数字。 模块化的交互数字人对话实现,能够在单台PC上运行完整功能。
阿里开源实时交互数字。 模块化的交互数字人对话实现,能够在单台PC上运行完整功能。
0/小时
视频生成数字人
HuMo
HuMo
4
@十字鱼
十字鱼认证作者
9
10H
更新时间2025-09-16
支持自启动
以人为中心的视频生成方法——协作多模态条件化
以人为中心的视频生成方法——协作多模态条件化
0/小时
语音合成语音克隆
超强AI音频变声器SeedVC-2.1
超强AI音频变声器SeedVC-2.1
16
@与AI同行
与AI同行认证作者
152
293H
更新时间2025-09-15
支持自启动
超强AI音频变声器SeedVC-2.1
超强AI音频变声器SeedVC-2.1
0/小时
语音合成语音克隆
最强AI音色克隆IndexTTS-V2-批量生成
最强AI音色克隆IndexTTS-V2-批量生成
151
@与AI同行
与AI同行认证作者
1510
4245H
更新时间2025-09-15
支持自启动
最强AI音色克隆IndexTTS-V2-批量生成
最强AI音色克隆IndexTTS-V2-批量生成
0/小时
视频生成数字人
AnchorCrafter-WebUI
AnchorCrafter-WebUI
11
@乔大峰
乔大峰认证作者
8
2H
更新时间2025-09-15
支持自启动
开箱即用,生成真实的带货视频
开箱即用,生成真实的带货视频
0/小时
语音合成语音克隆
index-tts2 声音克隆
index-tts2 声音克隆
24
@有趣的80后程序员
有趣的80后程序员认证作者
283
1478H
更新时间2025-11-07
让ai声音更真实,更自然,更有温度
让ai声音更真实,更自然,更有温度
0/小时
视频生成
MAGI-1
MAGI-1
0
@苍耳阿猫
苍耳阿猫认证作者
4
8H
更新时间2025-09-15
MAGI-1,一个通过 自回归 预测视频块序列来生成视频的世界模型
MAGI-1,一个通过 自回归 预测视频块序列来生成视频的世界模型
0/小时
ComfyUI视频生成
大鹏最强FusionX动作迁移(和真人一模一样)
大鹏最强FusionX动作迁移(和真人一模一样)
32
@大鹏
大鹏认证作者
192
275H
更新时间2025-09-12
支持自启动
这个版本无敌了,出的效果兄弟们话不多说直接看图
这个版本无敌了,出的效果兄弟们话不多说直接看图
0/小时
语音合成语音克隆
IndexTTS2 模型镜像 汉化构建by科哥
IndexTTS2 模型镜像 汉化构建by科哥
20
@科哥AIGC
科哥AIGC认证作者
184
294H
更新时间2025-09-30
B站开源的indextts2.0版本,强势来袭!
B站开源的indextts2.0版本,强势来袭!
0/小时
语音翻译语音识别
最好用的中文音频视频语音识别转文本字幕软件FunASR
最好用的中文音频视频语音识别转文本字幕软件FunASR
5
@AI画师大阳
AI画师大阳认证作者
70
305H
更新时间2025-09-12
支持自启动
将音频视频语音识别转为文本文件和SRT字幕文件
将音频视频语音识别转为文本文件和SRT字幕文件
0/小时
数字人
HeyGem数字人优化加速版,GFPGAN面部超分增强
HeyGem数字人优化加速版,GFPGAN面部超分增强
30
@刘悦的技术博客
刘悦的技术博客认证作者
438
948H
更新时间2025-11-14
支持自启动
HeyGem数字人优化加速版,GFPGAN面部超分增强,批量任务,修复多面部报错,推理速度1比2,唱歌数字人
HeyGem数字人优化加速版,GFPGAN面部超分增强,批量任务,修复多面部报错,推理速度1比2,唱歌数字人
0/小时
Wan视频生成
Wan2.2-图生视频-批量任务队列版本
Wan2.2-图生视频-批量任务队列版本
23
@刘悦的技术博客
刘悦的技术博客认证作者
439
1424H
更新时间2025-11-14
支持自启动
Wan2.2-图生视频-批量任务队列版本-自定义lora-自定义首尾帧
Wan2.2-图生视频-批量任务队列版本-自定义lora-自定义首尾帧
0/小时
语音合成语音克隆
indexTTS2
indexTTS2
8
@白菜工厂1145号员工
白菜工厂1145号员工认证作者
142
366H
更新时间2025-09-12
支持自启动
无需训练,开源最强zero shot语音合成
无需训练,开源最强zero shot语音合成
0/小时
Hunyuan视频生成
HunyuanVideo-Foley
HunyuanVideo-Foley
3
@鹄仙
鹄仙认证作者
18
44H
更新时间2025-09-12
为视频添加音效
为视频添加音效
0/小时
语音合成语音克隆ComfyUI
Index-TTS2--B站9月8日最新开源语音克隆模型ComfyUI版
Index-TTS2--B站9月8日最新开源语音克隆模型ComfyUI版
6
@社恐的知识树
社恐的知识树认证作者
114
252H
更新时间2025-09-12
Index-tts2-B站最新开源语音大模型:声音克隆,情感复刻,多人对话,ComfyUI版
Index-tts2-B站最新开源语音大模型:声音克隆,情感复刻,多人对话,ComfyUI版
0/小时
ComfyUI视频生成图片生成
换装+换脸+换一切+动作迁移+图片视频N合一
换装+换脸+换一切+动作迁移+图片视频N合一
33
@大鹏
大鹏认证作者
302
390H
更新时间2025-09-10
支持自启动
换装+换脸+换一切+动作迁移+图片视频N合一,最快wan2.2加速,最新kontext换一切,最强换装,最强换姿态迁移图片视频方案+最速换脸
换装+换脸+换一切+动作迁移+图片视频N合一,最快wan2.2加速,最新kontext换一切,最强换装,最强换姿态迁移图片视频方案+最速换脸
0/小时
视频生成
Facefusion3.4最新官方原版 图片换脸视频换脸高清图片 构建By科哥
Facefusion3.4最新官方原版 图片换脸视频换脸高清图片 构建By科哥
4
@科哥AIGC
科哥AIGC认证作者
49
64H
更新时间2025-09-12
支持自启动
Facefusion3.4最新3.4官方原本全部模型已经下载11gb!!!
Facefusion3.4最新3.4官方原本全部模型已经下载11gb!!!
0/小时
LoraQwen-image
musubi-qwen-image lora 训练镜像
musubi-qwen-image lora 训练镜像
19
@有趣的80后程序员
有趣的80后程序员认证作者
153
684H
更新时间2025-09-09
最简单占用资源最小的lora训练镜像
最简单占用资源最小的lora训练镜像
0/小时
Wan图片生成
Wan2.2-图生视频-灵活海量批量任务
Wan2.2-图生视频-灵活海量批量任务
12
@星悦
星悦认证作者
81
51H
更新时间2025-09-10
支持自启动
Wan2.2图生视频灵活批量任务。启动后自动运行。1.在本地修改图片文件名。2.上传到云端文件夹【待处理图片】。3.稍等,下载视频文件夹视频【生成结果】。
Wan2.2图生视频灵活批量任务。启动后自动运行。1.在本地修改图片文件名。2.上传到云端文件夹【待处理图片】。3.稍等,下载视频文件夹视频【生成结果】。
0/小时
其他
cuda124-py310-torch2.7基础镜像版本
cuda124-py310-torch2.7基础镜像版本
3
@科哥AIGC
科哥AIGC认证作者
17
281H
更新时间2025-09-12
cuda124-py310-torch2.7基础镜像版本
cuda124-py310-torch2.7基础镜像版本
0/小时
Wan数字人
Wan2.2-S2V-14B: 音频驱动的电影视频生成
Wan2.2-S2V-14B: 音频驱动的电影视频生成
0
@AI画师大阳
AI画师大阳认证作者
71
70H
更新时间2025-09-09
支持自启动
通过音频驱动的图片转视频生成软件,支持声音克隆功能
通过音频驱动的图片转视频生成软件,支持声音克隆功能
0/小时
图片生成
USO字节开源风格随心主体如真打造创意与真实完美统一的AI生成新标准 汉化构建by科哥
USO字节开源风格随心主体如真打造创意与真实完美统一的AI生成新标准 汉化构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
12
64H
更新时间2025-09-12
主题风格一致,创意无限,配合lora
主题风格一致,创意无限,配合lora
0/小时
数字人Wan
WAN2.2-S2V最新版数字人+动作参考
WAN2.2-S2V最新版数字人+动作参考
8
@社恐的知识树
社恐的知识树认证作者
82
92H
更新时间2025-09-06
阿里开源音+图片+动作参考生成视频模型,Comfyui官方最终优化版工作流
阿里开源音+图片+动作参考生成视频模型,Comfyui官方最终优化版工作流
0/小时
图像修复视频生成
最强AI高清修复-SeedVR2-图片和视频高清放大
最强AI高清修复-SeedVR2-图片和视频高清放大
45
@与AI同行
与AI同行认证作者
757
1078H
更新时间2025-09-05
支持自启动
最强AI高清修复-SeedVR2-图片和视频高清放大
最强AI高清修复-SeedVR2-图片和视频高清放大
0/小时
ComfyUI视频生成图片生成
大鹏姿态迁移,图片,视频,换装,图生视频四合一
大鹏姿态迁移,图片,视频,换装,图生视频四合一
18
@大鹏
大鹏认证作者
115
178H
更新时间2025-09-05
支持自启动
高质量工作流,点开即可运行
高质量工作流,点开即可运行
0/小时
ComfyUI视频生成
Work-Fisher短片制作整合包
Work-Fisher短片制作整合包
14
@Work-Fisher
72
114H
更新时间2025-09-05
创造属于你的AI短片
创造属于你的AI短片
0/小时
机器翻译
PDF文档翻译器BabelDOC
PDF文档翻译器BabelDOC
2
@AI画师大阳
AI画师大阳认证作者
71
310H
更新时间2025-09-09
基于强大在线大语言模型的PDF文档翻译器
基于强大在线大语言模型的PDF文档翻译器
0/小时
ComfyUIFlux
牛哥的专属ComfyUI大集合版-V1
牛哥的专属ComfyUI大集合版-V1
13
@NiuGee
NiuGee认证作者
89
187H
更新时间2025-09-09
牛哥的专属ComfyUI大集合版本,功能持续扩充,点击即用
牛哥的专属ComfyUI大集合版本,功能持续扩充,点击即用
0/小时
Hunyuan
HunyuanWorld-WebUI fp8量化魔改版 开发构建by科哥
HunyuanWorld-WebUI fp8量化魔改版 开发构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
15
82H
更新时间2025-09-12
HunyuanWorld 3d世界生成系统 腾讯开源
HunyuanWorld 3d世界生成系统 腾讯开源
0/小时
Hunyuan音乐
最强AI视频配音-腾讯Hunyuan-Foley
最强AI视频配音-腾讯Hunyuan-Foley
16
@与AI同行
与AI同行认证作者
94
143H
更新时间2025-09-03
最强AI视频配音-腾讯Hunyuan-Foley
最强AI视频配音-腾讯Hunyuan-Foley
0/小时
语音合成语音克隆
音频视频语音识别转文本字幕faster-whisper 1.2
音频视频语音识别转文本字幕faster-whisper 1.2
12
@AI画师大阳
AI画师大阳认证作者
143
432H
更新时间2025-09-09
将音频或视频文件语音识别转为文本文件或字幕文件
将音频或视频文件语音识别转为文本文件或字幕文件
0/小时
三维重建
Unique3D在线生成3D模型  汉化构建By科哥
Unique3D在线生成3D模型 汉化构建By科哥
2
@科哥AIGC
科哥AIGC认证作者
21
49H
更新时间2025-09-12
一张图片就可以生成3D glb模型
一张图片就可以生成3D glb模型
0/小时
ComfyUI图片生成
gen_backview
gen_backview
0
@frankyxu
6
1055H
更新时间2025-09-03
gen_backview bug 修复
gen_backview bug 修复
0/小时
Wan数字人
Wan2.2 S2V 数字人 阿里通义千问出品
Wan2.2 S2V 数字人 阿里通义千问出品
12
@十字鱼
十字鱼认证作者
156
309H
更新时间2025-09-02
Wan2.2 S2V 数字人 阿里通义千问出品 这是一个音频驱动的电影视频生成模型
Wan2.2 S2V 数字人 阿里通义千问出品 这是一个音频驱动的电影视频生成模型
0/小时
Hunyuan音乐
HunyuanVideo-Foley腾讯开源视频音效配音文本配音 汉化构建by科哥
HunyuanVideo-Foley腾讯开源视频音效配音文本配音 汉化构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
35
41H
更新时间2025-09-12
根据一段文本或者视频,生成你的配音
根据一段文本或者视频,生成你的配音
0/小时
Hunyuan音乐
HunyuanVideo-Foley 腾讯混元开源音效模型
HunyuanVideo-Foley 腾讯混元开源音效模型
2
@十字鱼
十字鱼认证作者
9
7H
更新时间2025-09-03
一键视频配音,完美自动化
一键视频配音,完美自动化
0/小时
ComfyUI
DelikeAI 应用镜像
DelikeAI 应用镜像
1
@Delike乐仔
13
61H
更新时间2025-09-01
DelikeAI 应用镜像
DelikeAI 应用镜像
0/小时
ComfyUI数字人语音
HunyuanVideoFoley-AI视频配乐
HunyuanVideoFoley-AI视频配乐
8
@匹夫
匹夫认证作者
81
124H
更新时间2025-10-20
支持自启动
HunyuanVideoFoley-能自动给视频配乐的AI模型
HunyuanVideoFoley-能自动给视频配乐的AI模型
0/小时
Wan视频生成
Wan2GP——十字鱼镜像
Wan2GP——十字鱼镜像
2
@十字鱼
十字鱼认证作者
38
159H
更新时间2025-09-03
Wan2GP,高度优化的视频生成项目,支持Wan、Hunyuan和LTX等相关模型
Wan2GP,高度优化的视频生成项目,支持Wan、Hunyuan和LTX等相关模型
0/小时
数字人
HeyGem-webui在线数字人视频口播数字人 构建bu科哥
HeyGem-webui在线数字人视频口播数字人 构建bu科哥
7
@科哥AIGC
科哥AIGC认证作者
115
105H
更新时间2025-09-12
一键运行优化版,开机自启动
一键运行优化版,开机自启动
0/小时
数字人ComfyUI
AI换人术一键将跳舞视频主角变成你!(Stand-In + VACE + ComfyUI 镜像版)
AI换人术一键将跳舞视频主角变成你!(Stand-In + VACE + ComfyUI 镜像版)
18
@电磁波Studio
电磁波Studio认证作者
208
398H
更新时间2025-09-01
AI换人术一键将跳舞视频主角变成你!(Stand-In + VACE + ComfyUI 镜像版)
AI换人术一键将跳舞视频主角变成你!(Stand-In + VACE + ComfyUI 镜像版)
0/小时
数字人ComfyUISD
musubi-tunner-wan2.2训练镜像
musubi-tunner-wan2.2训练镜像
27
@有趣的80后程序员
有趣的80后程序员认证作者
340
2129H
更新时间2025-10-28
musubi-tunner-wan2.2 lora 训练镜像,内置模型数据集
musubi-tunner-wan2.2 lora 训练镜像,内置模型数据集
0/小时
ComfyUIWebUI深度学习
InfiniteTalk数字人,4步采样,无限时长,说话数字人,唱歌数字人
InfiniteTalk数字人,4步采样,无限时长,说话数字人,唱歌数字人
48
@刘悦的技术博客
刘悦的技术博客认证作者
1172
2030H
更新时间2025-11-14
InfiniteTalk数字人,4步采样,无限时长,说话数字人,唱歌数字人,支持反推关键词,基于comfyui工作流
InfiniteTalk数字人,4步采样,无限时长,说话数字人,唱歌数字人,支持反推关键词,基于comfyui工作流
0/小时
Qwen-image
Qwen-image-千问合集
Qwen-image-千问合集
3
@虚幻1024
65
274H
更新时间2025-09-08
ComfyUI - qwen-image-千问合集
ComfyUI - qwen-image-千问合集
0/小时
三维重建
SpatialGen - 3D场景生成器
SpatialGen - 3D场景生成器
0
@科哥AIGC
科哥AIGC认证作者
5
11H
更新时间2025-09-12
基于多视角多模态扩散模型的3D场景生成工具 支持图像到3D场景和文本到3D场景的生成
基于多视角多模态扩散模型的3D场景生成工具 支持图像到3D场景和文本到3D场景的生成
0/小时
音乐
ThinkSound视频配音
ThinkSound视频配音
1
@科哥AIGC
科哥AIGC认证作者
22
113H
更新时间2025-09-12
支持自启动
ThinkSound视频配音
ThinkSound视频配音
0/小时
Wan数字人
wan2.2-S2V数字人,支持批量任务队列
wan2.2-S2V数字人,支持批量任务队列
10
@刘悦的技术博客
刘悦的技术博客认证作者
114
119H
更新时间2025-11-14
支持自启动
支持批量任务队列,说话数字人,唱歌数字人,支持反推关键词,基于comfyui工作流
支持批量任务队列,说话数字人,唱歌数字人,支持反推关键词,基于comfyui工作流
0/小时
Wan数字人
Wan2.2-S2V数字人-对口型-音频驱动视频生成
Wan2.2-S2V数字人-对口型-音频驱动视频生成
14
@AI-KSK
AI-KSK认证作者
168
221H
更新时间2025-08-31
Wan2.2-S2V数字人,通过一张静态图片和一段音频(如说话或唱歌)自动生成高质量、口型同步的电影级视频。
Wan2.2-S2V数字人,通过一张静态图片和一段音频(如说话或唱歌)自动生成高质量、口型同步的电影级视频。
0/小时
ComfyUI
视频人物主体替换
视频人物主体替换
4
@AI画师大阳
AI画师大阳认证作者
41
24H
更新时间2025-08-27
支持自启动
用一张图片中人物替换视频中的人物主体
用一张图片中人物替换视频中的人物主体
0/小时
Qwen-image
Qwen-Image-Edit-多图融合-面部一致性保持
Qwen-Image-Edit-多图融合-面部一致性保持
10
@刘悦的技术博客
刘悦的技术博客认证作者
98
290H
更新时间2025-11-14
支持自启动
Qwen-Image-Edit-多图融合-面部一致性保持,基于comfyui工作流
Qwen-Image-Edit-多图融合-面部一致性保持,基于comfyui工作流
0/小时
ComfyUIWan
Wan2.2-Lora训练,文生视频与图生视频Lora训练,AIToolkit
Wan2.2-Lora训练,文生视频与图生视频Lora训练,AIToolkit
20
@AI-KSK
AI-KSK认证作者
229
2417H
更新时间2025-08-31
用做训练Wan2.2文生视频或者/图生视频的 LoRA 模型
用做训练Wan2.2文生视频或者/图生视频的 LoRA 模型
0/小时
AI编程
RapidOCR_API_Torch_GPU
RapidOCR_API_Torch_GPU
1
@SWHL
SWHL认证作者
4
8H
更新时间2025-08-27
基于 ONNXRuntime、OpenVINO、PaddlePaddle 和 PyTorch 的超棒 OCR 多编程语言工具包。
基于 ONNXRuntime、OpenVINO、PaddlePaddle 和 PyTorch 的超棒 OCR 多编程语言工具包。
0/小时
Qwen-image
最强AI图片QwenImage-Edit-WebUI-支持Lora
最强AI图片QwenImage-Edit-WebUI-支持Lora
10
@与AI同行
与AI同行认证作者
128
194H
更新时间2025-09-08
支持自启动
QwenImage+Edit-WebUI-支持Lora
QwenImage+Edit-WebUI-支持Lora
0/小时
其他
VL视觉模型集合
VL视觉模型集合
1
@Ikaros
3
96H
更新时间2025-08-27
内置InternVL3-8B、GLM-4.1V-9B-Thinking、GLM-4.1V-9B-Thinking-bnb-4bit 一键启动API服务
内置InternVL3-8B、GLM-4.1V-9B-Thinking、GLM-4.1V-9B-Thinking-bnb-4bit 一键启动API服务
0/小时
Hunyuan
HunyuanWorld-1.0-lite 腾讯混元3D世界lite
HunyuanWorld-1.0-lite 腾讯混元3D世界lite
0
@科哥AIGC
科哥AIGC认证作者
8
18H
更新时间2025-09-12
快速打造你的3D游戏世界1.0,通过jupyterlab命令行运行生成3D游戏世界
快速打造你的3D游戏世界1.0,通过jupyterlab命令行运行生成3D游戏世界
0/小时
数字人
infinitetalk数字人工作流
infinitetalk数字人工作流
61
@匹夫
匹夫认证作者
1113
3743H
更新时间2025-08-27
支持自启动
infinitetalk,音频+图片参考、音频+视频参考工作流
infinitetalk,音频+图片参考、音频+视频参考工作流
0/小时
ComfyUIWan
wan2.1文生视频动作迁移
wan2.1文生视频动作迁移
4
@AI画师大阳
AI画师大阳认证作者
105
191H
更新时间2025-08-27
支持自启动
模仿参考视频人物动作快速生成新的人物视频
模仿参考视频人物动作快速生成新的人物视频
0/小时
Qwen
Qwen3-Smvl多模态模型
Qwen3-Smvl多模态模型
1
@敢敢のwings
敢敢のwings认证作者
3
0H
更新时间2025-09-08
支持自启动
最近Huggingface团队发布了超小多模态模型SmolVLM2,可以做到端侧1GB显存推理。作者尝试当前中文小模型扛把子Qwen3与SmolVLM2直接微调拼接的想法
最近Huggingface团队发布了超小多模态模型SmolVLM2,可以做到端侧1GB显存推理。作者尝试当前中文小模型扛把子Qwen3与SmolVLM2直接微调拼接的想法
0/小时
推理框架
ms-swift轻量级微调模型框架
ms-swift轻量级微调模型框架
1
@bright
11
135H
更新时间2025-08-27
ms-swift是魔搭社区提供的大模型与多模态大模型微调部署框架.
ms-swift是魔搭社区提供的大模型与多模态大模型微调部署框架.
0/小时
Qwen-image
Qwen-Image-Edit-4步采样
Qwen-Image-Edit-4步采样
3
@刘悦的技术博客
刘悦的技术博客认证作者
35
36H
更新时间2025-11-14
支持自启动
支持自定义Lora,AI图片编辑修改,支持反推提示词
支持自定义Lora,AI图片编辑修改,支持反推提示词
0/小时
语音合成
voice-changer
voice-changer
4
@aiguoliuguo
aiguoliuguo认证作者
133
5440H
更新时间2025-08-27
Voice Changer 云端在线变声器
Voice Changer 云端在线变声器
0/小时
ComfyUI图片生成
ComfyUI高清4K文生图
ComfyUI高清4K文生图
3
@AI画师大阳
AI画师大阳认证作者
66
322H
更新时间2025-08-27
支持自启动
ComfyUI版实现stable diffusion文生图高清放大人脸修复,直出4K
ComfyUI版实现stable diffusion文生图高清放大人脸修复,直出4K
0/小时
ComfyUIWan
WAN2.2视频生产加速套件-ComfyUI
WAN2.2视频生产加速套件-ComfyUI
6
@AI-KSK
AI-KSK认证作者
70
172H
更新时间2025-08-21
WAN 2.2极速性能优化​10工作流多任务视频生成套件
WAN 2.2极速性能优化​10工作流多任务视频生成套件
0/小时
数字人
MultiTalk数字人优化加速版本-无限时长-唱歌/说话数字人
MultiTalk数字人优化加速版本-无限时长-唱歌/说话数字人
5
@刘悦的技术博客
刘悦的技术博客认证作者
129
343H
更新时间2025-11-14
支持自启动
MultiTalk数字人优化加速版本-2步采样,对精度有要求修改采样数为4或者8
MultiTalk数字人优化加速版本-2步采样,对精度有要求修改采样数为4或者8
0/小时
图像修复视频生成
Seed-VR2-7B,图片视频超清放大,人体细节部位放大,支持批量任务
Seed-VR2-7B,图片视频超清放大,人体细节部位放大,支持批量任务
6
@刘悦的技术博客
刘悦的技术博客认证作者
83
87H
更新时间2025-11-14
支持自启动
Seed-VR2-7B,图片视频超清放大,人体细节部位放大,支持批量任务,初始化后,等待服务启动,大概2分钟,然后点击SD-WEBUI即可
Seed-VR2-7B,图片视频超清放大,人体细节部位放大,支持批量任务,初始化后,等待服务启动,大概2分钟,然后点击SD-WEBUI即可
0/小时
图像修复视频生成
ben2抠图-在线去除图片、视频背景神器,绿幕抠图神器 构建By科哥
ben2抠图-在线去除图片、视频背景神器,绿幕抠图神器 构建By科哥
2
@科哥AIGC
科哥AIGC认证作者
55
120H
更新时间2025-09-12
支持自启动
ben2抠图webui在线抠视频除去图片视频背景神器绿幕抠图神器 构建By科哥
ben2抠图webui在线抠视频除去图片视频背景神器绿幕抠图神器 构建By科哥
0/小时
语音合成语音克隆
CosyVoice界面优化版 可以粤语、普通、英语、日语、四川话、天津话、上海话等声音克隆
CosyVoice界面优化版 可以粤语、普通、英语、日语、四川话、天津话、上海话等声音克隆
9
@科哥AIGC
科哥AIGC认证作者
145
253H
更新时间2025-09-12
支持自启动
CosyVoice界面优化版 可以粤语、普通、英语、日语、四川话、天津话、上海话等声音克隆
CosyVoice界面优化版 可以粤语、普通、英语、日语、四川话、天津话、上海话等声音克隆
0/小时
图像修复
DiffBIR一键图片老照片高清修复 汉化构建by科哥
DiffBIR一键图片老照片高清修复 汉化构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
46
21H
更新时间2025-09-12
支持自启动
DiffBIR一键图片老照片高清修复 汉化构建by科哥
DiffBIR一键图片老照片高清修复 汉化构建by科哥
0/小时
视频生成
最强人脸迁移生成视频Stand-In支持批量生成
最强人脸迁移生成视频Stand-In支持批量生成
9
@与AI同行
与AI同行认证作者
56
48H
更新时间2025-08-28
支持自启动
最强人脸迁移生成视频Stand-In-支持批量生成
最强人脸迁移生成视频Stand-In-支持批量生成
0/小时
数字人
HeyGem数字人加速优化版,解决多脸型报错
HeyGem数字人加速优化版,解决多脸型报错
4
@刘悦的技术博客
刘悦的技术博客认证作者
83
279H
更新时间2025-11-14
支持自启动
HeyGem数字人加速优化版,解决多脸型报错,解决没有脸报错,
HeyGem数字人加速优化版,解决多脸型报错,解决没有脸报错,
0/小时
图像修复
HYPIR一个基于扩散生成的分数进行图像恢复的应用 汉化构建By科哥
HYPIR一个基于扩散生成的分数进行图像恢复的应用 汉化构建By科哥
2
@科哥AIGC
科哥AIGC认证作者
10
25H
更新时间2025-09-12
支持自启动
一键进行修复图片
一键进行修复图片
0/小时
图片生成视频生成
Magic-TryOn图片换装视频换装 构建by科哥
Magic-TryOn图片换装视频换装 构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
17
66H
更新时间2025-09-12
Magic-TryOn图片换装视频换装 构建by科哥
Magic-TryOn图片换装视频换装 构建by科哥
0/小时
WebUI通义数字人
Wan2.2-图生视频-批量任务-自定义lora-自定义首尾帧
Wan2.2-图生视频-批量任务-自定义lora-自定义首尾帧
18
@刘悦的技术博客
刘悦的技术博客认证作者
313
1865H
更新时间2025-11-14
支持自启动
Wan2.2-图生视频-批量任务-自定义lora-自定义首尾帧
Wan2.2-图生视频-批量任务-自定义lora-自定义首尾帧
0/小时
推理框架
LlamaFactory纯净版-微调使用
LlamaFactory纯净版-微调使用
4
@WYSLOVE
119
1992H
更新时间2025-08-12
在conda环境下仅安装了LlamaFactory,以及llama.cpp,llama.cpp未编译,可用convert.py来导出gguf模型文件
在conda环境下仅安装了LlamaFactory,以及llama.cpp,llama.cpp未编译,可用convert.py来导出gguf模型文件
0.01/小时
数字人
RuoYI AI 二开AI数字人
RuoYI AI 二开AI数字人
2
@熊猫助手
熊猫助手认证作者
14
106H
更新时间2025-08-14
基于livetalking二开,实现AI数字人功能,支持coze智能体工作流对接,功能更加强大!
基于livetalking二开,实现AI数字人功能,支持coze智能体工作流对接,功能更加强大!
0/小时
视频生成
FramePack-F1 牛哥版
FramePack-F1 牛哥版
6
@NiuGee
NiuGee认证作者
70
221H
更新时间2025-08-11
FramePack F1 牛哥加速版
FramePack F1 牛哥加速版
0/小时
SD
秋叶丹炉(Lora-Scripts)1.12
秋叶丹炉(Lora-Scripts)1.12
10
@龙没耳
龙没耳认证作者
257
1868H
更新时间2025-08-11
支持自启动
秋叶丹炉lora-scripts1.12+Joy Caption 3原创可视化自动批量打标工具1.4版
秋叶丹炉lora-scripts1.12+Joy Caption 3原创可视化自动批量打标工具1.4版
0/小时
FluxComfyUI
Flux_Krea_Flux_Dev-Loras
Flux_Krea_Flux_Dev-Loras
6
@seazou
32
32H
更新时间2025-08-11
Flux_Krea&Flux_Dev-loras,本镜像包含多个用于Flux的lora
Flux_Krea&Flux_Dev-loras,本镜像包含多个用于Flux的lora
0.02/小时
Qwen-image
Qwen-Image蒸馏加速版,批量生成,自定义Lora
Qwen-Image蒸馏加速版,批量生成,自定义Lora
4
@刘悦的技术博客
刘悦的技术博客认证作者
70
113H
更新时间2025-11-14
Qwen-Image-蒸馏加速版,支持自定义Lora,支持批量抽卡,文字生成图片
Qwen-Image-蒸馏加速版,支持自定义Lora,支持批量抽卡,文字生成图片
0/小时
Qwen语音合成语音克隆
MOSS TTSD + Qwen3,自动生成完整语音播客(PodCast)
MOSS TTSD + Qwen3,自动生成完整语音播客(PodCast)
10
@刘悦的技术博客
刘悦的技术博客认证作者
44
137H
更新时间2025-11-14
支持自启动
MOSS-TTSD结合Qwen3-30B-A3B-Instruct-2507,自动生成完整语音播客(PodCast),初始化之后,等待服务启动,大概2分钟左右,然后点击 SD-WEBUI 按钮即可
MOSS-TTSD结合Qwen3-30B-A3B-Instruct-2507,自动生成完整语音播客(PodCast),初始化之后,等待服务启动,大概2分钟左右,然后点击 SD-WEBUI 按钮即可
0/小时
数字人
EchoMimicV3
EchoMimicV3
3
@十字鱼
十字鱼认证作者
40
72H
更新时间2025-08-11
EchoMimicV3:1.3B 参数即可实现统一的多模态和多任务人体动画
EchoMimicV3:1.3B 参数即可实现统一的多模态和多任务人体动画
0/小时
LoraWan视频生成
aitookit_wan21_t2v_lora_训练镜像
aitookit_wan21_t2v_lora_训练镜像
10
@有趣的80后程序员
有趣的80后程序员认证作者
185
2519H
更新时间2025-08-11
aitookit_wan21_t2v_lora_训练镜像,内置模型、数据集 cuda 12.6 pytorch 2.7
aitookit_wan21_t2v_lora_训练镜像,内置模型、数据集 cuda 12.6 pytorch 2.7
0/小时
语音合成语音克隆
mega-tts3无须官方npy文件 几秒音频克隆情感一致的声音字节开源 构建by科哥
mega-tts3无须官方npy文件 几秒音频克隆情感一致的声音字节开源 构建by科哥
4
@科哥AIGC
科哥AIGC认证作者
47
408H
更新时间2025-09-12
支持自启动
mega-tts3无须官方npy文件 几秒音频克隆情感一致的声音
mega-tts3无须官方npy文件 几秒音频克隆情感一致的声音
0/小时
ComfyUIQwen-image
comfyui万物迁移,万物移除,qwen-image,kontext整合包
comfyui万物迁移,万物移除,qwen-image,kontext整合包
10
@匹夫
匹夫认证作者
194
536H
更新时间2025-09-08
支持自启动
comfyui万物迁移、万物移除、qwen-image、kontext整合包
comfyui万物迁移、万物移除、qwen-image、kontext整合包
0/小时
图片生成Qwen-image
最强AI生成图片-阿里QwenImage-批量生成图片
最强AI生成图片-阿里QwenImage-批量生成图片
8
@与AI同行
与AI同行认证作者
86
125H
更新时间2025-08-28
支持自启动
最强AI生成图片-阿里QwenImage-批量生成图片
最强AI生成图片-阿里QwenImage-批量生成图片
0/小时
视频生成视频剪辑
DLoRAL视频超分
DLoRAL视频超分
2
@Ikaros
11
20H
更新时间2025-08-07
一步扩散实现细节丰富且时间一致的视频超分辨率
一步扩散实现细节丰富且时间一致的视频超分辨率
0/小时
音乐
jam在线歌词生成音乐 音乐生成音乐 构建By科哥
jam在线歌词生成音乐 音乐生成音乐 构建By科哥
3
@科哥AIGC
科哥AIGC认证作者
29
12H
更新时间2025-09-12
根据歌词,原音乐创作你的音乐。
根据歌词,原音乐创作你的音乐。
0/小时
音乐
jam在线歌词生成音乐音乐生成音乐构建By科哥
jam在线歌词生成音乐音乐生成音乐构建By科哥
1
@科哥AIGC
科哥AIGC认证作者
6
4H
更新时间2025-09-12
jam在线歌词生成音乐音乐生成音乐构建By科哥
jam在线歌词生成音乐音乐生成音乐构建By科哥
0/小时
ComfyUI
RUIQILI_COMFYUI
RUIQILI_COMFYUI
2
@李睿琪
152
668H
更新时间2025-08-11
支持自启动
建筑模型 ComfyUI
建筑模型 ComfyUI
0/小时
数字人
HeyGem数字人加速优化版,批量任务支持唱歌数字人
HeyGem数字人加速优化版,批量任务支持唱歌数字人
15
@刘悦的技术博客
刘悦的技术博客认证作者
377
657H
更新时间2025-11-14
支持自启动
HeyGem数字人加速优化版,支持唱歌数字人,批量任务, 部署后,等待服务启动,大概2分钟,然后点击 SD-WebUi
HeyGem数字人加速优化版,支持唱歌数字人,批量任务, 部署后,等待服务启动,大概2分钟,然后点击 SD-WebUi
0/小时
文本生成
OpenAI-GPT-OSS-120B/20B
OpenAI-GPT-OSS-120B/20B
2
@敢敢のwings
敢敢のwings认证作者
28
97H
更新时间2025-08-07
OpenAI正式发布了其首个开源大语言模型系列——gpt-oss,这标志着自GPT-2以来OpenAI首次将其核心模型技术开源。gpt-oss系列包含两个主要版本:gpt-oss-20b和gpt-oss-120b,分别针对不同的应用场景和硬件配置进行了优化。
OpenAI正式发布了其首个开源大语言模型系列——gpt-oss,这标志着自GPT-2以来OpenAI首次将其核心模型技术开源。gpt-oss系列包含两个主要版本:gpt-oss-20b和gpt-oss-120b,分别针对不同的应用场景和硬件配置进行了优化。
0/小时
ComfyUIQwen-image
Qwen-Image文字生成图片
Qwen-Image文字生成图片
4
@刘悦的技术博客
刘悦的技术博客认证作者
105
284H
更新时间2025-11-14
支持自启动
Qwen-Image文生图,支持SD-WebUI和Comfyui,10步采样,在图片上精准生成汉字,支持反推提示词
Qwen-Image文生图,支持SD-WebUI和Comfyui,10步采样,在图片上精准生成汉字,支持反推提示词
0/小时
其他视频剪辑
Video subtitle remover
Video subtitle remover
1
@如月风铃
4
7H
更新时间2025-08-06
一个github上的视频硬字幕去除项目
一个github上的视频硬字幕去除项目
0/小时
视频生成数字人
星梦AI
星梦AI
2
@星悦
星悦认证作者
19
76H
更新时间2025-08-05
文生图,图片局部编辑,人物换装,图生视频,多功能文本配音,多功能数字人对口型。
文生图,图片局部编辑,人物换装,图生视频,多功能文本配音,多功能数字人对口型。
0/小时
Hunyuan
混元世界大模型-v1.0
混元世界大模型-v1.0
1
@Ikaros
9
10H
更新时间2025-08-07
HunyuanWorld 1.0 是由腾讯混元团队开发并开源的创新3D世界生成框架,它代表了计算机视觉和图形学领域的一项重大突破。该框架旨在解决现有3D世界生成方法中的局限性,通过融合基于视频的方法的多样性与基于三维几何方法的一致性,提供了一种新的解决方案1。 核心功能上,HunyuanWorld 1.0 提供了以下三大优势: 沉浸式体验:利用全景图像作为360°的世界代理,提供了全方位的沉浸式视觉体验。 工业级兼容性:支持将生成的3D场景导出为标准网格格式,可以无缝集成到现有的3D建模软件和游戏引擎中,如Blender、Unreal Engine和Unity等,增强了模型的实用性和灵活性。 增强交互性:采用解耦式的物体表示方法,实现了对场景中物体的单独编辑和交互,提高了用户的操作自由度和创造力。 在技术实现方面,HunyuanWorld 1.0 利用了先进的语义分层3D网格表征技术和两阶段生成范式,即首先通过一个特制的3D感知变分自编码器(VAE)来理解3D世界,然后使用扩散Transformer(DiT)进行创造性的3D世界构建。这种架构不仅能够从文本描述或图片输入中生成高质量的3D全景图,还能够处理复杂的场景分解与重建任务,从而确保生成世界的连贯性和细节丰富度15。 此外,HunyuanWorld 1.0 的应用场景广泛,涵盖了虚拟现实(VR)、物理仿真、游戏开发以及交互式内容创作等多个领域。其强大的功能和高度的兼容性使得它成为了推动这些行业发展的重要工具,预示着AI驱动的3D内容创作新时代的到来7。 综上所述,HunyuanWorld 1.0 不仅是一个技术上的飞跃,也是一个开启未来无限可能的关键里程碑,为创作者提供了前所未有的能力去探索和创建数字世界。
HunyuanWorld 1.0 是由腾讯混元团队开发并开源的创新3D世界生成框架,它代表了计算机视觉和图形学领域的一项重大突破。该框架旨在解决现有3D世界生成方法中的局限性,通过融合基于视频的方法的多样性与基于三维几何方法的一致性,提供了一种新的解决方案1。 核心功能上,HunyuanWorld 1.0 提供了以下三大优势: 沉浸式体验:利用全景图像作为360°的世界代理,提供了全方位的沉浸式视觉体验。 工业级兼容性:支持将生成的3D场景导出为标准网格格式,可以无缝集成到现有的3D建模软件和游戏引擎中,如Blender、Unreal Engine和Unity等,增强了模型的实用性和灵活性。 增强交互性:采用解耦式的物体表示方法,实现了对场景中物体的单独编辑和交互,提高了用户的操作自由度和创造力。 在技术实现方面,HunyuanWorld 1.0 利用了先进的语义分层3D网格表征技术和两阶段生成范式,即首先通过一个特制的3D感知变分自编码器(VAE)来理解3D世界,然后使用扩散Transformer(DiT)进行创造性的3D世界构建。这种架构不仅能够从文本描述或图片输入中生成高质量的3D全景图,还能够处理复杂的场景分解与重建任务,从而确保生成世界的连贯性和细节丰富度15。 此外,HunyuanWorld 1.0 的应用场景广泛,涵盖了虚拟现实(VR)、物理仿真、游戏开发以及交互式内容创作等多个领域。其强大的功能和高度的兼容性使得它成为了推动这些行业发展的重要工具,预示着AI驱动的3D内容创作新时代的到来7。 综上所述,HunyuanWorld 1.0 不仅是一个技术上的飞跃,也是一个开启未来无限可能的关键里程碑,为创作者提供了前所未有的能力去探索和创建数字世界。
0/小时
语音合成语音克隆
CosyVoice2-0.5B
CosyVoice2-0.5B
5
@科哥AIGC
科哥AIGC认证作者
143
704H
更新时间2025-08-05
支持自启动
CosyVoice阿里云同义实验室开源的AI声音克隆应用
CosyVoice阿里云同义实验室开源的AI声音克隆应用
0/小时
ComfyUIWan视频生成
Wan2.2-14B-图生视频-自定义首尾帧,自定义Lora,6步采样,反推提示词
Wan2.2-14B-图生视频-自定义首尾帧,自定义Lora,6步采样,反推提示词
37
@刘悦的技术博客
刘悦的技术博客认证作者
601
4809H
更新时间2025-11-14
支持自启动
Wan2.2-14B-图生视频-自定义首尾帧,自定义Lora,6步采样,反推提示词,初始化之后,等待服务启动,大概2分钟左右,点击SD-Webui按钮即可,上传首尾帧图片,输入提示词,点击生成即可
Wan2.2-14B-图生视频-自定义首尾帧,自定义Lora,6步采样,反推提示词,初始化之后,等待服务启动,大概2分钟左右,点击SD-Webui按钮即可,上传首尾帧图片,输入提示词,点击生成即可
0/小时
ComfyUI
ComfyUI最简搭建基座镜像[最新纯净版]
ComfyUI最简搭建基座镜像[最新纯净版]
2
@ai来事
ai来事认证作者
5
45H
更新时间2025-08-05
支持自启动
最容易的ComfyUI搭建,最新纯净版基座镜像
最容易的ComfyUI搭建,最新纯净版基座镜像
0.5/小时
语音合成语音克隆
Step-Audio TTS在线语音克隆3B模型 构建By科哥
Step-Audio TTS在线语音克隆3B模型 构建By科哥
3
@科哥AIGC
科哥AIGC认证作者
18
19H
更新时间2025-09-12
支持自启动
Step-Audio TTS在线语音克隆3B模型 构建By科哥
Step-Audio TTS在线语音克隆3B模型 构建By科哥
0/小时
SD
Joy Cation WebUI批量打标工具独立版
Joy Cation WebUI批量打标工具独立版
2
@龙没耳
龙没耳认证作者
24
22H
更新时间2025-08-06
支持自启动
Joy Cation WebUI批量打标工具独立版
Joy Cation WebUI批量打标工具独立版
0/小时
推理框架
thinking-budget-vllm010
thinking-budget-vllm010
2
@不要葱姜蒜
不要葱姜蒜认证作者
2
0H
更新时间2025-08-03
使用vllm实现思考预算
使用vllm实现思考预算
0/小时
语音分离
MSST-更多模型
MSST-更多模型
6
@我就是五字
我就是五字认证作者
220
720H
更新时间2025-09-05
本镜像参考了[原MSST镜像作者大大bilibili@爱过_留过]老师的模型启动方法,添加了常用的分离伴奏、人声、和声、混响、降噪等模型
本镜像参考了[原MSST镜像作者大大bilibili@爱过_留过]老师的模型启动方法,添加了常用的分离伴奏、人声、和声、混响、降噪等模型
0/小时
ComfyUIWan
wan2.2工作流合集
wan2.2工作流合集
43
@匹夫
匹夫认证作者
922
5360H
更新时间2025-08-05
支持自启动
wan2.2-首尾帧、文生图、文生视频、图生视频、kontext、flux-krea
wan2.2-首尾帧、文生图、文生视频、图生视频、kontext、flux-krea
0/小时
ComfyUIWan
Wan2.2-14B-文生视频,自定义Lora,反推提示词,lightx2V加速,6步采样
Wan2.2-14B-文生视频,自定义Lora,反推提示词,lightx2V加速,6步采样
9
@刘悦的技术博客
刘悦的技术博客认证作者
115
234H
更新时间2025-11-14
支持自启动
Wan2.2-14B-文生视频,自定义Lora,反推提示词,lightx2V加速,6步采样,初始化后,等待服务启动,大概2分钟,然后点击 SD-WEBUI 按钮即可
Wan2.2-14B-文生视频,自定义Lora,反推提示词,lightx2V加速,6步采样,初始化后,等待服务启动,大概2分钟,然后点击 SD-WEBUI 按钮即可
0/小时
QwenAI编程
Qwen3-coder-30B-A3B
Qwen3-coder-30B-A3B
3
@苍耳阿猫
苍耳阿猫认证作者
19
36H
更新时间2025-08-05
qwen3-coder-30B-A3B可视化使用
qwen3-coder-30B-A3B可视化使用
0/小时
目标检测
Yolov13
Yolov13
1
@alex
32
746H
更新时间2025-08-01
Yolov13 版本镜像,导入可直接部署运行对应项目。 可直接运行目标检测,分割,分类等视觉任务。
Yolov13 版本镜像,导入可直接部署运行对应项目。 可直接运行目标检测,分割,分类等视觉任务。
0/小时
ComfyUIWan
Wan2.2-14B-Lightx2V加速,6步采样,自动提示词
Wan2.2-14B-Lightx2V加速,6步采样,自动提示词
8
@刘悦的技术博客
刘悦的技术博客认证作者
237
833H
更新时间2025-11-14
支持自启动
Wan2.2-14B-Lightx2V加速,6步采样,自动提示词
Wan2.2-14B-Lightx2V加速,6步采样,自动提示词
0/小时
AI编程
云端VS Code+CodeBuddy IDE AI辅助编程
云端VS Code+CodeBuddy IDE AI辅助编程
1
@龙没耳
龙没耳认证作者
17
105H
更新时间2025-08-05
支持自启动
微软Visual Studio Code+腾讯CodeBuddy AI辅助编程IDE
微软Visual Studio Code+腾讯CodeBuddy AI辅助编程IDE
0/小时
ComfyUIWan
Wan2.2-Diffusers
Wan2.2-Diffusers
3
@十字鱼
十字鱼认证作者
27
146H
更新时间2025-07-30
Wan2.2-I2V-A14B-Diffusers + WebUI
Wan2.2-I2V-A14B-Diffusers + WebUI
0/小时
文本生成GLM
self-llm-GLM-4.5-Air
self-llm-GLM-4.5-Air
1
@不要葱姜蒜
不要葱姜蒜认证作者
2
2H
更新时间2025-07-29
self-llm-GLM-4.5-Air vllm LORA镜像
self-llm-GLM-4.5-Air vllm LORA镜像
0/小时
ComfyUIWan
WAN2.2-ComfyUI 开源SOTA级AI视频生成
WAN2.2-ComfyUI 开源SOTA级AI视频生成
4
@AI-KSK
AI-KSK认证作者
111
1106H
更新时间2025-08-01
开源AI视频模型中的SOTA,WAN 2.2的ComfyUI实现,包含5b、14b全部模型
开源AI视频模型中的SOTA,WAN 2.2的ComfyUI实现,包含5b、14b全部模型
0/小时
数字人
星悦数字人-专业版
星悦数字人-专业版
3
@星悦
星悦认证作者
43
262H
更新时间2025-07-25
星悦数字人专业版,文本转语音,灵活配音,数字人对口型,灵活批量生成数字人。
星悦数字人专业版,文本转语音,灵活配音,数字人对口型,灵活批量生成数字人。
0/小时
语音合成
Higgs_Audio_V2
Higgs_Audio_V2
1
@敢敢のwings
敢敢のwings认证作者
3
7H
更新时间2025-07-24
支持自启动
沐神新作,不得不学
沐神新作,不得不学
0/小时
ComfyUI
ComfyUI童装一键换装
ComfyUI童装一键换装
2
@xiaofang
23
18H
更新时间2025-07-31
支持自启动
0/小时
语音合成
vits-simple-api-v2.0 声音推理api服务
vits-simple-api-v2.0 声音推理api服务
1
@科哥AIGC
科哥AIGC认证作者
29
59H
更新时间2025-09-09
支持自启动
vits-simple-api一个出色的声音API管理应用。
vits-simple-api一个出色的声音API管理应用。
0/小时
语音合成数字人
LatentSync1.5数字人视频制作v1.5.3
LatentSync1.5数字人视频制作v1.5.3
4
@科哥AIGC
科哥AIGC认证作者
131
495H
更新时间2025-07-22
支持自启动
LatentSync1.5是字节跳动2025年3月开源的端到端唇形同步框架,基于潜在扩散模型,仅用6 GB显存即可将任意音频驱动成高分辨率、时序连贯的中文说话视频
LatentSync1.5是字节跳动2025年3月开源的端到端唇形同步框架,基于潜在扩散模型,仅用6 GB显存即可将任意音频驱动成高分辨率、时序连贯的中文说话视频
0/小时
语音合成语音克隆
index-tts
index-tts
6
@十字鱼
十字鱼认证作者
86
249H
更新时间2025-09-09
B站开源工业级可控高效语音克隆
B站开源工业级可控高效语音克隆
0/小时
语音合成语音翻译
Srt-AI-Voice-Assistant+GPT-SoVITS-2506(V2Pro)
Srt-AI-Voice-Assistant+GPT-SoVITS-2506(V2Pro)
3
@数列解析几何一生之敌
数列解析几何一生之敌认证作者
86
2522H
更新时间2025-09-15
支持自启动
Srt-AI-Voice-Assistant配音辅助工具搭配GSV的镜像
Srt-AI-Voice-Assistant配音辅助工具搭配GSV的镜像
0/小时
FluxComfyUILora
ai-tookit-lora-train
ai-tookit-lora-train
3
@有趣的80后程序员
有趣的80后程序员认证作者
172
1537H
更新时间2025-08-11
aitookit lora 训练镜像-包含flux kontext 模型与数据集
aitookit lora 训练镜像-包含flux kontext 模型与数据集
0/小时
文本生成其他
AstrBot
AstrBot
1
@AstrBotDevs
AstrBotDevs认证作者
24
153H
更新时间2025-07-31
AstrBot 是一个支持 QQ、微信、飞书等多消息平台部署、具有易用的插件系统和完善的大语言模型(LLM)接入功能的聊天机器人及开发框架。
AstrBot 是一个支持 QQ、微信、飞书等多消息平台部署、具有易用的插件系统和完善的大语言模型(LLM)接入功能的聊天机器人及开发框架。
0/小时
SD
Forge WebUI大镜像
Forge WebUI大镜像
5
@龙没耳
龙没耳认证作者
81
563H
更新时间2025-07-18
Forge WebUI大镜像
Forge WebUI大镜像
0/小时
语音合成语音克隆
vits-simple-api
vits-simple-api
3
@Artrajz
Artrajz认证作者
17
731H
更新时间2025-09-09
vits-simple-api语音合成推理服务,支持vits、hubert-vits、w2v2-vits、bert-vits2、gpt-sovits
vits-simple-api语音合成推理服务,支持vits、hubert-vits、w2v2-vits、bert-vits2、gpt-sovits
0/小时
ComfyUI数字人
最强图片数字人Multitalk唱歌说话(支持长视频)
最强图片数字人Multitalk唱歌说话(支持长视频)
12
@与AI同行
与AI同行认证作者
342
2044H
更新时间2025-07-31
支持自启动
最强的图片数字人,支持唱歌、说话,效果超强!
最强的图片数字人,支持唱歌、说话,效果超强!
0/小时
语音合成数字人
musetalk1.5音频驱动视频生成数字人汉化webUI版 构建By科哥
musetalk1.5音频驱动视频生成数字人汉化webUI版 构建By科哥
3
@科哥AIGC
科哥AIGC认证作者
62
198H
更新时间2025-09-12
支持自启动
musetalk1.5音频驱动视频生成数字人汉化webUI版 构建By科哥
musetalk1.5音频驱动视频生成数字人汉化webUI版 构建By科哥
0/小时
语音合成语音克隆
index-tts-api-v1.5-ap在线推理服务deepspeed加速版
index-tts-api-v1.5-ap在线推理服务deepspeed加速版
3
@科哥AIGC
科哥AIGC认证作者
39
40H
更新时间2025-09-09
index-tts-api-v1.5 在线推理服务deepspeed加速版封装,支持自行调用API
index-tts-api-v1.5 在线推理服务deepspeed加速版封装,支持自行调用API
0/小时
数字人
MuseTalk
MuseTalk
2
@有黑眼圈的小竹能
140
346H
更新时间2025-07-15
MuseTalk数字人模型,建议选择显存48G及以上的GPU
MuseTalk数字人模型,建议选择显存48G及以上的GPU
0.3/小时
语音识别
ASR大集合-V1.0
ASR大集合-V1.0
2
@Ikaros
32
287H
更新时间2025-07-09
搜集主流的开源ASR项目,提供api接口或webui页面完成ASR工作。 目前内置的项目有:FunASR(SenseVoice、speech_paraformer-large)、FireRedASR、PaddleSpeech
搜集主流的开源ASR项目,提供api接口或webui页面完成ASR工作。 目前内置的项目有:FunASR(SenseVoice、speech_paraformer-large)、FireRedASR、PaddleSpeech
0/小时
语音合成语音克隆
MOSS-TTSD邱锡鹏团队开源最新百万小时训练声音推理模型声音克隆 构建By科哥
MOSS-TTSD邱锡鹏团队开源最新百万小时训练声音推理模型声音克隆 构建By科哥
2
@科哥AIGC
科哥AIGC认证作者
18
2H
更新时间2025-09-12
支持自启动
MOSS-TTSD邱锡鹏团队开源最新百万小时训练声音推理模型声音克隆 构建By科哥
MOSS-TTSD邱锡鹏团队开源最新百万小时训练声音推理模型声音克隆 构建By科哥
0/小时
文本生成其他
LangBot
LangBot
1
@LangBotTeam
LangBotTeam认证作者
5
12H
更新时间2025-07-31
简单易用的大模型即时通信机器人开发平台,支持 QQ 微信 企微 飞书 钉钉 等多种平台,已配置好 Ollama DeepSeek 模型
简单易用的大模型即时通信机器人开发平台,支持 QQ 微信 企微 飞书 钉钉 等多种平台,已配置好 Ollama DeepSeek 模型
0/小时
SDLora
lora-scripts
lora-scripts
4
@Faych
389
479H
更新时间2025-07-11
lora-scripts镜像提供轻量级LoRA训练套件,集成Kohya_ss训练器与WebUI界面,支持一键式模型微调、数据集预处理及参数可视化,简化Stable Diffusion衍生模型的定制流程,开箱即用。
lora-scripts镜像提供轻量级LoRA训练套件,集成Kohya_ss训练器与WebUI界面,支持一键式模型微调、数据集预处理及参数可视化,简化Stable Diffusion衍生模型的定制流程,开箱即用。
0/小时
数字人
Latentsync1.6最新牛哥魔改版本
Latentsync1.6最新牛哥魔改版本
14
@NiuGee
NiuGee认证作者
278
1034H
更新时间2025-07-08
牛哥专属调教版本: 开机即用 默认授权码9259 做了队列限制,多人排队,默认依次执行
牛哥专属调教版本: 开机即用 默认授权码9259 做了队列限制,多人排队,默认依次执行
0/小时
Flux图片生成
Kontext-Nunchaku极速修图(含基础工作流)
Kontext-Nunchaku极速修图(含基础工作流)
3
@ai来事
ai来事认证作者
77
182H
更新时间2025-07-14
支持自启动
Kontext-Nunchaku 是一款结合了 FLUX.1 Kontext 图像编辑模型与 Nunchaku 高性能推理加速引擎的工具。它支持基于文本和图像的精准局部修改,能有效实现无损细节的水印擦除,并可在几乎不损失画质的前提下显著提升推理速度
Kontext-Nunchaku 是一款结合了 FLUX.1 Kontext 图像编辑模型与 Nunchaku 高性能推理加速引擎的工具。它支持基于文本和图像的精准局部修改,能有效实现无损细节的水印擦除,并可在几乎不损失画质的前提下显著提升推理速度
0/小时
FluxComfyUI图片生成
ComfyUI_nunchaku 双节棍极速搓图
ComfyUI_nunchaku 双节棍极速搓图
1
@ai来事
ai来事认证作者
47
86H
更新时间2025-07-08
支持自启动
comfyui+nunchaku极速出图、改图!
comfyui+nunchaku极速出图、改图!
0/小时
Flux图片生成
Flux-kontext & Nunchaku急速高清修复工作流
Flux-kontext & Nunchaku急速高清修复工作流
5
@匹夫
匹夫认证作者
336
2141H
更新时间2025-07-07
Flux-kontext & Nunchaku急速高清修复工作流
Flux-kontext & Nunchaku急速高清修复工作流
0/小时
FluxComfyUI图片生成
Kontext-ComfyUI-多种玩法合集
Kontext-ComfyUI-多种玩法合集
2
@AI-KSK
AI-KSK认证作者
58
67H
更新时间2025-07-29
开源的SOTA级图像编辑模型的多种应用
开源的SOTA级图像编辑模型的多种应用
0/小时
FluxComfyUI图片生成
comfyui_Kontext_Dev
comfyui_Kontext_Dev
3
@ai来事
ai来事认证作者
51
443H
更新时间2025-07-03
最强大的图片编辑模型,支持基础修改、风格转换、角色一致性、文本编辑
最强大的图片编辑模型,支持基础修改、风格转换、角色一致性、文本编辑
0/小时
Flux图片生成
FLUX.1-Kontext-dev
FLUX.1-Kontext-dev
3
@十字鱼
十字鱼认证作者
132
268H
更新时间2025-07-14
FLUX.1-Kontext-dev是Black Forest Labs开源的120亿参数图像编辑模型,基于文本指令修改图片,支持角色、风格、物体引用,无需微调即可多步编辑,训练效率高
FLUX.1-Kontext-dev是Black Forest Labs开源的120亿参数图像编辑模型,基于文本指令修改图片,支持角色、风格、物体引用,无需微调即可多步编辑,训练效率高
0/小时
语音合成
voice-changer
voice-changer
1
@skl
skl认证作者
167
847H
更新时间2025-07-14
Voice-Changer(VCClient)是 w-okada 开源的跨平台实时 AI 变声器,内置 RVC、Beatrice v2、MMVC、DDSP-SVC 等主流模型
Voice-Changer(VCClient)是 w-okada 开源的跨平台实时 AI 变声器,内置 RVC、Beatrice v2、MMVC、DDSP-SVC 等主流模型
0/小时
语音合成语音克隆数字人
multitalk数字人-indextts语音克隆工作流
multitalk数字人-indextts语音克隆工作流
9
@匹夫
匹夫认证作者
284
847H
更新时间2025-09-09
镜像集成了multitalk数字人工作流与indextts语音克隆工作流
镜像集成了multitalk数字人工作流与indextts语音克隆工作流
0/小时
语音合成语音克隆
index-tts在线api声音克隆快速声音生成api服务用于听小说语音直播等
index-tts在线api声音克隆快速声音生成api服务用于听小说语音直播等
0
@科哥AIGC
科哥AIGC认证作者
98
611H
更新时间2025-09-09
index-tts在线api声音克隆快速声音生成api服务用于听小说语音直播等
index-tts在线api声音克隆快速声音生成api服务用于听小说语音直播等
0/小时
Flux视频生成
6-20更新-大凯智障君VACE/FusionX专属AI视频镜像
6-20更新-大凯智障君VACE/FusionX专属AI视频镜像
2
@大凯智障君
大凯智障君认证作者
110
500H
更新时间2025-07-07
6-23更新v2.7-大凯智障君-VACE / FusionX 专属AI视频镜像本镜像中包括了:最新的面部追踪流程、 Flux文生图+高清放大工作流 VACE / FusionX 文生视频、图生视频、视频生视频、首帧+尾帧视频comfyUI工作流。 如果你需要学习AIGC相关课程,可以前往哔哩哔哩(免费课程): https://space.bilibili.com/499577088
6-23更新v2.7-大凯智障君-VACE / FusionX 专属AI视频镜像本镜像中包括了:最新的面部追踪流程、 Flux文生图+高清放大工作流 VACE / FusionX 文生视频、图生视频、视频生视频、首帧+尾帧视频comfyUI工作流。 如果你需要学习AIGC相关课程,可以前往哔哩哔哩(免费课程): https://space.bilibili.com/499577088
0/小时
Hunyuan
Hunyuan3D-2.1
Hunyuan3D-2.1
1
@苍耳阿猫
苍耳阿猫认证作者
30
211H
更新时间2025-07-14
Hunyuan3D-2.1是腾讯开源的3D生成大模型,支持文本、图片、草图输入,生成高精度PBR材质与几何模型,加速游戏、影视、工业设计等领域3D资产创建,推动3D生成技术发展
Hunyuan3D-2.1是腾讯开源的3D生成大模型,支持文本、图片、草图输入,生成高精度PBR材质与几何模型,加速游戏、影视、工业设计等领域3D资产创建,推动3D生成技术发展
0/小时
三维重建
PartPacker
PartPacker
1
@十字鱼
十字鱼认证作者
30
58H
更新时间2025-07-14
单图生成零件级3D模型-PartPacker是 NVIDIA 开源的单视图零件级 3D 对象生成框架,通过“双体素打包”将整体与部件隐式编码解耦
单图生成零件级3D模型-PartPacker是 NVIDIA 开源的单视图零件级 3D 对象生成框架,通过“双体素打包”将整体与部件隐式编码解耦
0/小时
AI编程其他
n8n
n8n
2
@敢敢のwings
敢敢のwings认证作者
12
54H
更新时间2025-07-10
n8n 是一个工作流自动化平台,为技术团队提供代码的灵活性和无代码的速度。拥有 400+ 集成、原生 AI 功能和公平代码许可证,n8n 让您构建强大的自动化,同时保持对数据和部署的完全控制。
n8n 是一个工作流自动化平台,为技术团队提供代码的灵活性和无代码的速度。拥有 400+ 集成、原生 AI 功能和公平代码许可证,n8n 让您构建强大的自动化,同时保持对数据和部署的完全控制。
0/小时
Flux视频生成
大凯智障君-VACE / FusionX 专属AI视频镜像
大凯智障君-VACE / FusionX 专属AI视频镜像
1
@大凯智障君
大凯智障君认证作者
82
442H
更新时间2025-07-03
大凯智障君-VACE / FusionX 专属AI视频镜像:包含Flux文生图高清放大、VACE模型视频创作流程、FusionX模型的图生视频、文生视频、视频转视频等最新的comfyUI工作流,我会定期更新本教学镜像,欢迎大家学习和测试使用。
大凯智障君-VACE / FusionX 专属AI视频镜像:包含Flux文生图高清放大、VACE模型视频创作流程、FusionX模型的图生视频、文生视频、视频转视频等最新的comfyUI工作流,我会定期更新本教学镜像,欢迎大家学习和测试使用。
0/小时
音乐
SongGeneration
SongGeneration
0
@Smzh
Smzh认证作者
13
42H
更新时间2025-07-07
tencent-ailab旗下的SongGeneration项目,目前只有base模型
tencent-ailab旗下的SongGeneration项目,目前只有base模型
0/小时
语音合成语音克隆
Voila-语音语言模型
Voila-语音语言模型
0
@敢敢のwings
敢敢のwings认证作者
15
4H
更新时间2025-09-09
Voila是一个超越人类反应速度的开源语音大模型,专为实时情感对话而设计。作采用端到端架构,实现了195ms超快响应,支持百万音色和10秒声音克隆,是构建有温度AI语音交互系统的理想选择。
Voila是一个超越人类反应速度的开源语音大模型,专为实时情感对话而设计。作采用端到端架构,实现了195ms超快响应,支持百万音色和10秒声音克隆,是构建有温度AI语音交互系统的理想选择。
0/小时
推理框架其他
Langchain-Chatchat
Langchain-Chatchat
0
@BhAem
10
106H
更新时间2025-07-14
Langchain-Chatchat 是一种利用 langchain 思想实现的基于本地知识库的问答应用,目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案
Langchain-Chatchat 是一种利用 langchain 思想实现的基于本地知识库的问答应用,目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案
0/小时</