优云智算
控制台
立即注册
镜像社区
我的收藏

优云智算镜像社区 - 海量AI模型一键部署

快捷筛选

官方镜像免费镜像支持自启动

AIGC热门

数字人视频超分OCR识别AI漫剧AI音乐AI电商AI应用

图像/视频生成

ComfyUIWanZ-ImageQwen-ImageLTXInfiniteTalkLongCatFlux混元Lora训练SD3D生成图片生成图片编辑视频生成视频编辑

语音/TTS生成

IndexTTSQwen3-TTSCosyVoiceSVC语音合成语音分离语音识别

LLM

DeepSeekQwenGLM推理框架行业模型文本模型ChatBot

计算机视觉

VL视觉理解目标检测图像分割三维重建具身智能

科学计算

分子动力生物信息物理模拟数据分析

其他

其他
默认排序
视频生成
RecommendCount
LTX-2.3视频生成合集!支持文生视频、图生视频、数字人视频等
LTX-2.3视频生成合集!支持文生视频、图生视频、数字人视频等
86
@与AI同行
与AI同行认证作者
1134
2004H
更新时间2026-03-31
支持自启动
开源版Sora2发布,LTX-2.3整合包合集,支持文生视频、图生视频、数字人!支持20s视频、1080P视频直出、批量队列生成、高清放大!
开源版Sora2发布,LTX-2.3整合包合集,支持文生视频、图生视频、数字人!支持20s视频、1080P视频直出、批量队列生成、高清放大!
0/小时
数字人
RecommendCount
LiveTalking
LiveTalking
93
@lipku
lipku认证作者
3666
63572H
更新时间2026-04-01
LiveTalking镜像提供实时交互数字人解决方案,支持ERNerf、MuseTalk、Wav2Lip,实现单张人脸照片驱动的超低延迟(<100ms)唇形同步、表情及头部运动控制。
LiveTalking镜像提供实时交互数字人解决方案,支持ERNerf、MuseTalk、Wav2Lip,实现单张人脸照片驱动的超低延迟(<100ms)唇形同步、表情及头部运动控制。
0/小时
数字人
RecommendCount
最强AI数字人InfiniteTalk-图片和视频数字人
最强AI数字人InfiniteTalk-图片和视频数字人
489
@与AI同行
与AI同行认证作者
10091
73448H
更新时间2026-03-31
支持自启动
支持图片数字人、视频数字人、双人数字人,支持说话+唱歌对口型、长视频、完整歌曲生成、批量生成、高清放大!
支持图片数字人、视频数字人、双人数字人,支持说话+唱歌对口型、长视频、完整歌曲生成、批量生成、高清放大!
0/小时
语音合成语音克隆
RecommendCount
SVC-Fusion
SVC-Fusion
94
@aiguoliuguo
aiguoliuguo认证作者
5450
31562H
更新时间2026-02-27
本整合包将整合So-Vits-SVC4.1、DDSP-SVC-6.3/6.1/6.0、ReFlow-VAE-SVC多种SVC模型训练及推理
本整合包将整合So-Vits-SVC4.1、DDSP-SVC-6.3/6.1/6.0、ReFlow-VAE-SVC多种SVC模型训练及推理
0/小时
语音合成
最强AI音色克隆,OmniVoice合集,音色克隆 | 语气控制 | 音色保存 | 多音字 | 批量生成
最强AI音色克隆,OmniVoice合集,音色克隆 | 语气控制 | 音色保存 | 多音字 | 批量生成
1
@与AI同行
与AI同行认证作者
28
12H
更新时间2026-04-10
支持自启动
最强AI音色克隆,OmniVoice合集,音色克隆 | 语气控制 | 音色保存 | 多音字 | 批量生成
最强AI音色克隆,OmniVoice合集,音色克隆 | 语气控制 | 音色保存 | 多音字 | 批量生成
0/小时
AI漫剧
AutoAnimation短剧漫剧自动化工具
AutoAnimation短剧漫剧自动化工具
38
@IAI666
221
1003H
更新时间2026-04-10
AutoAnimation短剧漫剧自动化工具及配套ComfyUI包含ZImage、flux2-kelin、qwenedit2511、wan2.2、qwen-tts、index-tts
AutoAnimation短剧漫剧自动化工具及配套ComfyUI包含ZImage、flux2-kelin、qwenedit2511、wan2.2、qwen-tts、index-tts
0.15/小时
语音合成IndexTTS语音识别
LongCat-AudioDiT 剧本创作台
LongCat-AudioDiT 剧本创作台
0
@K哥讲AI
2
0H
更新时间2026-04-10
支持自启动
LongCat-AudioDiT WebUI 是基于该模型的可视化工具,支持音色库管理、剧本队列编排、长文本切分及音频生成,模块化设计配中文注释,本地部署开源免费,小白可轻松实现高质量语音克隆。
LongCat-AudioDiT WebUI 是基于该模型的可视化工具,支持音色库管理、剧本队列编排、长文本切分及音频生成,模块化设计配中文注释,本地部署开源免费,小白可轻松实现高质量语音克隆。
0/小时
ComfyUILTXLora训练
ltx2.3-aitookit
ltx2.3-aitookit
0
@有趣的80后程序员
有趣的80后程序员认证作者
0
0H
更新时间2026-04-10
支持自启动
ltx2.3 aitookit Lora训练镜像
ltx2.3 aitookit Lora训练镜像
0/小时
文本模型
谷歌最新本地模型gemma4最强智能助理hermes agent一个本地免token的智能助理模型全部离线
谷歌最新本地模型gemma4最强智能助理hermes agent一个本地免token的智能助理模型全部离线
1
@科哥AIGC
科哥AIGC认证作者
9
18H
更新时间2026-04-10
支持自启动
谷歌最新本地模型gemma4最强智能助理hermes agent一个本地免token的智能助理模型全部离线
谷歌最新本地模型gemma4最强智能助理hermes agent一个本地免token的智能助理模型全部离线
0/小时
IndexTTS语音合成AI应用
indextts-v1.52支持api调用deepspeed推理加速,并发请求,为AI直播优化的版本
indextts-v1.52支持api调用deepspeed推理加速,并发请求,为AI直播优化的版本
0
@屾哥日记
1
0H
更新时间2026-04-10
支持自启动
indextts-v1.52支持api调用deepspeed推理加速,并发请求,为AI直播优化的版本
indextts-v1.52支持api调用deepspeed推理加速,并发请求,为AI直播优化的版本
0/小时
物理模拟分子动力
Gromacs系列
Gromacs系列
15
@苍耳阿猫
苍耳阿猫认证作者
378
10420H
更新时间2026-04-09
该镜像集成开源高性能分子动力学模拟软件,通过强化多精度算法与GPU并行加速(支持NVIDIA/AMD显卡)实现纳秒级生物大分子运动模拟,优化AI辅助建模与超大体系计算效率,提供跨平台开箱即用解决方案
该镜像集成开源高性能分子动力学模拟软件,通过强化多精度算法与GPU并行加速(支持NVIDIA/AMD显卡)实现纳秒级生物大分子运动模拟,优化AI辅助建模与超大体系计算效率,提供跨平台开箱即用解决方案
0/小时
GLMOCR识别
GLM-OCR
GLM-OCR
0
@苍耳阿猫
苍耳阿猫认证作者
0
0H
更新时间2026-04-09
GLM-OCR
GLM-OCR
0/小时
语音合成Qwen3-TTSAI电商
【VoxCPM2/Qwen3TTS/IndexTTS2/OmniVoice】N合一AI语音整合TTS ALL in ONE
【VoxCPM2/Qwen3TTS/IndexTTS2/OmniVoice】N合一AI语音整合TTS ALL in ONE
49
@淼淼爸的ai笔记
554
2670H
更新时间2026-04-09
支持自启动
本镜像专为AI语音直播项目打造,也可以直接在线推理webui使用,集成VoxCPM2/IndexTTS-2等, 支持API调用,直播带货,tiktok直播,在线克隆,语气语调自然,音色还原度高
本镜像专为AI语音直播项目打造,也可以直接在线推理webui使用,集成VoxCPM2/IndexTTS-2等, 支持API调用,直播带货,tiktok直播,在线克隆,语气语调自然,音色还原度高
0/小时
语音合成语音识别
VOXCPM2语音合成,TTS,多音字控制,接口API调用,语速调节,支持50系,支持老显卡,音色保存,方言控制,开源阅读,支持超长文本
VOXCPM2语音合成,TTS,多音字控制,接口API调用,语速调节,支持50系,支持老显卡,音色保存,方言控制,开源阅读,支持超长文本
2
@刘悦的技术博客
刘悦的技术博客认证作者
20
3H
更新时间2026-04-08
支持自启动
VOXCPM2语音合成,TTS,多音字控制,接口API调用,语速调节,支持50系,支持老显卡,音色保存,方言控制,开源阅读,支持超长文本
VOXCPM2语音合成,TTS,多音字控制,接口API调用,语速调节,支持50系,支持老显卡,音色保存,方言控制,开源阅读,支持超长文本
0/小时
AI音乐
AI音乐制作ACE-Step-1.5XL官方包
AI音乐制作ACE-Step-1.5XL官方包
2
@鹄仙
鹄仙认证作者
11
31H
更新时间2026-04-08
专业级别的AI音乐制作项目升级XL
专业级别的AI音乐制作项目升级XL
0/小时
文本模型推理框架
Gemma-4 + GPT-OSS-120B 双破限大模型 WebUI 开箱即用镜像
Gemma-4 + GPT-OSS-120B 双破限大模型 WebUI 开箱即用镜像
8
@AI-KSK
AI-KSK认证作者
16
19H
更新时间2026-04-09
支持自启动
基于 Ollama + Open WebUI 搭建的双破限大模型共享镜像,集成 Gemma-4 与 GPT-OSS-120B 两类核心模型,支持浏览器直接访问与可视化聊天。
基于 Ollama + Open WebUI 搭建的双破限大模型共享镜像,集成 Gemma-4 与 GPT-OSS-120B 两类核心模型,支持浏览器直接访问与可视化聊天。
0/小时
图片生成视频生成AI漫剧
Huobao-Drama
Huobao-Drama
14
@huobao-ai
huobao-ai认证作者
13
32H
更新时间2026-04-08
支持自启动
Huobao Drama 是一个基于 AI 的短剧自动化生产平台,实现从剧本生成、角色设计、分镜制作到视频合成的全流程自动化
Huobao Drama 是一个基于 AI 的短剧自动化生产平台,实现从剧本生成、角色设计、分镜制作到视频合成的全流程自动化
0/小时
数字人LTXComfyUI
LTX-2.3-VBVR-图片数字人,真正无限时长,分片推理,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
LTX-2.3-VBVR-图片数字人,真正无限时长,分片推理,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
7
@刘悦的技术博客
刘悦的技术博客认证作者
30
13H
更新时间2026-04-07
支持自启动
LTX-2.3-VBVR-图片数字人,真正无限时长,分片推理,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
LTX-2.3-VBVR-图片数字人,真正无限时长,分片推理,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
0/小时
视频生成LTX
LTX-2.3-VBVR-文生视频-首尾帧,单图无限时长,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
LTX-2.3-VBVR-文生视频-首尾帧,单图无限时长,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
5
@刘悦的技术博客
刘悦的技术博客认证作者
45
53H
更新时间2026-04-07
支持自启动
LTX-2.3-VBVR-文生视频-首尾帧,单图无限时长,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
LTX-2.3-VBVR-文生视频-首尾帧,单图无限时长,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
0/小时
语音合成语音识别
OmniVoice,接口api使用,支持600种语言,4G显存可用,速度1比0.3,文本指令,支持呻吟笑声,文字转语音,支持超长文本,声音克隆,小米k2-fsa团队开源
OmniVoice,接口api使用,支持600种语言,4G显存可用,速度1比0.3,文本指令,支持呻吟笑声,文字转语音,支持超长文本,声音克隆,小米k2-fsa团队开源
6
@刘悦的技术博客
刘悦的技术博客认证作者
57
92H
更新时间2026-04-05
支持自启动
OmniVoice,接口api使用,支持600种语言,4G显存可用,速度1比0.3,文本指令,支持呻吟笑声,文字转语音,支持超长文本,声音克隆,小米k2-fsa团队开源
OmniVoice,接口api使用,支持600种语言,4G显存可用,速度1比0.3,文本指令,支持呻吟笑声,文字转语音,支持超长文本,声音克隆,小米k2-fsa团队开源
0/小时
语音合成语音识别
LongCat-AudioDiT-1B-3.5B,TTS,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,文字转语音,TTS
LongCat-AudioDiT-1B-3.5B,TTS,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,文字转语音,TTS
2
@刘悦的技术博客
刘悦的技术博客认证作者
11
19H
更新时间2026-04-05
支持自启动
LongCat-AudioDiT-1B-3.5B,6G显存可用,TTS,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,文字转语音,TTS
LongCat-AudioDiT-1B-3.5B,6G显存可用,TTS,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,文字转语音,TTS
0/小时
语音合成
ComfyUI-OmniVoice-TTS小米团队开源单人多人声音克隆语音克隆捏声音
ComfyUI-OmniVoice-TTS小米团队开源单人多人声音克隆语音克隆捏声音
1
@科哥AIGC
科哥AIGC认证作者
10
6H
更新时间2026-04-05
支持自启动
ComfyUI-OmniVoice-TTS小米团队开源单人多人声音克隆语音克隆捏声音
ComfyUI-OmniVoice-TTS小米团队开源单人多人声音克隆语音克隆捏声音
0/小时
其他
trading-agents针对国内股票的股票交易Agent
trading-agents针对国内股票的股票交易Agent
1
@科哥AIGC
科哥AIGC认证作者
3
24H
更新时间2026-04-05
支持自启动
trading-agents针对国内股票的股票交易Agent
trading-agents针对国内股票的股票交易Agent
0/小时
视频生成
最强AI视频抠像,MatAnyone2,超强抠像效果,支持超长视频!
最强AI视频抠像,MatAnyone2,超强抠像效果,支持超长视频!
1
@与AI同行
与AI同行认证作者
15
14H
更新时间2026-04-06
支持自启动
最强AI视频抠像,MatAnyone2,超强抠像效果,支持超长视频!
最强AI视频抠像,MatAnyone2,超强抠像效果,支持超长视频!
0/小时
Lora训练
ai-toolkit全能Lora模型训练王
ai-toolkit全能Lora模型训练王
1
@老徐Ai研习社
老徐Ai研习社认证作者
39
362H
更新时间2026-04-09
支持自启动
主流模型都有
主流模型都有
0/小时
ComfyUI视频生成视频编辑
wan2.2动作迁移
wan2.2动作迁移
5
@
62
9H
更新时间2026-04-02
wan2.2动作迁移
wan2.2动作迁移
0/小时
ComfyUIQwen-Image图片编辑
Qwen-Edit-2511-Rapid-V23,图像编辑,表情控制,多图编辑,自动提示词,批量任务,支持50系
Qwen-Edit-2511-Rapid-V23,图像编辑,表情控制,多图编辑,自动提示词,批量任务,支持50系
9
@刘悦的技术博客
刘悦的技术博客认证作者
81
279H
更新时间2026-04-01
支持自启动
Qwen-Edit-2511-Rapid-V23,图像编辑,表情控制,多图编辑,自动提示词,批量任务,支持50系
Qwen-Edit-2511-Rapid-V23,图像编辑,表情控制,多图编辑,自动提示词,批量任务,支持50系
0/小时
Qwen-imageWanLora训练
AiToolKit汉化版
AiToolKit汉化版
85
@Doc_workBox
Doc_workBox认证作者
1305
13300H
更新时间2026-04-01
支持自启动
Aitoolkit汉化版,自适应UI方便手机端查看训练进度
Aitoolkit汉化版,自适应UI方便手机端查看训练进度
0/小时
AI应用图片编辑图像分割
Live2d神器一键拆分See-through
Live2d神器一键拆分See-through
21
@梦影Erislia
269
565H
更新时间2026-03-31
Live2d神器一键拆分See-through
Live2d神器一键拆分See-through
0/小时
语音合成
MOSS-TTS 语音模型
MOSS-TTS 语音模型
5
@刘悦的技术博客
刘悦的技术博客认证作者
30
46H
更新时间2026-03-31
支持自启动
MOSS-TTS,接口API,语音合成,声音克隆,TTS,支持超长文本,支持50系
MOSS-TTS,接口API,语音合成,声音克隆,TTS,支持超长文本,支持50系
0/小时
ComfyUILTX视频生成
LTX-2.3-Transition-文生视频
LTX-2.3-Transition-文生视频
6
@刘悦的技术博客
刘悦的技术博客认证作者
86
95H
更新时间2026-03-30
支持自启动
LTX-2.3-Transition-文生视频-首尾帧,无限时长,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
LTX-2.3-Transition-文生视频-首尾帧,无限时长,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
0/小时
ComfyUIWan视频生成
Wan 2.2 无限制 3.0
Wan 2.2 无限制 3.0
16
@AI-KSK
AI-KSK认证作者
100
125H
更新时间2026-04-09
集成 SmoothMix T2V 3.0 与 Remix I2V 3.0,支持无限制文本生视频与图生视频创作,兼顾画质、动态、运镜与一致性,适合快速出片与高完成度表达。
集成 SmoothMix T2V 3.0 与 Remix I2V 3.0,支持无限制文本生视频与图生视频创作,兼顾画质、动态、运镜与一致性,适合快速出片与高完成度表达。
0/小时
视频生成
X-Dub-WebUI
X-Dub-WebUI
1
@科哥AIGC
科哥AIGC认证作者
3
2H
更新时间2026-03-30
支持自启动
X-Dub-WebUI可灵团队推出的视频驱动唇形生成与任意尺寸视频数字人视频生成 二次开发webui构建By科哥
X-Dub-WebUI可灵团队推出的视频驱动唇形生成与任意尺寸视频数字人视频生成 二次开发webui构建By科哥
0/小时
LTX视频生成数字人
LTX-2.3-Transition--图片数字人
LTX-2.3-Transition--图片数字人
6
@刘悦的技术博客
刘悦的技术博客认证作者
54
70H
更新时间2026-03-30
支持自启动
LTX-2.3-Transition--图片数字人,更好的稳定性,无限时长,支持50系,自定义分辨率
LTX-2.3-Transition--图片数字人,更好的稳定性,无限时长,支持50系,自定义分辨率
0/小时
图片生成图片编辑
最强AI图片编辑,FireRed-Edit整合包合集,商用顶级图片效果!
最强AI图片编辑,FireRed-Edit整合包合集,商用顶级图片效果!
14
@与AI同行
与AI同行认证作者
95
118H
更新时间2026-03-31
支持自启动
最强AI图片编辑,FireRed-Edit整合包合集,商用顶级图片效果!支持多图编辑、局部涂抹编辑、高清放大,解压即用,一键启动!
最强AI图片编辑,FireRed-Edit整合包合集,商用顶级图片效果!支持多图编辑、局部涂抹编辑、高清放大,解压即用,一键启动!
0/小时
ComfyUI视频编辑视频生成
陈晨的comfyui云端镜像系列
陈晨的comfyui云端镜像系列
5
@陈晨
44
89H
更新时间2026-03-30
支持自启动
内置多个工作流 开箱即用
内置多个工作流 开箱即用
0/小时
数字人ComfyUI视频生成
图片·声音·视频·2603comfyui全能整合包
图片·声音·视频·2603comfyui全能整合包
13
@老徐Ai研习社
老徐Ai研习社认证作者
175
492H
更新时间2026-03-26
支持自启动
图片·声音·视频·2603comfyui全能整合包
图片·声音·视频·2603comfyui全能整合包
0/小时
ComfyUILTX视频生成
LTX-2.3 LoRA训练 +AIToolkit 4090/48G/5090 一键开训
LTX-2.3 LoRA训练 +AIToolkit 4090/48G/5090 一键开训
0
@AI-KSK
AI-KSK认证作者
21
112H
更新时间2026-03-28
集成AIToolkit与LTX-2 LoRA训练全套环境,适配4090 48G/5090预设参数,支持一键启动、缓存优化、依赖预装,开箱即可进行音视频LoRA训练
集成AIToolkit与LTX-2 LoRA训练全套环境,适配4090 48G/5090预设参数,支持一键启动、缓存优化、依赖预装,开箱即可进行音视频LoRA训练
0/小时
数字人ComfyUIFlux
LTX2.3 创作增强旗舰版
LTX2.3 创作增强旗舰版
9
@AI-KSK
AI-KSK认证作者
68
105H
更新时间2026-03-26
基于LTX2.3深度整合的全功能创作镜像,集成ID-LoRA、换头、局部重绘、多图首尾帧等特色能力,环境完整、依赖丰富,适合视频生成、角色一致性控制与多场景创作。
基于LTX2.3深度整合的全功能创作镜像,集成ID-LoRA、换头、局部重绘、多图首尾帧等特色能力,环境完整、依赖丰富,适合视频生成、角色一致性控制与多场景创作。
0/小时
LTXLora训练视频生成
LTX2.3Lora训练用AI-toolkit,简单配置一键训练
LTX2.3Lora训练用AI-toolkit,简单配置一键训练
3
@梦影Erislia
42
486H
更新时间2026-03-25
LTX2.3Lora训练用AI-toolkit,简单配置一键训练
LTX2.3Lora训练用AI-toolkit,简单配置一键训练
0/小时
其他
那颗星星自制香蕉pro和sora2工作流
那颗星星自制香蕉pro和sora2工作流
29
@那颗星星
259
2512H
更新时间2026-03-25
支持自启动
内含我所有自制的comfyui节点和工作流
内含我所有自制的comfyui节点和工作流
0/小时
ComfyUIWan视频生成
Wan2.2-ReMixV3.0
Wan2.2-ReMixV3.0
16
@刘悦的技术博客
刘悦的技术博客认证作者
207
357H
更新时间2026-03-30
支持自启动
Wan2.2-ReMixV3.0-SVI2-VBVR,文生视频,图生视频,无限时长,首尾帧,自动补帧,自适应端口号,支持50系,支持批量任务
Wan2.2-ReMixV3.0-SVI2-VBVR,文生视频,图生视频,无限时长,首尾帧,自动补帧,自适应端口号,支持50系,支持批量任务
0/小时
其他
sora2文生视频、图生视频工作流
sora2文生视频、图生视频工作流
63
@科哥AIGC
科哥AIGC认证作者
710
4119H
更新时间2026-03-25
支持自启动
sora2,veo3,grok3视频谷歌香蕉2工作流comfyui支持无卡省钱模式
sora2,veo3,grok3视频谷歌香蕉2工作流comfyui支持无卡省钱模式
0/小时
ComfyUILTX图片编辑
Comfy打开即用LTX2.3Dasiwa视频生成qwen图像编辑
Comfy打开即用LTX2.3Dasiwa视频生成qwen图像编辑
4
@梦影Erislia
41
209H
更新时间2026-03-24
Comfy打开即用LTX2.3Dasiwa视频生成qwen图像编辑
Comfy打开即用LTX2.3Dasiwa视频生成qwen图像编辑
0/小时
数据分析其他
MiroFish一个ai预测系统数据模型预测ai系统 构建by科哥
MiroFish一个ai预测系统数据模型预测ai系统 构建by科哥
3
@科哥AIGC
科哥AIGC认证作者
14
31H
更新时间2026-03-21
支持自启动
MiroFish一个ai预测系统数据模型预测ai系统 构建by科哥
MiroFish一个ai预测系统数据模型预测ai系统 构建by科哥
0/小时
ComfyUI视频编辑Wan
Animate动作迁移
Animate动作迁移
11
@小猪AI-闲鱼
123
182H
更新时间2026-03-23
支持自启动
完美复刻视频主体动作
完美复刻视频主体动作
0/小时
AI应用视频编辑图片编辑
MatAnyone2
MatAnyone2
3
@刘悦的技术博客
刘悦的技术博客认证作者
32
51H
更新时间2026-03-23
支持自启动
MatAnyone2,视频图片一键去背,换背景,智能提取前景主体,支持GPU和纯CPU推理,绿幕生成器
MatAnyone2,视频图片一键去背,换背景,智能提取前景主体,支持GPU和纯CPU推理,绿幕生成器
0/小时
语音合成SVC
SVC-WebUI
SVC-WebUI
49
@乔大峰
乔大峰认证作者
1105
12701H
更新时间2026-03-20
一键训练SVC模型,支持上传压缩干声文件,训练完成发送提醒,一键清空训练环境,追求的就是高效率
一键训练SVC模型,支持上传压缩干声文件,训练完成发送提醒,一键清空训练环境,追求的就是高效率
0/小时
AI音乐
SoulX-Singer-SVC
SoulX-Singer-SVC
3
@鹄仙
鹄仙认证作者
38
62H
更新时间2026-03-20
一键翻唱神器
一键翻唱神器
0/小时
IndexTTS语音合成
indexttsV1.5支持api调用-专门适配AI直播助手内置音色
indexttsV1.5支持api调用-专门适配AI直播助手内置音色
4
@屾哥日记
33
55H
更新时间2026-03-19
支持自启动
indexttsV1.5支持api调用,deepspeed推理加速,专门适配AI直播助手
indexttsV1.5支持api调用,deepspeed推理加速,专门适配AI直播助手
0/小时
FluxComfyUI图片生成
Flux.2-Klein-9B-GGUF
Flux.2-Klein-9B-GGUF
61
@刘悦的技术博客
刘悦的技术博客认证作者
658
1373H
更新时间2026-03-23
支持自启动
Flux.2-Klein-9B-GGUF,局部重绘,文生图,图像编辑,多图编辑,自动提示词,批量任务,支持最新50系和计算卡
Flux.2-Klein-9B-GGUF,局部重绘,文生图,图像编辑,多图编辑,自动提示词,批量任务,支持最新50系和计算卡
0/小时
Lora训练LTX其他
LTX2.3Lora训练支持Musubi-tuner
LTX2.3Lora训练支持Musubi-tuner
3
@梦影Erislia
48
205H
更新时间2026-03-18
LTX2.3Lora训练支持Musubi-tuner
LTX2.3Lora训练支持Musubi-tuner
0/小时
Qwen3-TTS语音合成语音识别
Faster-Qwen3-TTS
Faster-Qwen3-TTS
10
@刘悦的技术博客
刘悦的技术博客认证作者
69
294H
更新时间2026-03-18
支持自启动
Faster-Qwen3-TTS,流式接口API,实时推理,速度1比0.5,多人对话,智能多音字,4G显存可用,批量任务,支持超长文本,支持50系显卡,支持老显卡
Faster-Qwen3-TTS,流式接口API,实时推理,速度1比0.5,多人对话,智能多音字,4G显存可用,批量任务,支持超长文本,支持50系显卡,支持老显卡
0/小时
语音合成
Fish-Speech-S2-Pro-4B
Fish-Speech-S2-Pro-4B
4
@刘悦的技术博客
刘悦的技术博客认证作者
57
148H
更新时间2026-03-18
支持自启动
Fish-Speech-S2-Pro-4B,接口api使用,支持62种语言,文本指令,文字转语音,声音克隆,zero-shot
Fish-Speech-S2-Pro-4B,接口api使用,支持62种语言,文本指令,文字转语音,声音克隆,zero-shot
0/小时
AI音乐
SongGeneration音乐生成
SongGeneration音乐生成
5
@鹄仙
鹄仙认证作者
17
13H
更新时间2026-03-20
音乐生成工具,应用简单
音乐生成工具,应用简单
0/小时
ComfyUIZ-Image图片生成
Z-Image Turbo 无限制生成控制放大一体化镜像
Z-Image Turbo 无限制生成控制放大一体化镜像
14
@AI-KSK
AI-KSK认证作者
173
360H
更新时间2026-03-13
集成文生图、图生图、ControlNet 控制、提示词优化、放大增强等全员破限工作流。
集成文生图、图生图、ControlNet 控制、提示词优化、放大增强等全员破限工作流。
0/小时
ComfyUIWan视频超分
视频批量补帧、超分放大与细节修复,ComfyUI视频增强镜像,Seedance2.0黄金搭档
视频批量补帧、超分放大与细节修复,ComfyUI视频增强镜像,Seedance2.0黄金搭档
18
@AI-KSK
AI-KSK认证作者
100
315H
更新时间2026-03-12
集成 FlashVSR / GIMM / LTX-2 / SeedVR2 的 ComfyUI 视频增强镜像,一键批量补帧、放大、细节修复。
集成 FlashVSR / GIMM / LTX-2 / SeedVR2 的 ComfyUI 视频增强镜像,一键批量补帧、放大、细节修复。
0/小时
LTXComfyUI数字人
LTX-2.3-GGUF-图片数字人
LTX-2.3-GGUF-图片数字人
6
@刘悦的技术博客
刘悦的技术博客认证作者
151
301H
更新时间2026-03-18
支持自启动
LTX-2.3-GGUF-图片数字人-无限时长,更好的一致性,8步采样,支持50系,自定义分辨率,自动补帧,自动提示词,批量任务队列
LTX-2.3-GGUF-图片数字人-无限时长,更好的一致性,8步采样,支持50系,自定义分辨率,自动补帧,自动提示词,批量任务队列
0/小时
ComfyUILTX视频生成
LTX-2.3-GGUF-图生视频
LTX-2.3-GGUF-图生视频
18
@刘悦的技术博客
刘悦的技术博客认证作者
283
463H
更新时间2026-03-18
支持自启动
LTX-2.3-GGUF-图生视频-无限时长,更好的一致性,8步采样,自定义分辨率,自动补帧,自动提示词,批量任务队列
LTX-2.3-GGUF-图生视频-无限时长,更好的一致性,8步采样,自定义分辨率,自动补帧,自动提示词,批量任务队列
0/小时
Lora训练推理框架文本模型
大模型微调部署测评_LLaMa-Factory>vLLM>opencompass
大模型微调部署测评_LLaMa-Factory>vLLM>opencompass
1
@影赤
13
110H
更新时间2026-03-10
大模型微调部署测评全流程环境已安装
大模型微调部署测评全流程环境已安装
0/小时
ComfyUILTXWan
图片-声音-视频Comfyui全量整合包-LTX2.3-Wan2.2-Z-Image-Turbo漫剧全能助手
图片-声音-视频Comfyui全量整合包-LTX2.3-Wan2.2-Z-Image-Turbo漫剧全能助手
33
@老徐Ai研习社
老徐Ai研习社认证作者
379
1757H
更新时间2026-03-10
支持自启动
漫剧全能助手
漫剧全能助手
0/小时
ComfyUIQwen-Image图片编辑
FireRed-ImageEdit-V1.1-GGUF
FireRed-ImageEdit-V1.1-GGUF
11
@刘悦的技术博客
刘悦的技术博客认证作者
102
156H
更新时间2026-03-18
支持自启动
FireRed-ImageEdit-V1.1-GGUF,局部重绘,图像编辑,4步采样,多图编辑,支持50系,自定义分辨率
FireRed-ImageEdit-V1.1-GGUF,局部重绘,图像编辑,4步采样,多图编辑,支持50系,自定义分辨率
0/小时
LTXComfyUI视频生成
LTX-2.3 开源音视频一体生成模型|文生视频+图生视频
LTX-2.3 开源音视频一体生成模型|文生视频+图生视频
10
@AI-KSK
AI-KSK认证作者
101
202H
更新时间2026-03-10
基于 LTX-2.3 的音视频一体生成模型镜像,支持文生视频、图生视频等常见生成方式
基于 LTX-2.3 的音视频一体生成模型镜像,支持文生视频、图生视频等常见生成方式
0/小时
Lora训练
Z-Image 模型一站式训练 & 推理-None_Z-trainer
Z-Image 模型一站式训练 & 推理-None_Z-trainer
3
@zypAIGC
23
7H
更新时间2026-03-06
支持自启动
Z-Image 模型一站式训练 & 推理-None_Z-trainer
Z-Image 模型一站式训练 & 推理-None_Z-trainer
0.2/小时
ComfyUIWan视频生成
Wan2.2-SmoothMixV20-SVI2-VBVR,图生视频,无限时长,自动补帧,8步采样,无须手动复制粘贴节点,,支持批量任务,Comfyui
Wan2.2-SmoothMixV20-SVI2-VBVR,图生视频,无限时长,自动补帧,8步采样,无须手动复制粘贴节点,,支持批量任务,Comfyui
32
@刘悦的技术博客
刘悦的技术博客认证作者
320
572H
更新时间2026-03-06
支持自启动
Wan2.2-SmoothMixV20-SVI2-VBVR,图生视频,无限时长,自动补帧,8步采样,无须手动复制粘贴节点,,支持批量任务,Comfyui
Wan2.2-SmoothMixV20-SVI2-VBVR,图生视频,无限时长,自动补帧,8步采样,无须手动复制粘贴节点,,支持批量任务,Comfyui
0/小时
Lora训练
diffusion-pipe+ai-toolkit丹炉
diffusion-pipe+ai-toolkit丹炉
1
@zypAIGC
4
5H
更新时间2026-03-06
支持自启动
diffusion-pipe+ai-toolkit
diffusion-pipe+ai-toolkit
0.1/小时
ComfyUIZ-Image图片生成
Qwen3-4b-Z-Image-Engineer,文生图,图生图,洗图,6G显存可用,局部重绘,自动提示词,支持50系,批量任务队列
Qwen3-4b-Z-Image-Engineer,文生图,图生图,洗图,6G显存可用,局部重绘,自动提示词,支持50系,批量任务队列
20
@刘悦的技术博客
刘悦的技术博客认证作者
183
349H
更新时间2026-03-10
支持自启动
Qwen3-4b-Z-Image-Engineer,文生图,图生图,洗图,6G显存可用,局部重绘,自动提示词,支持50系,批量任务队列
Qwen3-4b-Z-Image-Engineer,文生图,图生图,洗图,6G显存可用,局部重绘,自动提示词,支持50系,批量任务队列
0/小时
视频生成
SoulX-FlashTalk数字人视频图片生成ai数字人说话数字人 webui二次开发 构建by'科哥
SoulX-FlashTalk数字人视频图片生成ai数字人说话数字人 webui二次开发 构建by'科哥
3
@科哥AIGC
科哥AIGC认证作者
0
0H
更新时间2026-03-04
支持自启动
SoulX-FlashTalk数字人视频图片生成ai数字人说话数字人 webui二次开发 构建by科哥
SoulX-FlashTalk数字人视频图片生成ai数字人说话数字人 webui二次开发 构建by科哥
0/小时
生物信息分子动力
RFantibody
RFantibody
0
@苍耳阿猫
苍耳阿猫认证作者
1
0H
更新时间2026-03-03
RFantibody
RFantibody
0/小时
AI应用
OpenClaw / ClawdBot
OpenClaw / ClawdBot
19
@优云智算
480
7977H
更新时间2026-03-16
OpenClaw 2026.3.2版本,支持飞书、Telegram接入,支持优云智算模型API
OpenClaw 2026.3.2版本,支持飞书、Telegram接入,支持优云智算模型API
0/小时
数字人WanLTX
SoulX-FlashHead-图片数字人,支持贴回全身数字人,低配版InfiniteTalk,唱歌数字人,支持长视频
SoulX-FlashHead-图片数字人,支持贴回全身数字人,低配版InfiniteTalk,唱歌数字人,支持长视频
15
@刘悦的技术博客
刘悦的技术博客认证作者
82
145H
更新时间2026-03-03
支持自启动
SoulX-FlashHead-图片数字人,支持贴回全身数字人,低配版InfiniteTalk,唱歌数字人,支持长视频
SoulX-FlashHead-图片数字人,支持贴回全身数字人,低配版InfiniteTalk,唱歌数字人,支持长视频
0/小时
图片生成视频生成其他
猫影短剧AI驱动的小说转短剧全流程生产平台小说文本自动转换为短剧视频 构建by科哥
猫影短剧AI驱动的小说转短剧全流程生产平台小说文本自动转换为短剧视频 构建by科哥
6
@科哥AIGC
科哥AIGC认证作者
35
82H
更新时间2026-03-03
支持自启动
将小说文本自动转换为短剧视频,只需几个简单步骤即可完成从文字到视频的创作
将小说文本自动转换为短剧视频,只需几个简单步骤即可完成从文字到视频的创作
0/小时
图片生成视频生成其他
moyin AI影视生产级工具支持 Seedance 2.0剧本到成片全流程批量化 构建by科哥
moyin AI影视生产级工具支持 Seedance 2.0剧本到成片全流程批量化 构建by科哥
6
@科哥AIGC
科哥AIGC认证作者
33
44H
更新时间2026-03-02
支持自启动
sora,veo3,grok3,seedance2,香蕉2等等可以接入制作短剧!
sora,veo3,grok3,seedance2,香蕉2等等可以接入制作短剧!
0/小时
图片生成视频生成
Toonflow一款AI短剧创作工具将小说自动转化为剧本生成 AI 图片和视频的平台 构建by科哥
Toonflow一款AI短剧创作工具将小说自动转化为剧本生成 AI 图片和视频的平台 构建by科哥
8
@科哥AIGC
科哥AIGC认证作者
41
39H
更新时间2026-03-02
支持自启动
Toonflow一款AI短剧创作工具将小说自动转化为剧本生成 AI 图片和视频的平台 构建by科哥
Toonflow一款AI短剧创作工具将小说自动转化为剧本生成 AI 图片和视频的平台 构建by科哥
0/小时
Qwen
Qwen3.5_35b_a3b_Q4_K_M
Qwen3.5_35b_a3b_Q4_K_M
2
@
30
242H
更新时间2026-03-02
qwen3.5
qwen3.5
0.1/小时
ComfyUIWan视频生成
Wan2.2双增强:UnifiedReward让文生视频更符合审美预期,VBVR让图生视频更符合真实运动逻辑
Wan2.2双增强:UnifiedReward让文生视频更符合审美预期,VBVR让图生视频更符合真实运动逻辑
8
@AI-KSK
AI-KSK认证作者
148
280H
更新时间2026-03-06
这个镜像内置 Wan2.2 两套增强技术:UnifiedReward 让文生视频更好看、更符合偏好,VBVR 让图生视频动作更合理、更符合逻辑。
这个镜像内置 Wan2.2 两套增强技术:UnifiedReward 让文生视频更好看、更符合偏好,VBVR 让图生视频动作更合理、更符合逻辑。
0/小时
语音识别Qwen3-TTS语音分离
Qwen3-ASR-1.7B,语音转文字字幕,视频转字幕,支持50系显卡,批量任务,支持热词控制
Qwen3-ASR-1.7B,语音转文字字幕,视频转字幕,支持50系显卡,批量任务,支持热词控制
6
@刘悦的技术博客
刘悦的技术博客认证作者
52
137H
更新时间2026-02-27
支持自启动
Qwen3-ASR-1.7B,语音转文字字幕,视频转字幕,支持50系显卡,批量任务,支持热词控制
Qwen3-ASR-1.7B,语音转文字字幕,视频转字幕,支持50系显卡,批量任务,支持热词控制
0/小时
InfiniteTalk其他数字人
life学员
life学员
3
@life
23
143H
更新时间2026-02-28
life学员专用数字人镜像
life学员专用数字人镜像
0/小时
ComfyUIWan视频生成
Comfy漫画上色DasiWa视频支持自由拉取C站模型更新等
Comfy漫画上色DasiWa视频支持自由拉取C站模型更新等
7
@梦影Erislia
54
230H
更新时间2026-02-27
Comfy漫画上色DasiWa视频支持自由拉取C站模型更新等
Comfy漫画上色DasiWa视频支持自由拉取C站模型更新等
0/小时
视频生成
超快视频替换背景Video-BGR
超快视频替换背景Video-BGR
12
@与AI同行
与AI同行认证作者
36
31H
更新时间2026-03-31
支持自启动
超快视频替换背景Video-BGR
超快视频替换背景Video-BGR
0/小时
AI音乐AI应用SVC
SVC-Fusion_api
SVC-Fusion_api
2
@aiguoliuguo
aiguoliuguo认证作者
64
267H
更新时间2026-03-04
支持自启动
SVC Fusion-api服务端
SVC Fusion-api服务端
0/小时
数字人视频超分
HeyGem数字人最新Onnx优化版,多人同时驱动,多人指定面部驱动,接口API调用,支持50系,面部超分,推理速度1比1,唱歌数字人,批量任务
HeyGem数字人最新Onnx优化版,多人同时驱动,多人指定面部驱动,接口API调用,支持50系,面部超分,推理速度1比1,唱歌数字人,批量任务
20
@刘悦的技术博客
刘悦的技术博客认证作者
297
675H
更新时间2026-03-09
支持自启动
HeyGem数字人最新Onnx优化版,多人同时驱动,多人指定面部驱动,接口API调用,支持50系,面部超分,推理速度1比1,唱歌数字人,批量任务
HeyGem数字人最新Onnx优化版,多人同时驱动,多人指定面部驱动,接口API调用,支持50系,面部超分,推理速度1比1,唱歌数字人,批量任务
0/小时
AI应用
DocCaptioner 打标器
DocCaptioner 打标器
12
@Doc_workBox
Doc_workBox认证作者
114
191H
更新时间2026-02-26
支持自启动
Doc的打标器,支持 Qwen3vl及 API 调用
Doc的打标器,支持 Qwen3vl及 API 调用
0.1/小时
语音合成语音识别
 Ming-omni-tts-0.5B,接口API调用,支持超长文本,情感控制,中英混读,支持50系显卡
Ming-omni-tts-0.5B,接口API调用,支持超长文本,情感控制,中英混读,支持50系显卡
5
@刘悦的技术博客
刘悦的技术博客认证作者
33
321H
更新时间2026-02-25
支持自启动
Ming-omni-tts-0.5B,接口API调用,支持超长文本,情感控制,中英混读,支持50系显卡
Ming-omni-tts-0.5B,接口API调用,支持超长文本,情感控制,中英混读,支持50系显卡
0/小时
语音识别
FireRedASR2S语音识别转文字语音转文本音频转文本模型ai系统 二次构建开发 by科哥
FireRedASR2S语音识别转文字语音转文本音频转文本模型ai系统 二次构建开发 by科哥
1
@科哥AIGC
科哥AIGC认证作者
14
3H
更新时间2026-02-25
支持自启动
FireRedASR2S语音识别转文字语音转文本音频转文本模型ai系统 二次构建开发 by科哥
FireRedASR2S语音识别转文字语音转文本音频转文本模型ai系统 二次构建开发 by科哥
0/小时
ComfyUI视频生成Wan
终极角色动画合集镜像Wan 2.2、SCAIL、SteadyDancer、OneToAll 和VACE Phantom
终极角色动画合集镜像Wan 2.2、SCAIL、SteadyDancer、OneToAll 和VACE Phantom
13
@AI-KSK
AI-KSK认证作者
36
24H
更新时间2026-02-26
Wan 2.2、SCAIL、SteadyDancer、OneToAll 和VACE_Skyreels_V3_R2V的“五合一”整合镜像
Wan 2.2、SCAIL、SteadyDancer、OneToAll 和VACE_Skyreels_V3_R2V的“五合一”整合镜像
0/小时
目标检测
羊羊小栈-YOLO目标检测大模型分析系统
羊羊小栈-YOLO目标检测大模型分析系统
1
@
8
60H
更新时间2026-02-25
支持自启动
YOLO模型训练
YOLO模型训练
0/小时
语音合成
AudioX 统一音频生成平台通过一段提示词一段视频推理一段配音音效 webui汉化构建by科哥
AudioX 统一音频生成平台通过一段提示词一段视频推理一段配音音效 webui汉化构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
20
56H
更新时间2026-02-25
支持自启动
AudioX 统一音频生成平台通过一段提示词一段视频推理一段配音音效 webui汉化构建by科哥
AudioX 统一音频生成平台通过一段提示词一段视频推理一段配音音效 webui汉化构建by科哥
0/小时
文本模型行业模型推理框架
HunYuan-MT-7B-abliterated,40种多国语言无限制双向翻译,长文本翻译,字幕翻译,双语字幕,腾讯开源,不文明用语翻译
HunYuan-MT-7B-abliterated,40种多国语言无限制双向翻译,长文本翻译,字幕翻译,双语字幕,腾讯开源,不文明用语翻译
2
@刘悦的技术博客
刘悦的技术博客认证作者
9
3H
更新时间2026-02-25
支持自启动
HunYuan-MT-7B-abliterated,40种多国语言无限制双向翻译,长文本翻译,字幕翻译,双语字幕,腾讯开源,不文明用语翻译
HunYuan-MT-7B-abliterated,40种多国语言无限制双向翻译,长文本翻译,字幕翻译,双语字幕,腾讯开源,不文明用语翻译
0/小时
ComfyUIQwen-Image图片编辑
FireRed-ImageEdit,图像编辑,多图编辑,支持50系,自定义分辨率,自动提示词,批量任务队列,基于Comfyui
FireRed-ImageEdit,图像编辑,多图编辑,支持50系,自定义分辨率,自动提示词,批量任务队列,基于Comfyui
15
@刘悦的技术博客
刘悦的技术博客认证作者
210
356H
更新时间2026-02-25
支持自启动
FireRed-ImageEdit,图像编辑,多图编辑,支持50系,自定义分辨率,自动提示词,批量任务队列,基于Comfyui
FireRed-ImageEdit,图像编辑,多图编辑,支持50系,自定义分辨率,自动提示词,批量任务队列,基于Comfyui
0/小时
AI音乐Lora训练ComfyUI
ACE-Step-1.5UI音乐生成和Lora训练
ACE-Step-1.5UI音乐生成和Lora训练
14
@梦影Erislia
76
403H
更新时间2026-02-19
ACE-Step-1.5UI音乐生成和Lora训练
ACE-Step-1.5UI音乐生成和Lora训练
0/小时
图片生成AI应用
BitDance-14B高速自回归生图模型,自启动WebUI版测试镜像
BitDance-14B高速自回归生图模型,自启动WebUI版测试镜像
0
@AI-KSK
AI-KSK认证作者
20
32H
更新时间2026-02-25
支持自启动
BitDance-14B自启动 WebUI 测试镜像:开箱即用、中文可用、512/1024 双分辨率支持,面向高效验证与稳定出图。
BitDance-14B自启动 WebUI 测试镜像:开箱即用、中文可用、512/1024 双分辨率支持,面向高效验证与稳定出图。
0/小时
AI音乐语音识别
SoulX-Singer歌曲翻唱 带官方Midi编辑器
SoulX-Singer歌曲翻唱 带官方Midi编辑器
4
@鹄仙
鹄仙认证作者
33
28H
更新时间2026-03-20
SoulX-Singer歌曲翻唱 带官方Midi编辑器完成精细翻唱编辑
SoulX-Singer歌曲翻唱 带官方Midi编辑器完成精细翻唱编辑
0/小时
语音合成Qwen3-TTS
Qwen3-TTS-AllinOne
Qwen3-TTS-AllinOne
31
@刘悦的技术博客
刘悦的技术博客认证作者
362
1379H
更新时间2026-02-27
支持自启动
Qwen3-TTS-AllinOne,多音字控制,英文数字发音纠正,批量任务,音色保存,接口API调用,支持超长文本,语速调节,文字转语音,TTS
Qwen3-TTS-AllinOne,多音字控制,英文数字发音纠正,批量任务,音色保存,接口API调用,支持超长文本,语速调节,文字转语音,TTS
0/小时
图片生成视频生成
Penguin-Magic一个图片视频API在线生成的无限画布的批量生成工作流开源项目 构建by科哥
Penguin-Magic一个图片视频API在线生成的无限画布的批量生成工作流开源项目 构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
4
13H
更新时间2026-02-25
支持自启动
Penguin-Magic一个图片视频API在线生成的无限画布的批量生成工作流开源项目 构建by科哥 版权属于原作者
Penguin-Magic一个图片视频API在线生成的无限画布的批量生成工作流开源项目 构建by科哥 版权属于原作者
0/小时
数字人
LiveTalking_GPT-SOVITS-V2_Ollama_洛曦AI数字人
LiveTalking_GPT-SOVITS-V2_Ollama_洛曦AI数字人
26
@Ikaros
59
519H
更新时间2026-02-24
LiveTalking + GPT-SOVITS V2 + Ollama + FunASR 洛曦AI定制版,实时语音对话数字人 + 直播版数字人
LiveTalking + GPT-SOVITS V2 + Ollama + FunASR 洛曦AI定制版,实时语音对话数字人 + 直播版数字人
0/小时
视频超分
最快AI视频高清修复FlashVSR-支持批量生成
最快AI视频高清修复FlashVSR-支持批量生成
100
@与AI同行
与AI同行认证作者
2007
8495H
更新时间2026-03-31
支持自启动
最快AI视频高清修复FlashVSR
最快AI视频高清修复FlashVSR
0/小时
语音合成语音分离AI音乐
SoulX-Singer
SoulX-Singer
12
@刘悦的技术博客
刘悦的技术博客认证作者
63
63H
更新时间2026-02-27
支持自启动
SoulX-Singer,零样本变声器,AI歌曲翻唱,歌词修改,改歌词,语音内容修改
SoulX-Singer,零样本变声器,AI歌曲翻唱,歌词修改,改歌词,语音内容修改
0/小时
ComfyUIWanQwen-Image
ComfyUI云端整合包2602
ComfyUI云端整合包2602
15
@鹄仙
鹄仙认证作者
192
963H
更新时间2026-02-13
全面升级到torch2.10+cu130
全面升级到torch2.10+cu130
0/小时
音乐语音分离语音识别
AI音乐制作项目ACE-Step-1.5官方包
AI音乐制作项目ACE-Step-1.5官方包
9
@鹄仙
鹄仙认证作者
74
557H
更新时间2026-02-25
专业级别的AI音乐制作项目
专业级别的AI音乐制作项目
0/小时
AI音乐
ACE-Step-1.5,AI歌曲生成,男女对唱,纯音乐生成
ACE-Step-1.5,AI歌曲生成,男女对唱,纯音乐生成
12
@刘悦的技术博客
刘悦的技术博客认证作者
45
109H
更新时间2026-02-25
支持自启动
ACE-Step-1.5,AI歌曲生成,男女对唱,纯音乐生成
ACE-Step-1.5,AI歌曲生成,男女对唱,纯音乐生成
0/小时
3D生成
UltraShape-1.0
UltraShape-1.0
1
@苍耳阿猫
苍耳阿猫认证作者
21
35H
更新时间2026-02-25
UltraShape-1.0
UltraShape-1.0
0/小时
AI应用视频生成视频编辑
LingBot-World
LingBot-World
0
@敢敢のwings
敢敢のwings认证作者
13
38H
更新时间2026-02-25
蚂蚁集团旗下具身智能公司灵波科技(Robbyant)正式开源了其世界模型 LingBot-World。这一消息发布后迅速登顶全球社交媒体热榜,引发了人工智能领域的广泛关注
蚂蚁集团旗下具身智能公司灵波科技(Robbyant)正式开源了其世界模型 LingBot-World。这一消息发布后迅速登顶全球社交媒体热榜,引发了人工智能领域的广泛关注
0/小时
视频生成
最强AI生成数字人,InfiniteTalk官方版 v260209
最强AI生成数字人,InfiniteTalk官方版 v260209
19
@与AI同行
与AI同行认证作者
343
1921H
更新时间2026-03-31
支持自启动
最强AI生成数字人,InfiniteTalk官方版 v260209,支持图片数字人,支持超长视频、批量队列生成!
最强AI生成数字人,InfiniteTalk官方版 v260209,支持图片数字人,支持超长视频、批量队列生成!
0/小时
ComfyUIIndexTTSWan
comfyui工作站
comfyui工作站
9
@AI绘视玩家
117
730H
更新时间2026-02-10
支持自启动
集成图片生成|视频生成|数字人|声音编辑|音乐生成!配套Comfyui批量管理生成软件到(B站)【AI绘视玩家】处获取~
集成图片生成|视频生成|数字人|声音编辑|音乐生成!配套Comfyui批量管理生成软件到(B站)【AI绘视玩家】处获取~
0/小时
ComfyUIWan数字人
Comfyui2月最新整合包,含最新klein、Z-image全系、WAN全系、LTX2.0等
Comfyui2月最新整合包,含最新klein、Z-image全系、WAN全系、LTX2.0等
56
@老许爱吃肉丶
302
1282H
更新时间2026-02-25
支持自启动
自用!Comfyui2月最新整合包,含最新klein、Z-image全系、WAN全系、LTX2.0等
自用!Comfyui2月最新整合包,含最新klein、Z-image全系、WAN全系、LTX2.0等
0/小时
语音合成AI音乐
ACE-Step-1.5官方原版,修复吞歌词问题,音乐重构,音乐重绘,AI歌曲生成,男女对唱,纯音乐生成,相关竞品:DiffRhythm/yuE/HeartMuLa
ACE-Step-1.5官方原版,修复吞歌词问题,音乐重构,音乐重绘,AI歌曲生成,男女对唱,纯音乐生成,相关竞品:DiffRhythm/yuE/HeartMuLa
6
@刘悦的技术博客
刘悦的技术博客认证作者
36
26H
更新时间2026-02-25
支持自启动
ACE-Step-1.5官方原版,修复吞歌词问题,音乐重构,音乐重绘,AI歌曲生成,男女对唱,纯音乐生成,相关竞品:DiffRhythm/yuE/HeartMuLa
ACE-Step-1.5官方原版,修复吞歌词问题,音乐重构,音乐重绘,AI歌曲生成,男女对唱,纯音乐生成,相关竞品:DiffRhythm/yuE/HeartMuLa
0/小时
ComfyUI视频生成数字人
LTX2-Rapid-Merges视频生成
LTX2-Rapid-Merges视频生成
43
@AI-KSK
AI-KSK认证作者
235
404H
更新时间2026-02-25
包含了文生、图生、首尾帧、对口型 4 大类工作流,提供SFW/NSFW的完整体验
包含了文生、图生、首尾帧、对口型 4 大类工作流,提供SFW/NSFW的完整体验
0/小时
其他
ROX Quant 3.0 - 量化投研系统可无卡模式运行 投资有风险交易须谨慎
ROX Quant 3.0 - 量化投研系统可无卡模式运行 投资有风险交易须谨慎
4
@科哥AIGC
科哥AIGC认证作者
9
33H
更新时间2026-02-07
支持自启动
ROX Quant 3.0 - 量化投研系统可无卡模式运行 投资有风险交易须谨慎
ROX Quant 3.0 - 量化投研系统可无卡模式运行 投资有风险交易须谨慎
0/小时
语音合成语音克隆
【Qwen3TTS】声音克隆 音色定制 长文本推理优化镜像
【Qwen3TTS】声音克隆 音色定制 长文本推理优化镜像
11
@两只鸽子
166
259H
更新时间2026-02-25
支持自启动
Qwen3TTS推理镜像
Qwen3TTS推理镜像
0/小时
InfiniteTalk数字人
InfiniteTalk数字人最新官方更新,上下文循环,一致性和速度优化,4步采样,高清放大,批量任务队列,基于comfyui,工作流
InfiniteTalk数字人最新官方更新,上下文循环,一致性和速度优化,4步采样,高清放大,批量任务队列,基于comfyui,工作流
36
@刘悦的技术博客
刘悦的技术博客认证作者
464
670H
更新时间2026-02-06
支持自启动
InfiniteTalk数字人最新官方更新,上下文循环,一致性和速度优化,4步采样,高清放大,批量任务队列,基于comfyui,工作流
InfiniteTalk数字人最新官方更新,上下文循环,一致性和速度优化,4步采样,高清放大,批量任务队列,基于comfyui,工作流
0/小时
ComfyUI
ComfyUI-建筑效果图
ComfyUI-建筑效果图
2
@
10
163H
更新时间2026-02-06
支持自启动
用于建筑效果图的生成与编辑
用于建筑效果图的生成与编辑
0/小时
语音合成AI音乐
K哥配音工作室(indextts2音色克隆+qwen3-tts音色生成+HeartMuLay音乐生成)
K哥配音工作室(indextts2音色克隆+qwen3-tts音色生成+HeartMuLay音乐生成)
11
@K哥讲AI
232
564H
更新时间2026-02-05
支持自启动
多功能配音镜像,融合 indextts2.qwen3-tts音色克隆 HeartMuLa音乐生成,支持多角色配音、文本创音色、一键克隆、音乐一键生成,还有 AI 角色分配.基础音色库及多语言.方言配音
多功能配音镜像,融合 indextts2.qwen3-tts音色克隆 HeartMuLa音乐生成,支持多角色配音、文本创音色、一键克隆、音乐一键生成,还有 AI 角色分配.基础音色库及多语言.方言配音
0/小时
ComfyUILTX
ComfyUI云端整合包LTX-2特别版
ComfyUI云端整合包LTX-2特别版
19
@鹄仙
鹄仙认证作者
54
191H
更新时间2026-02-12
支持LTX-2 scail wan2.2系列
支持LTX-2 scail wan2.2系列
0/小时
图片生成Z-Image
red-Z-Image-Base,15步采样,自定义分辨率,文生图,图生图,自动提示词,批量任务
red-Z-Image-Base,15步采样,自定义分辨率,文生图,图生图,自动提示词,批量任务
13
@刘悦的技术博客
刘悦的技术博客认证作者
161
86H
更新时间2026-02-04
支持自启动
red-Z-Image-Base,15步采样,自定义分辨率,文生图,图生图,自动提示词,批量任务
red-Z-Image-Base,15步采样,自定义分辨率,文生图,图生图,自动提示词,批量任务
0/小时
Qwen语音识别
Qwen-ASR
Qwen-ASR
0
@有黑眼圈的小竹熊
16
23H
更新时间2026-02-04
Qwen3-ASR 系列包括 Qwen3-ASR-1.7B 和 Qwen3-ASR-0.6B,支持 52 种语言和方言的语言识别与语音识别(ASR)。
Qwen3-ASR 系列包括 Qwen3-ASR-1.7B 和 Qwen3-ASR-0.6B,支持 52 种语言和方言的语言识别与语音识别(ASR)。
0.3/小时
ComfyUILTX
LTX-2-RapID-GGUF-图生视频-无限时长
LTX-2-RapID-GGUF-图生视频-无限时长
15
@刘悦的技术博客
刘悦的技术博客认证作者
117
213H
更新时间2026-02-04
支持自启动
LTX-2-RapID-GGUF-图生视频-无限时长
LTX-2-RapID-GGUF-图生视频-无限时长
0/小时
ComfyUILTX
LTX-2-RapID-GGUF-图片数字人-无限时长
LTX-2-RapID-GGUF-图片数字人-无限时长
8
@刘悦的技术博客
刘悦的技术博客认证作者
39
47H
更新时间2026-02-05
支持自启动
LTX-2-RapID-GGUF-图片数字人-无限时长
LTX-2-RapID-GGUF-图片数字人-无限时长
0/小时
推理框架Qwen
nano-vllm
nano-vllm
0
@kq123jk6n9
7
35H
更新时间2026-02-03
从0到1,理解vllm的核心内容。包含注释讲解和使用实例,使用教程。帮助大家学习vllm
从0到1,理解vllm的核心内容。包含注释讲解和使用实例,使用教程。帮助大家学习vllm
0.99/小时
ComfyUILTX
LTX2-视频生成最新整个大包(202602)
LTX2-视频生成最新整个大包(202602)
11
@NiuGee
NiuGee认证作者
87
118H
更新时间2026-02-04
支持自启动
震惊!LTX-2开源视频模型,人人都能当导演?牛哥一键整合免费AI创作神器!
震惊!LTX-2开源视频模型,人人都能当导演?牛哥一键整合免费AI创作神器!
0/小时
其他
Sora2API:一个将sora账号转为API服务接口的免费开源系统
Sora2API:一个将sora账号转为API服务接口的免费开源系统
2
@科哥AIGC
科哥AIGC认证作者
9
26H
更新时间2026-02-04
支持自启动
Sora2API:一个将sora账号转为API服务接口的免费开源系统
Sora2API:一个将sora账号转为API服务接口的免费开源系统
0/小时
WanQwen-Image数字人
数字人-语音克隆-wan2.2视频换人换装-Qwen-Image-Edit2509整合包
数字人-语音克隆-wan2.2视频换人换装-Qwen-Image-Edit2509整合包
72
@老徐Ai研习社
老徐Ai研习社认证作者
731
2408H
更新时间2026-02-02
支持自启动
数字人-语音克隆-wan2.2视频换人换装-Qwen-Image-Edit2511整合包
数字人-语音克隆-wan2.2视频换人换装-Qwen-Image-Edit2511整合包
0/小时
OCR识别
LightOn-OCR-1B,图片和PDF文字提取,图文混排,实时生成MarkDown文档,MarkDown文档下载,支持PDF全量解析
LightOn-OCR-1B,图片和PDF文字提取,图文混排,实时生成MarkDown文档,MarkDown文档下载,支持PDF全量解析
2
@刘悦的技术博客
刘悦的技术博客认证作者
10
0H
更新时间2026-02-02
支持自启动
LightOn-OCR-1B,图片和PDF文字提取,图文混排,实时生成MarkDown文档,MarkDown文档下载,支持PDF全量解析
LightOn-OCR-1B,图片和PDF文字提取,图文混排,实时生成MarkDown文档,MarkDown文档下载,支持PDF全量解析
0/小时
FluxWanComfyUI
Bob同学的comfyui云端镜像系列
Bob同学的comfyui云端镜像系列
281
@Bob同学
Bob同学认证作者
4537
14045H
更新时间2026-02-01
支持自启动
此版本内置 (Wan2.2\Flux\Kontext)系列的全部基础模型及工作流
此版本内置 (Wan2.2\Flux\Kontext)系列的全部基础模型及工作流
0/小时
图片生成Z-ImageQwen-Image
最全图片编辑模型大全-qwen2511多角度工作流-flux2-klein-9b全图片编辑模型-z-image-base图片生成模型
最全图片编辑模型大全-qwen2511多角度工作流-flux2-klein-9b全图片编辑模型-z-image-base图片生成模型
17
@匹夫
匹夫认证作者
205
725H
更新时间2026-02-04
最全图片编辑模型大全-qwen2511多角度工作流-flux2-klein-9b全图片编辑模型-z-image-base图片生成模型
最全图片编辑模型大全-qwen2511多角度工作流-flux2-klein-9b全图片编辑模型-z-image-base图片生成模型
0/小时
Lora训练Z-Image
Z-Image-Base的Lora训练同时支持FluxKlein-AI-TOOLKIT
Z-Image-Base的Lora训练同时支持FluxKlein-AI-TOOLKIT
6
@梦影Erislia
98
859H
更新时间2026-02-02
Z-Image-Base的Lora训练同时支持FluxKlein-AI-TOOLKIT
Z-Image-Base的Lora训练同时支持FluxKlein-AI-TOOLKIT
0/小时
Lora训练LTXWan
ai-toolkit全能Lora模型训练器
ai-toolkit全能Lora模型训练器
12
@老徐Ai研习社
老徐Ai研习社认证作者
235
1806H
更新时间2026-02-01
支持自启动
支持主流模型lora训练
支持主流模型lora训练
0/小时
图片生成Lora训练
AI图片ZImage模型训练,一键启动WebUI、无需配置
AI图片ZImage模型训练,一键启动WebUI、无需配置
43
@与AI同行
与AI同行认证作者
366
1453H
更新时间2026-03-31
支持自启动
AI图片ZImage模型训练,一键启动WebUI、无需配置
AI图片ZImage模型训练,一键启动WebUI、无需配置
0/小时
图片生成Z-Image
Nunchaku-ZImage极速出图
Nunchaku-ZImage极速出图
4
@Tanjie7
18
3H
更新时间2026-01-30
ZImage Nunchaku版本,已经配置好nunchaku环境,可以直接启动使用comfyui+nunchaku zimage出图
ZImage Nunchaku版本,已经配置好nunchaku环境,可以直接启动使用comfyui+nunchaku zimage出图
0/小时
ComfyUIWan视频生成
2026最新ComfyUI整合包_图片·视频·声音
2026最新ComfyUI整合包_图片·视频·声音
15
@老徐Ai研习社
老徐Ai研习社认证作者
180
3169H
更新时间2026-01-30
支持自启动
2026最新ComfyUI整合包_图片·视频·声音
2026最新ComfyUI整合包_图片·视频·声音
0/小时
图片生成Z-Image
Z-Image-Base,35步采样,文生图,图生图,自动提示词,批量任务
Z-Image-Base,35步采样,文生图,图生图,自动提示词,批量任务
13
@刘悦的技术博客
刘悦的技术博客认证作者
127
160H
更新时间2026-01-29
支持自启动
Z-Image-Base,35步采样,文生图,图生图,自动提示词,批量任务
Z-Image-Base,35步采样,文生图,图生图,自动提示词,批量任务
0/小时
ComfyUI
Comfyui 一张照片制作一个lora训练数据集
Comfyui 一张照片制作一个lora训练数据集
17
@Prompt娄
119
614H
更新时间2026-01-29
支持自启动
一张照片制作一个角色一致性lora训练数据集
一张照片制作一个角色一致性lora训练数据集
0/小时
Z-Image图片生成
Z-Image
Z-Image
18
@十字鱼
十字鱼认证作者
119
889H
更新时间2026-01-30
支持自启动
Z-Image是一个拥有6B参数的强大且高效的图像生成模型。
Z-Image是一个拥有6B参数的强大且高效的图像生成模型。
0/小时
语音克隆
超级AI语音Qwen3-TTS合集,超强音色克隆、音色设计、情绪控制!
超级AI语音Qwen3-TTS合集,超强音色克隆、音色设计、情绪控制!
41
@与AI同行
与AI同行认证作者
391
998H
更新时间2026-03-31
支持自启动
超强AI语音生成,Qwen3-TTS整合包合集!超强音色克隆、音色设计、情绪控制,支持音色保存、多音字、超长文本生成。支持批量上传多个文件生成!
超强AI语音生成,Qwen3-TTS整合包合集!超强音色克隆、音色设计、情绪控制,支持音色保存、多音字、超长文本生成。支持批量上传多个文件生成!
0/小时
图片生成Z-Image
Z-Image系列,Base+Tubro反推生图放大一体化
Z-Image系列,Base+Tubro反推生图放大一体化
6
@社恐的知识树
社恐的知识树认证作者
35
170H
更新时间2026-01-28
支持自启动
阿里开源的Z-Image系列模型
阿里开源的Z-Image系列模型
0/小时
DeepSeekOCR识别
DeepSeek-OCR-2
DeepSeek-OCR-2
1
@敢敢のwings
敢敢のwings认证作者
59
109H
更新时间2026-01-29
DeepSeek-OCR 2 是 DeepSeek 团队开源的新一代 OCR 模型,该模型能够像人类一样带着逻辑去阅读文档。
DeepSeek-OCR 2 是 DeepSeek 团队开源的新一代 OCR 模型,该模型能够像人类一样带着逻辑去阅读文档。
0/小时
ComfyUI
ComfyUI学习版,内置多种基础模型-MumuOpenK
ComfyUI学习版,内置多种基础模型-MumuOpenK
21
@MumuOpenK
440
8618H
更新时间2026-01-29
支持自启动
内置多种基础模型,快速开启comfyui体验
内置多种基础模型,快速开启comfyui体验
0/小时
数字人语音合成语音克隆
AI音乐、声音克隆:顶级数字人长视频套件V2
AI音乐、声音克隆:顶级数字人长视频套件V2
3
@AI-KSK
AI-KSK认证作者
20
26H
更新时间2026-02-11
镜像打通HeartMuLa音乐、Qwen3-TTS音色克隆、InfiniteTalk/LongCat长对话数字人与LTX2视频:写歌配音→照片开口→长时稳成片。
镜像打通HeartMuLa音乐、Qwen3-TTS音色克隆、InfiniteTalk/LongCat长对话数字人与LTX2视频:写歌配音→照片开口→长时稳成片。
0/小时
语音合成Qwen3-TTS
Qwen3-TTS语音模型, | 声音克隆 | 语音定制 | 语音预设 |
Qwen3-TTS语音模型, | 声音克隆 | 语音定制 | 语音预设 |
9
@社恐的知识树
社恐的知识树认证作者
94
62H
更新时间2026-01-27
阿里千问开源的最新语音类模型,显存占用小,生成速度快,支持10种主流语言。
阿里千问开源的最新语音类模型,显存占用小,生成速度快,支持10种主流语言。
0/小时
AI音乐
HeartMuLa-HL,支持中文提示词,无须标签式歌词,更自然的AI歌曲生成,开源版Suno
HeartMuLa-HL,支持中文提示词,无须标签式歌词,更自然的AI歌曲生成,开源版Suno
2
@刘悦的技术博客
刘悦的技术博客认证作者
37
28H
更新时间2026-01-26
支持自启动
HeartMuLa-HL,支持中文提示词,无须标签式歌词,更自然的AI歌曲生成,开源版Suno
HeartMuLa-HL,支持中文提示词,无须标签式歌词,更自然的AI歌曲生成,开源版Suno
0/小时
AI音乐Qwen3-TTS
HeartMula& Qwen3TTS 歌曲生成与语音设计
HeartMula& Qwen3TTS 歌曲生成与语音设计
0
@鹄仙
鹄仙认证作者
10
2H
更新时间2026-01-29
基于HeartMula和Qwen3TTS的歌曲生成与语音设计
基于HeartMula和Qwen3TTS的歌曲生成与语音设计
0/小时
FluxLora训练
Flux.Klein模型Lora训练AI-Toolkit
Flux.Klein模型Lora训练AI-Toolkit
9
@梦影Erislia
83
499H
更新时间2026-01-26
Flux.Klein模型Lora训练AI-Toolkit
Flux.Klein模型Lora训练AI-Toolkit
0/小时
语音合成Qwen3-TTS
Qwen3-TTS-0.6B,推理速度1比0.5,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
Qwen3-TTS-0.6B,推理速度1比0.5,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
5
@刘悦的技术博客
刘悦的技术博客认证作者
37
22H
更新时间2026-01-26
支持自启动
Qwen3-TTS-0.6B,推理速度1比0.5,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
Qwen3-TTS-0.6B,推理速度1比0.5,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
0/小时
语音合成Qwen3-TTS
Qwen3-TTS-语音克隆工作流合集
Qwen3-TTS-语音克隆工作流合集
4
@匹夫
匹夫认证作者
56
77H
更新时间2026-01-26
Qwen3-TTS-语音克隆工作流合集
Qwen3-TTS-语音克隆工作流合集
0/小时
语音合成Qwen3-TTS
Qwen3-TTS捏声音自定义声音tts语音克隆语音克隆声音flash_attn加速版Comfyui工作流版 构建by科哥
Qwen3-TTS捏声音自定义声音tts语音克隆语音克隆声音flash_attn加速版Comfyui工作流版 构建by科哥
11
@科哥AIGC
科哥AIGC认证作者
119
268H
更新时间2026-01-26
支持自启动
Qwen3-TTS捏声音自定义声音tts语音克隆语音克隆声音flash_attn加速版Comfyui工作流版 构建by科哥
Qwen3-TTS捏声音自定义声音tts语音克隆语音克隆声音flash_attn加速版Comfyui工作流版 构建by科哥
0/小时
语音合成Qwen3-TTS
Qwen3-TTS-1.7B,Flash-Attn加速,音色保存,接口API调用,支持超长文本,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
Qwen3-TTS-1.7B,Flash-Attn加速,音色保存,接口API调用,支持超长文本,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
6
@刘悦的技术博客
刘悦的技术博客认证作者
96
166H
更新时间2026-01-26
支持自启动
Qwen3-TTS-1.7B,Flash-Attn加速,音色保存,接口API调用,支持超长文本,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
Qwen3-TTS-1.7B,Flash-Attn加速,音色保存,接口API调用,支持超长文本,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
0/小时
OCR识别
LightOnOCR-2高效的1B参数视觉语言模型用于OCR识别pdf转文本jpg转文本图片转文本 二次开发构建by科哥
LightOnOCR-2高效的1B参数视觉语言模型用于OCR识别pdf转文本jpg转文本图片转文本 二次开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
1
1H
更新时间2026-01-26
支持自启动
LightOnOCR-2高效的1B参数视觉语言模型用于OCR识别pdf转文本jpg转文本图片转文本 二次开发构建by科哥
LightOnOCR-2高效的1B参数视觉语言模型用于OCR识别pdf转文本jpg转文本图片转文本 二次开发构建by科哥
0/小时
Lora训练LTX
LTX2模型Lora训练AI-Toolkit
LTX2模型Lora训练AI-Toolkit
2
@梦影Erislia
17
127H
更新时间2026-01-24
LTX2模型Lora训练AI-Toolkit
LTX2模型Lora训练AI-Toolkit
0/小时
AI音乐
HeartMuLa,AI歌曲生成,开源版Suno
HeartMuLa,AI歌曲生成,开源版Suno
8
@刘悦的技术博客
刘悦的技术博客认证作者
14
9H
更新时间2026-01-23
支持自启动
HeartMuLa,AI歌曲生成,开源版Suno
HeartMuLa,AI歌曲生成,开源版Suno
0/小时
AI音乐
歌曲与音效生成
歌曲与音效生成
2
@老徐Ai研习社
老徐Ai研习社认证作者
16
5H
更新时间2026-01-22
支持自启动
HeartMula根据歌词生成音乐,根据画面生成音效
HeartMula根据歌词生成音乐,根据画面生成音效
0/小时
GLM文本模型
GLM-4.7-Flash
GLM-4.7-Flash
1
@苍耳阿猫
苍耳阿猫认证作者
23
18H
更新时间2026-01-22
GLM-4.7-Flash
GLM-4.7-Flash
0/小时
语音识别
微软开源VibeVoice ASR  TTS集合webui语音到文本 文本到语音模型 二次卡发构建by科哥
微软开源VibeVoice ASR TTS集合webui语音到文本 文本到语音模型 二次卡发构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
11
0H
更新时间2026-01-22
支持自启动
微软开源VibeVoice ASR TTS集合webui语音到文本 文本到语音模型 二次卡发构建by科哥
微软开源VibeVoice ASR TTS集合webui语音到文本 文本到语音模型 二次卡发构建by科哥
0/小时
视频生成
超强视频替换人物MoCha
超强视频替换人物MoCha
58
@与AI同行
与AI同行认证作者
380
511H
更新时间2026-03-31
支持自启动
最新视频替换人物,MoCha-Preview 整合包,支持视频替换人物,卡通动漫效果更佳,支持添加批量任务, 支持高清修复
最新视频替换人物,MoCha-Preview 整合包,支持视频替换人物,卡通动漫效果更佳,支持添加批量任务, 支持高清修复
0/小时
GLM文本模型
智普开源GLM-4.7-Flash GGUF推理服务编程文本大模型速度很快 webui开发构建by科哥
智普开源GLM-4.7-Flash GGUF推理服务编程文本大模型速度很快 webui开发构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
13
31H
更新时间2026-01-22
支持自启动
智普开源GLM-4.7-Flash GGUF推理服务编程文本大模型API+webui开发构建by科哥
智普开源GLM-4.7-Flash GGUF推理服务编程文本大模型API+webui开发构建by科哥
0/小时
LTXLora训练
AIToolkit Ltx-2 Lora Training,4090 24G / 48G / 5090 预设多挡位支持
AIToolkit Ltx-2 Lora Training,4090 24G / 48G / 5090 预设多挡位支持
5
@AI-KSK
AI-KSK认证作者
52
306H
更新时间2026-01-22
基于AI Toolkit,内置4090、48G及5090专属精调预设。告别复杂调参,只需加载对应JSON文件,即可解锁硬件最优性能,零门槛获得专家级训练方案。
基于AI Toolkit,内置4090、48G及5090专属精调预设。告别复杂调参,只需加载对应JSON文件,即可解锁硬件最优性能,零门槛获得专家级训练方案。
0/小时
语音合成
indextts2-IndexTTS2 最新 V23版本的全面升级情感控制更好 构建by科哥
indextts2-IndexTTS2 最新 V23版本的全面升级情感控制更好 构建by科哥
40
@科哥AIGC
科哥AIGC认证作者
884
3733H
更新时间2026-01-28
支持自启动
V23版本的全面升级情感控制更好
V23版本的全面升级情感控制更好
0/小时
语音合成
NovaSR一个开源的音频超分辨率模型低音质转高清音质声音修复模型 webui开发构建by科哥
NovaSR一个开源的音频超分辨率模型低音质转高清音质声音修复模型 webui开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
11
3H
更新时间2026-01-21
支持自启动
NovaSR一个开源的音频超分辨率模型低音质转高清音质声音修复模型 webui开发构建by科哥
NovaSR一个开源的音频超分辨率模型低音质转高清音质声音修复模型 webui开发构建by科哥
0/小时
行业模型
sinong南京农业大学开源面向通用农业领域的垂直8B32B全离线模型 webui开发构建by科哥
sinong南京农业大学开源面向通用农业领域的垂直8B32B全离线模型 webui开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
0
0H
更新时间2026-01-26
支持自启动
sinong南京农业大学开源面向通用农业领域的垂直8B32B全离线模型 webui开发构建by科哥
sinong南京农业大学开源面向通用农业领域的垂直8B32B全离线模型 webui开发构建by科哥
0/小时
生物信息行业模型
谷歌最新开源MedGemma医学AI助手 问诊问病例查看CT拍片x光拍片病理答疑问 webui开发构建by科哥
谷歌最新开源MedGemma医学AI助手 问诊问病例查看CT拍片x光拍片病理答疑问 webui开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
9
37H
更新时间2026-01-19
支持自启动
谷歌最新开源MedGemma医学AI助手 问诊问病例查看CT拍片x光拍片病理答疑问 webui开发构建by科哥
谷歌最新开源MedGemma医学AI助手 问诊问病例查看CT拍片x光拍片病理答疑问 webui开发构建by科哥
0/小时
图片生成GLM
GLM-Image
GLM-Image
1
@十字鱼
十字鱼认证作者
15
4H
更新时间2026-01-19
支持自启动
智谱开源图像生成和编辑模型
智谱开源图像生成和编辑模型
0/小时
视频超分
sora2视频二次高清工作流视频高清修复flashvsr工作流Comfyui工作流 构建by科哥
sora2视频二次高清工作流视频高清修复flashvsr工作流Comfyui工作流 构建by科哥
7
@科哥AIGC
科哥AIGC认证作者
61
27H
更新时间2026-01-19
支持自启动
sora2视频二次高清工作流视频高清修复flashvsr工作流Comfyui工作流 构建by科哥
sora2视频二次高清工作流视频高清修复flashvsr工作流Comfyui工作流 构建by科哥
0/小时
图片生成Qwen-image
超强AI图片编辑,QwenEdit-2511合集,单图/双图编辑, 超强人脸一致性,精准涂抹编辑、无色差/位移,一键生成24张姿势图、九宫格分镜
超强AI图片编辑,QwenEdit-2511合集,单图/双图编辑, 超强人脸一致性,精准涂抹编辑、无色差/位移,一键生成24张姿势图、九宫格分镜
74
@与AI同行
与AI同行认证作者
888
2549H
更新时间2026-03-31
支持自启动
超强AI图片编辑,QwenEdit-2511合集,单图/双图编辑, 超强人脸一致性,精准涂抹编辑、无色差/位移,一键生成24张姿势图、九宫格分镜
超强AI图片编辑,QwenEdit-2511合集,单图/双图编辑, 超强人脸一致性,精准涂抹编辑、无色差/位移,一键生成24张姿势图、九宫格分镜
0/小时
FluxComfyUI图片生成
FLUX2-Klein-黑森林开源最强编辑模型,秒级生图,效果可控!
FLUX2-Klein-黑森林开源最强编辑模型,秒级生图,效果可控!
11
@社恐的知识树
社恐的知识树认证作者
97
183H
更新时间2026-01-19
黑森林团队开源的FLUX2-Klein多功能模型,生成速度快,编辑能力强!
黑森林团队开源的FLUX2-Klein多功能模型,生成速度快,编辑能力强!
0/小时
行业模型
谷歌最新翻译模型TranslateGemma支持全世界50多种语言的翻译文本多语言翻译 二次webui开发 构建by科哥
谷歌最新翻译模型TranslateGemma支持全世界50多种语言的翻译文本多语言翻译 二次webui开发 构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
4
0H
更新时间2026-01-16
支持自启动
谷歌最新翻译模型TranslateGemma支持全世界50多种语言的翻译文本多语言翻译 二次webui开发 构建by科哥
谷歌最新翻译模型TranslateGemma支持全世界50多种语言的翻译文本多语言翻译 二次webui开发 构建by科哥
0/小时
图片生成AI电商
BananaMall一个 AI 驱动的电商详情页生成的ai工具结合谷歌nano banana谷歌香蕉模型 开发构建by科哥
BananaMall一个 AI 驱动的电商详情页生成的ai工具结合谷歌nano banana谷歌香蕉模型 开发构建by科哥
10
@科哥AIGC
科哥AIGC认证作者
40
78H
更新时间2026-01-16
支持自启动
BananaMall一个 AI 驱动的电商详情页生成的ai工具结合谷歌nano banana谷歌香蕉模型 开发构建by科哥
BananaMall一个 AI 驱动的电商详情页生成的ai工具结合谷歌nano banana谷歌香蕉模型 开发构建by科哥
0/小时
Z-Image图片生成
全能图片编辑王flux2_klein|Qwen_Image_Edit2511|Z-image-turbo
全能图片编辑王flux2_klein|Qwen_Image_Edit2511|Z-image-turbo
21
@老徐Ai研习社
老徐Ai研习社认证作者
160
1635H
更新时间2026-01-21
支持自启动
全能图片生成与编辑
全能图片生成与编辑
0/小时
目标检测
YOLO26
YOLO26
4
@苍耳阿猫
苍耳阿猫认证作者
28
556H
更新时间2026-01-16
YOLO26
YOLO26
0/小时
具身智能
Alpamayo
Alpamayo
1
@苍耳阿猫
苍耳阿猫认证作者
5
5H
更新时间2026-01-20
Alpamayo 1 是一个预训练推理模型,旨在加速自动驾驶(AV)领域的研发。
Alpamayo 1 是一个预训练推理模型,旨在加速自动驾驶(AV)领域的研发。
0/小时
音乐
NotaGen基于 LLM 范式的高音乐性古典符号化音乐生成模型 二次开发构建by科哥
NotaGen基于 LLM 范式的高音乐性古典符号化音乐生成模型 二次开发构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
9
11H
更新时间2026-02-25
支持自启动
NotaGen基于 LLM 范式的高音乐性古典符号化音乐生成模型 二次开发构建by科哥
NotaGen基于 LLM 范式的高音乐性古典符号化音乐生成模型 二次开发构建by科哥
0/小时
Wan图片生成视频生成
闪电AI视频、图片生成镜像
闪电AI视频、图片生成镜像
7
@cola
49
54H
更新时间2026-01-16
支持自启动
基于lightx2v框架加速的视频、图片生成服务,快速生成视频图片,基于模型wan2.2、qwen-image、z-image
基于lightx2v框架加速的视频、图片生成服务,快速生成视频图片,基于模型wan2.2、qwen-image、z-image
0.1/小时
Wan视频生成ComfyUI
DaSiWa & Remix:Wan 2.2 双神N版
DaSiWa & Remix:Wan 2.2 双神N版
30
@AI-KSK
AI-KSK认证作者
278
796H
更新时间2026-01-16
本镜像高度集成 Wan 2.2 视频生成环境,预装社区领先四套核心工作流,融合 DaSiWa 高保真与 Remix 逻辑优化,提供一站式 T2V 文生视频与 I2V 图生视频解决方案。
本镜像高度集成 Wan 2.2 视频生成环境,预装社区领先四套核心工作流,融合 DaSiWa 高保真与 Remix 逻辑优化,提供一站式 T2V 文生视频与 I2V 图生视频解决方案。
0/小时
LTX视频生成
LTX-2 Audio-Video:开源首个 · 音画同步生成
LTX-2 Audio-Video:开源首个 · 音画同步生成
14
@AI-KSK
AI-KSK认证作者
128
321H
更新时间2026-01-21
双官方流程全覆盖:同时支持 ComfyUI 官方 LTX 工作流示例 + Lightricks 官方 ComfyUI-LTXVideo 自定义节点与全部示例工作流
双官方流程全覆盖:同时支持 ComfyUI 官方 LTX 工作流示例 + Lightricks 官方 ComfyUI-LTXVideo 自定义节点与全部示例工作流
0/小时
语音合成AI应用
voice pro给视频做多语言配音翻译克隆特定视频声音 直译视频声音本地化 汉化构建by科哥
voice pro给视频做多语言配音翻译克隆特定视频声音 直译视频声音本地化 汉化构建by科哥
5
@科哥AIGC
科哥AIGC认证作者
23
11H
更新时间2026-01-20
支持自启动
voice pro给视频做多语言配音翻译克隆特定视频声音 直译视频声音本地化 汉化构建by科哥
voice pro给视频做多语言配音翻译克隆特定视频声音 直译视频声音本地化 汉化构建by科哥
0/小时
LTXLora训练
LTX2官方训练器Lora训练
LTX2官方训练器Lora训练
1
@梦影Erislia
27
109H
更新时间2026-01-21
LTX2官方训练器的lora训练支持,内置模型t2v,小白可以一键运行,也可以根据官方文档进行进阶操作
LTX2官方训练器的lora训练支持,内置模型t2v,小白可以一键运行,也可以根据官方文档进行进阶操作
0/小时
LTX视频生成
ltx-2全能lora运镜comfyui工作流文生视频图生视频一键运行 构建by科哥
ltx-2全能lora运镜comfyui工作流文生视频图生视频一键运行 构建by科哥
5
@科哥AIGC
科哥AIGC认证作者
37
27H
更新时间2026-01-21
支持自启动
ltx-2全能lora运镜comfyui工作流文生视频图生视频一键运行 构建by科哥
ltx-2全能lora运镜comfyui工作流文生视频图生视频一键运行 构建by科哥
0/小时
Qwen-Image
Tongbi-支持Qwen-Image和Qwen-Image-Edit
Tongbi-支持Qwen-Image和Qwen-Image-Edit
44
@十字鱼
十字鱼认证作者
245
7744H
更新时间2026-02-02
支持自启动
阿里通义千问开源最强图像模型,强大的文字渲染能力,强大的图像编辑能力
阿里通义千问开源最强图像模型,强大的文字渲染能力,强大的图像编辑能力
0/小时
视频生成Wan
TurboDiffusion清华大学等推出的视频生成加速框架 webUI二次修改构建by科哥
TurboDiffusion清华大学等推出的视频生成加速框架 webUI二次修改构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
44
37H
更新时间2026-01-27
支持自启动
实现将ai视频生成速度提升百倍!基于wan2.1,wan2.2
实现将ai视频生成速度提升百倍!基于wan2.1,wan2.2
0/小时
其他
nano banana谷歌香蕉在线绘画在线改图修改图片模型香蕉模型
nano banana谷歌香蕉在线绘画在线改图修改图片模型香蕉模型
3
@科哥AIGC
科哥AIGC认证作者
50
12H
更新时间2026-01-10
支持自启动
nano banana谷歌香蕉在线绘画在线改图修改图片模型香蕉模型
nano banana谷歌香蕉在线绘画在线改图修改图片模型香蕉模型
0/小时
IndexTTS语音合成
【音谷官方】indextts2-api
【音谷官方】indextts2-api
67
@音谷官方
1456
6602H
更新时间2026-01-21
支持自启动
【音谷官方】音谷对应的API
【音谷官方】音谷对应的API
0.01/小时
LTX视频生成
LTX-2 WebUI版
LTX-2 WebUI版
6
@鹄仙
鹄仙认证作者
41
39H
更新时间2026-01-10
基于wangp的LTX-2,WebUI版
基于wangp的LTX-2,WebUI版
0/小时
视频生成
开源版Veo3!LTX2-视频生成合集,文生视频、图生视频、视频人物配音+口型同步、直出1080P,高清细节放大、提示词增强、支持线条+深度+姿势控制!
开源版Veo3!LTX2-视频生成合集,文生视频、图生视频、视频人物配音+口型同步、直出1080P,高清细节放大、提示词增强、支持线条+深度+姿势控制!
50
@与AI同行
与AI同行认证作者
270
171H
更新时间2026-03-31
支持自启动
开源版Veo3!LTX2-视频生成合集,文生视频、图生视频、视频人物配音+口型同步、直出1080P,高清细节放大、提示词增强、支持线条+深度+姿势控制!
开源版Veo3!LTX2-视频生成合集,文生视频、图生视频、视频人物配音+口型同步、直出1080P,高清细节放大、提示词增强、支持线条+深度+姿势控制!
0/小时
LTXComfyUI数字人
 LTX-2:首个开源音画同步生成模型,提示词遵从比肩Sora,理解分镜脚本,一键AI成片!
LTX-2:首个开源音画同步生成模型,提示词遵从比肩Sora,理解分镜脚本,一键AI成片!
7
@社恐的知识树
社恐的知识树认证作者
37
42H
更新时间2026-01-22
LTX-2 是由 Lightricks 开源的 DiT 架构音频-视频基础模型,核心特点是:在同一个模型里同步生成视频与音频,超强提示词理解,支持多镜头脚本,关键词自动匹配视频风格,一键AI成片!
LTX-2 是由 Lightricks 开源的 DiT 架构音频-视频基础模型,核心特点是:在同一个模型里同步生成视频与音频,超强提示词理解,支持多镜头脚本,关键词自动匹配视频风格,一键AI成片!
0/小时
语音合成
Voice Sculptor捏声音基于LLaSA和CosyVoice2的指令化语音合成语音模型 二次开发构建by科哥
Voice Sculptor捏声音基于LLaSA和CosyVoice2的指令化语音合成语音模型 二次开发构建by科哥
4
@科哥AIGC
科哥AIGC认证作者
14
4H
更新时间2026-01-22
支持自启动
Voice Sculptor捏声音基于LLaSA和CosyVoice2的指令化语音合成语音模型 二次开发构建by科哥
Voice Sculptor捏声音基于LLaSA和CosyVoice2的指令化语音合成语音模型 二次开发构建by科哥
0/小时
Qwen-Image图片生成ComfyUI
LTX-2.0音画同步视频生成|Z-Image-Turbo&Qwen-Image-Edit1图片编辑
LTX-2.0音画同步视频生成|Z-Image-Turbo&Qwen-Image-Edit1图片编辑
10
@老徐Ai研习社
老徐Ai研习社认证作者
58
66H
更新时间2026-02-05
支持自启动
LTX-2.0音画同步视频生成
LTX-2.0音画同步视频生成
0/小时
ComfyUIWan
Comfy二次元跑图生视频DaSiWa和vace跳舞
Comfy二次元跑图生视频DaSiWa和vace跳舞
19
@梦影Erislia
134
276H
更新时间2026-01-22
Comfy二次元跑图生视频DaSiWa和vace跳舞
Comfy二次元跑图生视频DaSiWa和vace跳舞
0/小时
语音识别
SenseVoice多语言语音识别情感识别系统  二次开发构建by科哥
SenseVoice多语言语音识别情感识别系统 二次开发构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
6
1H
更新时间2026-01-22
支持自启动
SenseVoice多语言语音识别情感识别系统 二次开发构建by科哥
SenseVoice多语言语音识别情感识别系统 二次开发构建by科哥
0/小时
语音识别
FunASR中文语音识别音频转文本声音转文本系统 二次webui开发构建by科哥
FunASR中文语音识别音频转文本声音转文本系统 二次webui开发构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
17
7H
更新时间2026-01-23
支持自启动
音频声音识别系统
音频声音识别系统
0/小时
语音分离
SAM Audio一个Meta开源的音频分割模型声音分离音频音乐分离应用 二次开发构建by科哥
SAM Audio一个Meta开源的音频分割模型声音分离音频音乐分离应用 二次开发构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
31
30H
更新时间2026-01-28
支持自启动
可从复杂的音频混合中分离出特定的声音
可从复杂的音频混合中分离出特定的声音
0/小时
图片编辑
UNet Universal Matting基于UNet模型抠图批量抠图 webUI一键抠图 构建by科哥
UNet Universal Matting基于UNet模型抠图批量抠图 webUI一键抠图 构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
12
34H
更新时间2026-01-23
支持自启动
基于UNet模型抠图批量抠图 webUI一键抠图 构建by科哥
基于UNet模型抠图批量抠图 webUI一键抠图 构建by科哥
0/小时
ComfyUI
ComfyUI_最新26年01月-Niugee-牛哥整合包-V2
ComfyUI_最新26年01月-Niugee-牛哥整合包-V2
20
@NiuGee
NiuGee认证作者
228
497H
更新时间2026-01-08
整合26年最新版本ComfyUI,已下载好常用图像模型,修改端口到7860方便管理界面一键启动
整合26年最新版本ComfyUI,已下载好常用图像模型,修改端口到7860方便管理界面一键启动
0/小时
视频生成
最强AI生成长视频,Wan2.2-SVI2Pro整合包!一次性生成一分钟视频,一次性生成30s分镜视频!
最强AI生成长视频,Wan2.2-SVI2Pro整合包!一次性生成一分钟视频,一次性生成30s分镜视频!
43
@与AI同行
与AI同行认证作者
311
1210H
更新时间2026-03-31
支持自启动
最强AI生成长视频,Wan2.2-SVI2Pro整合包!一次性生成一分钟视频,一次性生成30s分镜视频!
最强AI生成长视频,Wan2.2-SVI2Pro整合包!一次性生成一分钟视频,一次性生成30s分镜视频!
0/小时
ComfyUI
ComfyUI云端整合包2601
ComfyUI云端整合包2601
7
@鹄仙
鹄仙认证作者
65
345H
更新时间2026-01-23
长视频系列升级 不仅仅是SVI2 pro 长视频、LongCat数字人
长视频系列升级 不仅仅是SVI2 pro 长视频、LongCat数字人
0/小时
Qwen-ImageLora训练图片生成
Qwen 2512的Lora训练,内置模型,一键训练AI-Toolkit
Qwen 2512的Lora训练,内置模型,一键训练AI-Toolkit
7
@梦影Erislia
75
395H
更新时间2026-01-23
Qwen 2512的Lora训练,内置模型,一键训练AI-Toolkit
Qwen 2512的Lora训练,内置模型,一键训练AI-Toolkit
0/小时
AI应用
banana-slides基于谷歌人工智能ai制作幻灯片ai制作ppt制作幻灯片 构建by科哥
banana-slides基于谷歌人工智能ai制作幻灯片ai制作ppt制作幻灯片 构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
15
4H
更新时间2026-01-23
支持自启动
banana-slides基于谷歌人工智能ai制作幻灯片ai制作ppt制作幻灯片 构建by科哥
banana-slides基于谷歌人工智能ai制作幻灯片ai制作ppt制作幻灯片 构建by科哥
0/小时
Qwen-Image图片生成ComfyUI
Qwen-Image-2512模型_QwenVL3反推_SeedVR2放大多合一
Qwen-Image-2512模型_QwenVL3反推_SeedVR2放大多合一
5
@社恐的知识树
社恐的知识树认证作者
72
136H
更新时间2026-01-03
集成千问图像2512模型+QwenVL3图像视频反推API+最强放大SeedVR2多合一工作流,Comfyui-v0.7.0
集成千问图像2512模型+QwenVL3图像视频反推API+最强放大SeedVR2多合一工作流,Comfyui-v0.7.0
0/小时
AI电商
magic-tryon图片视频虚拟试装换装模特换衣 二次webui开发构建by科哥
magic-tryon图片视频虚拟试装换装模特换衣 二次webui开发构建by科哥
3
@科哥AIGC
科哥AIGC认证作者
33
2H
更新时间2026-01-26
支持自启动
magic-tryon图片视频虚拟试装换装模特换衣
magic-tryon图片视频虚拟试装换装模特换衣
0/小时
AI应用
图文创作神器一句话一张图片生成小红书图文 构建by科哥
图文创作神器一句话一张图片生成小红书图文 构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
6
4H
更新时间2026-01-26
支持自启动
图文创作神器一句话一张图片生成小红书图文
图文创作神器一句话一张图片生成小红书图文
0/小时
Qwen-Image图片生成
阿里千问开源Qwen-Image-2512图像生成模型 二次开发构建by科哥
阿里千问开源Qwen-Image-2512图像生成模型 二次开发构建by科哥
3
@科哥AIGC
科哥AIGC认证作者
12
6H
更新时间2026-01-26
支持自启动
需要80gb显存运行该项目
需要80gb显存运行该项目
0/小时
物理模拟分子动力
gromacs_deepmd机器学习训练水分子力场
gromacs_deepmd机器学习训练水分子力场
0
@tty
12
303H
更新时间2026-01-26
内含deepmd机器学习力场训练水分子,gromacs调用运行例子
内含deepmd机器学习力场训练水分子,gromacs调用运行例子
0/小时
物理模拟分子动力
deepmd_lammps训练和运行镜像
deepmd_lammps训练和运行镜像
0
@tty
13
80H
更新时间2026-01-26
内含ch4简单例子,也可用来训练自己的模型,3080ti版本
内含ch4简单例子,也可用来训练自己的模型,3080ti版本
0/小时
混元
HY-Motion1.0腾讯混元开源的文本到3D动作生成模型 汉化构建by科哥
HY-Motion1.0腾讯混元开源的文本到3D动作生成模型 汉化构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
6
21H
更新时间2026-01-26
HY-Motion1.0腾讯混元开源的文本到3D动作生成模型 汉化构建by科哥
HY-Motion1.0腾讯混元开源的文本到3D动作生成模型 汉化构建by科哥
0/小时
Wan视频编辑
wan2.1-scail动作迁移
wan2.1-scail动作迁移
19
@匹夫
匹夫认证作者
178
304H
更新时间2026-01-26
wan2.1-scail动作迁移
wan2.1-scail动作迁移
0/小时
Qwen-Image图片生成
Qwen‑Image‑Edit‑2511-LoRA训练 x AI Toolkit
Qwen‑Image‑Edit‑2511-LoRA训练 x AI Toolkit
6
@AI-KSK
AI-KSK认证作者
94
694H
更新时间2026-01-01
这是一个集成了 Qwen-Image-Edit-2511模型与 AI Toolkit 训练框架的预配置环境,旨在支持用户高效微调出具备精准图像编辑、风格迁移及多主体一致性能力的定制化 LoRA 模型。
这是一个集成了 Qwen-Image-Edit-2511模型与 AI Toolkit 训练框架的预配置环境,旨在支持用户高效微调出具备精准图像编辑、风格迁移及多主体一致性能力的定制化 LoRA 模型。
0/小时
语音合成
 ChatterBox多语言语音合成语言克隆声音克隆 webui二次开发构建by科哥
ChatterBox多语言语音合成语言克隆声音克隆 webui二次开发构建by科哥
4
@科哥AIGC
科哥AIGC认证作者
30
11H
更新时间2026-01-26
支持自启动
支持23个国家的语言声音克隆
支持23个国家的语言声音克隆
0/小时
数字人
LatentSync 1.6 纯净版
LatentSync 1.6 纯净版
3
@knzskl
21
21H
更新时间2026-01-26
字节跳动、北京交通大学联合推出的端到端唇形同步框架。Latent Sync利用稳定扩散和TREPA的力量,为动态和逼真的视频生成提供精确的高分辨率唇形同步。
字节跳动、北京交通大学联合推出的端到端唇形同步框架。Latent Sync利用稳定扩散和TREPA的力量,为动态和逼真的视频生成提供精确的高分辨率唇形同步。
0/小时
SDLora训练
SDXL及系列衍生模型训练,内置WD打标编辑,任意C站模型导入,小白也能轻松上手,AI-Toolkit
SDXL及系列衍生模型训练,内置WD打标编辑,任意C站模型导入,小白也能轻松上手,AI-Toolkit
50
@梦影Erislia
756
5110H
更新时间2025-12-30
SDXL及系列衍生模型训练,内置WD打标编辑,任意C站模型导入,小白也能轻松上手,AI-Toolkit
SDXL及系列衍生模型训练,内置WD打标编辑,任意C站模型导入,小白也能轻松上手,AI-Toolkit
0/小时
视频生成图片生成ComfyUI
启梦光影高质量出图二合一
启梦光影高质量出图二合一
1
@麦子AI
30
71H
更新时间2026-01-28
支持自启动
高质量文生图、图生视频。只适配40系显卡
高质量文生图、图生视频。只适配40系显卡
0.15/小时
Wan视频编辑
StoryMem基于wan2.2逐镜脚本生成高连贯电影级1分钟多镜头叙事视频 二次开发构建by科哥
StoryMem基于wan2.2逐镜脚本生成高连贯电影级1分钟多镜头叙事视频 二次开发构建by科哥
8
@科哥AIGC
科哥AIGC认证作者
34
18H
更新时间2026-01-27
支持自启动
StoryMem基于wan2.2逐镜脚本生成高连贯电影级1分钟多镜头叙事视频 二次开发构建by科哥
StoryMem基于wan2.2逐镜脚本生成高连贯电影级1分钟多镜头叙事视频 二次开发构建by科哥
0/小时
ComfyUI
ComfyUI学习版_torch_2.8.0
ComfyUI学习版_torch_2.8.0
6
@智绘Store
智绘Store认证作者
44
113H
更新时间2026-03-17
支持自启动
此版本镜像,5090、4090、3090、3080Ti等系列显卡可用,P40显卡不可用
此版本镜像,5090、4090、3090、3080Ti等系列显卡可用,P40显卡不可用
0/小时
ComfyUI
ComfyUI学习版镜像_torch-2.7.1
ComfyUI学习版镜像_torch-2.7.1
10
@智绘Store
智绘Store认证作者
26
96H
更新时间2026-03-17
支持自启动
ComfyUI学习版镜像_torch-2.7.1,高性价比镜像,可开P40显卡,5090显卡勿用,会报错
ComfyUI学习版镜像_torch-2.7.1,高性价比镜像,可开P40显卡,5090显卡勿用,会报错
0/小时
Qwen-Image
qwen-image工作流合集edit2511-z-image-turbo
qwen-image工作流合集edit2511-z-image-turbo
8
@匹夫
匹夫认证作者
79
151H
更新时间2026-01-27
qwen-image工作流合集
qwen-image工作流合集
0/小时
语音合成
VoxCPM1.5面壁智能开源的端到端语音合成模型附训练lora训练器 构建by科哥
VoxCPM1.5面壁智能开源的端到端语音合成模型附训练lora训练器 构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
24
23H
更新时间2026-01-27
支持自启动
语音合成模型+训练lora训练器
语音合成模型+训练lora训练器
0/小时
Qwen-ImageLora训练图片生成
Qwen-2511和Z图像的Lora训练AI-TOOLKIT
Qwen-2511和Z图像的Lora训练AI-TOOLKIT
6
@梦影Erislia
43
264H
更新时间2026-01-27
Qwen-2511和Z图像的Lora训练AI-TOOLKIT
Qwen-2511和Z图像的Lora训练AI-TOOLKIT
0/小时
Wan视频生成
Egox任意视频一键转第一人称视角视频基于wan2.1模型 webui二次开发构建by科哥
Egox任意视频一键转第一人称视角视频基于wan2.1模型 webui二次开发构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
9
8H
更新时间2026-01-27
支持自启动
将任意视频一键转第一人称视角视频
将任意视频一键转第一人称视角视频
0/小时
视频生成图片生成ComfyUI
启梦光影VIP快速出图二合一
启梦光影VIP快速出图二合一
1
@麦子AI
7
155H
更新时间2026-01-27
支持自启动
2s出图,超级快。注意!本镜像需要部署在50系列显卡上。
2s出图,超级快。注意!本镜像需要部署在50系列显卡上。
0.15/小时
数字人
One-to-All-Animation单图片转换动画视频数字人视频动作模仿器 构建by科哥
One-to-All-Animation单图片转换动画视频数字人视频动作模仿器 构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
6
4H
更新时间2026-01-27
支持自启动
单图片转换动画视频数字人视频动作模仿器
单图片转换动画视频数字人视频动作模仿器
0/小时
数字人
personaLive实时数字人系统
personaLive实时数字人系统
10
@有趣的80后程序员
有趣的80后程序员认证作者
71
195H
更新时间2025-12-27
支持自启动
实时数字人系统,直播室直接生成分身,低延迟
实时数字人系统,直播室直接生成分身,低延迟
0/小时
Qwen-Image图片生成
Qwen-Image-Edit-2511阿里通义推出的全能图像编辑模型 webui二次修改构建by科哥
Qwen-Image-Edit-2511阿里通义推出的全能图像编辑模型 webui二次修改构建by科哥
4
@科哥AIGC
科哥AIGC认证作者
63
1107H
更新时间2026-01-27
支持自启动
图片编辑模型 一致性更加好 中文支持更好
图片编辑模型 一致性更加好 中文支持更好
0/小时
语音克隆语音合成
超强AI音色克隆,VoxCPM-V1.5,支持超长文本生成、批量生成,支持音色保存、多音字修改、语速调节,速度超快!
超强AI音色克隆,VoxCPM-V1.5,支持超长文本生成、批量生成,支持音色保存、多音字修改、语速调节,速度超快!
21
@与AI同行
与AI同行认证作者
244
225H
更新时间2026-03-31
支持自启动
超强AI音色克隆,VoxCPM-V1.5,支持超长文本生成、批量生成,支持音色保存、多音字修改、语速调节,速度超快!
超强AI音色克隆,VoxCPM-V1.5,支持超长文本生成、批量生成,支持音色保存、多音字修改、语速调节,速度超快!
0/小时
ComfyUIWanQwen-Image
2025.12全新模型ComfyUI整合包
2025.12全新模型ComfyUI整合包
15
@老徐Ai研习社
老徐Ai研习社认证作者
116
459H
更新时间2025-12-26
支持自启动
ComfyUI2025.12整合包
ComfyUI2025.12整合包
0/小时
ComfyUI
ComfyUI云端整合包2512
ComfyUI云端整合包2512
14
@鹄仙
鹄仙认证作者
67
1429H
更新时间2026-01-27
ComfyUI云端整合包2512 支持Z-Image 混元1.5,新增到63个插件,带文件管理系统
ComfyUI云端整合包2512 支持Z-Image 混元1.5,新增到63个插件,带文件管理系统
0/小时
Qwen-Image视频编辑
千问2511与动作迁移三剑客
千问2511与动作迁移三剑客
3
@鹄仙
鹄仙认证作者
16
32H
更新时间2025-12-27
一个基于Wan2GP的图像编辑与动作迁移视频生成的WebUI项目
一个基于Wan2GP的图像编辑与动作迁移视频生成的WebUI项目
0/小时
Wan视频生成ComfyUI
TurboDiffusion 100–200×加速ComfyUI-Wan图到视频生成
TurboDiffusion 100–200×加速ComfyUI-Wan图到视频生成
11
@AI-KSK
AI-KSK认证作者
124
340H
更新时间2025-12-25
这是一个超快的AI视频生成工具,1分钟就能把图片变成短视频,速度是普通AI的200倍。
这是一个超快的AI视频生成工具,1分钟就能把图片变成短视频,速度是普通AI的200倍。
0/小时
语音合成
VoxCPM1.5雨落版整合包
VoxCPM1.5雨落版整合包
6
@雨落实战
雨落实战认证作者
72
154H
更新时间2025-12-24
支持自启动
VoxCPM1.5的雨落版整合包
VoxCPM1.5的雨落版整合包
0/小时
AI应用图片生成
PromptFill专为AI绘画设计的开源结构化提示词生成工具 构建by科哥
PromptFill专为AI绘画设计的开源结构化提示词生成工具 构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
6
0H
更新时间2026-01-27
支持自启动
专为AI绘画设计的开源结构化提示词生成工具
专为AI绘画设计的开源结构化提示词生成工具
0/小时
LongCat数字人
最强长视频数字人:LongCat-Avatar尝鲜版,其他热门生图、视频也都备好了!
最强长视频数字人:LongCat-Avatar尝鲜版,其他热门生图、视频也都备好了!
13
@老许爱吃肉丶
52
157H
更新时间2026-01-27
支持自启动
最强长视频数字人:LongCat-Avatar尝鲜版,其他热门生图、视频也都备好了!
最强长视频数字人:LongCat-Avatar尝鲜版,其他热门生图、视频也都备好了!
0.2/小时
LongCat数字人
SOTA级音频驱动数字人-LongCat-Video-Avatar
SOTA级音频驱动数字人-LongCat-Video-Avatar
10
@AI-KSK
AI-KSK认证作者
52
55H
更新时间2026-01-27
实现身份永续、动作自然的数字人生成
实现身份永续、动作自然的数字人生成
0/小时
视频生成数字人
AI数字人LongCatAvatar,超强口型+表情+姿势效果,支持长视频!
AI数字人LongCatAvatar,超强口型+表情+姿势效果,支持长视频!
48
@与AI同行
与AI同行认证作者
327
281H
更新时间2026-03-31
支持自启动
AI数字人LongCatAvatar,超强口型+表情+姿势效果,支持长视频!
AI数字人LongCatAvatar,超强口型+表情+姿势效果,支持长视频!
0/小时
3D生成
SHARP–苹果开源的3D场景生成AI模型图片转3d模型 二次开发构建by科哥
SHARP–苹果开源的3D场景生成AI模型图片转3d模型 二次开发构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
23
540H
更新时间2026-01-27
支持自启动
SHARP–苹果开源的3D场景生成AI模型图片转3d模型
SHARP–苹果开源的3D场景生成AI模型图片转3d模型
0/小时
GLM语音识别
GLM-ASR智谱开源的语音识别、语音转文本模型  二次开发构建By科哥
GLM-ASR智谱开源的语音识别、语音转文本模型 二次开发构建By科哥
0
@科哥AIGC
科哥AIGC认证作者
4
1H
更新时间2026-01-27
支持自启动
智谱开源的语音识别语音转文本声音转文本模型
智谱开源的语音识别语音转文本声音转文本模型
0/小时
分子动力生物信息
Rosetta
Rosetta
1
@苍耳阿猫
苍耳阿猫认证作者
2
1H
更新时间2025-12-23
Rosetta
Rosetta
0/小时
AI应用视频生成
Pixelle-Video|一句话生成短视频
Pixelle-Video|一句话生成短视频
5
@科哥AIGC
科哥AIGC认证作者
19
5H
更新时间2026-02-03
支持自启动
零门槛,零剪辑经验,让视频创作成为一句话的事
零门槛,零剪辑经验,让视频创作成为一句话的事
0/小时
其他
ai小说ai在线写作系统ai智能写作系统 构建by科哥
ai小说ai在线写作系统ai智能写作系统 构建by科哥
5
@科哥AIGC
科哥AIGC认证作者
18
44H
更新时间2026-01-28
支持自启动
ai小说ai在线写作系统ai智能写作系统
ai小说ai在线写作系统ai智能写作系统
0/小时
Lora训练
ai-toolkit炼丹炉,支持多种常见模型训练,内置多种模型
ai-toolkit炼丹炉,支持多种常见模型训练,内置多种模型
3
@MumuOpenK
62
444H
更新时间2026-01-29
支持自启动
ai-toolkit炼丹炉(汉化版)
ai-toolkit炼丹炉(汉化版)
0.1/小时
语音合成GLM
智谱开源的AI文本转语音模型支持声音克隆GLM-TTS 语音合成系统 二次开发构建by科哥
智谱开源的AI文本转语音模型支持声音克隆GLM-TTS 语音合成系统 二次开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
28
13H
更新时间2026-01-27
支持自启动
智谱开源的AI文本转语音模型支持声音克隆GLM-TTS 语音合成系统 二次开发构建by科哥
智谱开源的AI文本转语音模型支持声音克隆GLM-TTS 语音合成系统 二次开发构建by科哥
0/小时
ComfyUIQwen-Image图片生成
Twinflow双流加速千问生图1秒1张
Twinflow双流加速千问生图1秒1张
5
@smthem
19
14H
更新时间2025-12-20
支持自启动
最快千问生图方法,顶配1秒1张
最快千问生图方法,顶配1秒1张
0/小时
AI应用
next-ai-draw-io
next-ai-draw-io
0
@苍耳阿猫
苍耳阿猫认证作者
0
0H
更新时间2025-12-19
next-ai-draw-io
next-ai-draw-io
0/小时
3D生成ComfyUI
Trellis2代一键图片生成3D模型
Trellis2代一键图片生成3D模型
8
@smthem
144
258H
更新时间2025-12-19
支持自启动
一键图片生成3D模型,输出glb和obj格式,带贴图和法线,自动脱底
一键图片生成3D模型,输出glb和obj格式,带贴图和法线,自动脱底
0/小时
Wan视频生成ComfyUI
TurboDiffusion-ultra-fast-wan
TurboDiffusion-ultra-fast-wan
6
@有趣的80后程序员
有趣的80后程序员认证作者
67
106H
更新时间2025-12-18
让阿里wan模型的视频生成速度提升200倍
让阿里wan模型的视频生成速度提升200倍
0/小时
语音合成
cosyvoce3阿里最新开源声音克隆应用普通话粤语英语日语方言更加精准情感丰富 二次开发构建By科哥
cosyvoce3阿里最新开源声音克隆应用普通话粤语英语日语方言更加精准情感丰富 二次开发构建By科哥
6
@科哥AIGC
科哥AIGC认证作者
55
57H
更新时间2026-01-28
支持自启动
cosyvoce3阿里最新开源声音克隆应用普通话粤语英语日语方言更加精准情感丰富 二次开发构建By科哥
cosyvoce3阿里最新开源声音克隆应用普通话粤语英语日语方言更加精准情感丰富 二次开发构建By科哥
0/小时
分子动力
cp2k
cp2k
0
@苍耳阿猫
苍耳阿猫认证作者
4
14H
更新时间2025-12-18
cp2k-v2025.2
cp2k-v2025.2
0/小时
语音合成
CosyVoice3,多音字控制,音色保存,接口API调用,流式接口,音频降噪
CosyVoice3,多音字控制,音色保存,接口API调用,流式接口,音频降噪
14
@刘悦的技术博客
刘悦的技术博客认证作者
287
4505H
更新时间2026-01-28
支持自启动
CosyVoice3,多音字控制,音色保存,接口API调用,流式接口,音频降噪
CosyVoice3,多音字控制,音色保存,接口API调用,流式接口,音频降噪
0/小时
ComfyUIAI电商
电商换装到视频-全流程
电商换装到视频-全流程
15
@积木comfyui
121
126H
更新时间2026-01-28
支持自启动
换装-换模特-换姿势-换背景-打光-放大-模特图生视频-全流程
换装-换模特-换姿势-换背景-打光-放大-模特图生视频-全流程
0/小时
文本模型
Nemotron3
Nemotron3
0
@敢敢のwings
敢敢のwings认证作者
0
0H
更新时间2025-12-18
Nemotron 3系列是NVIDIA推出的开放模型家族,包含开放权重、训练数据和训练配方,旨在为构建专业化AI智能体提供领先的效率和准确性。
Nemotron 3系列是NVIDIA推出的开放模型家族,包含开放权重、训练数据和训练配方,旨在为构建专业化AI智能体提供领先的效率和准确性。
0/小时
分子动力
DeePMD-kit
DeePMD-kit
0
@苍耳阿猫
苍耳阿猫认证作者
4
4H
更新时间2025-12-16
DeePMD-kit-v3.1.2
DeePMD-kit-v3.1.2
0/小时
分子动力
LAMMPS
LAMMPS
0
@苍耳阿猫
苍耳阿猫认证作者
24
242H
更新时间2025-12-16
lammps
lammps
0/小时
Wan视频生成数字人
LiveAvatar
LiveAvatar
9
@十字鱼
十字鱼认证作者
24
20H
更新时间2026-01-28
支持自启动
流式实时音频驱动头像生成,无限长度
流式实时音频驱动头像生成,无限长度
0/小时
AI应用
AI命理预测系统ai算命系统ai大模型算命系统 二次开发构建by科哥
AI命理预测系统ai算命系统ai大模型算命系统 二次开发构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
17
39H
更新时间2026-01-28
使用最新的ai大模型结合中国传统命理系统开发 可以无卡模式运行这个项目
使用最新的ai大模型结合中国传统命理系统开发 可以无卡模式运行这个项目
0/小时
OCR识别
PaddleOCR-VL
PaddleOCR-VL
20
@十字鱼
十字鱼认证作者
127
468H
更新时间2026-01-28
支持自启动
支持 109 种语言 擅长识别文本、表格、公式和图表
支持 109 种语言 擅长识别文本、表格、公式和图表
0/小时
语音合成GLM
GLM-TTS
GLM-TTS
7
@十字鱼
十字鱼认证作者
40
1201H
更新时间2026-01-28
支持自启动
可控且富有情感表达的零样本TTS
可控且富有情感表达的零样本TTS
0/小时
数字人
知鱼-焕焕镜像
知鱼-焕焕镜像
1
@
9
140H
更新时间2026-01-28
支持自启动
数字人视频生成/Digital Human Video Generation
数字人视频生成/Digital Human Video Generation
0/小时
GLMAI应用
Open-AutoGLM
Open-AutoGLM
0
@敢敢のwings
敢敢のwings认证作者
1
1H
更新时间2025-12-13
支持自启动
Open-AutoGLM是由智谱AI在2024年10月推出的开源手机操作智能体框架
Open-AutoGLM是由智谱AI在2024年10月推出的开源手机操作智能体框架
0/小时
GLMAI应用
AutoGLM-Phone-9B
AutoGLM-Phone-9B
0
@Ikaros
8
14H
更新时间2025-12-12
支持自启动
AutoGLM-Phone-9B一键启动镜像
AutoGLM-Phone-9B一键启动镜像
0/小时
Wan视频生成
Wan2.2-14B加速版TTP图片放大ttp加速插画图片放大图片高清图片细节放大 科哥构建
Wan2.2-14B加速版TTP图片放大ttp加速插画图片放大图片高清图片细节放大 科哥构建
4
@科哥AIGC
科哥AIGC认证作者
30
79H
更新时间2026-01-28
支持自启动
专注图片细节放大工作流
专注图片细节放大工作流
0/小时
LongCat图片生成图片编辑
LongCat-Image
LongCat-Image
4
@十字鱼
十字鱼认证作者
21
6H
更新时间2025-12-09
支持自启动
美团龙猫开源图像模型,包含LongCat-Image文生图和LongCat-Image-Edit图像编辑
美团龙猫开源图像模型,包含LongCat-Image文生图和LongCat-Image-Edit图像编辑
0/小时
Z-ImageLora训练
z-image-turbo lora炼丹炉ai-toolkit lora模型训练器
z-image-turbo lora炼丹炉ai-toolkit lora模型训练器
40
@老徐Ai研习社
老徐Ai研习社认证作者
564
5493H
更新时间2026-01-22
支持自启动
z-image-turbo lora炼丹炉ai-toolkit lora模型训练器
z-image-turbo lora炼丹炉ai-toolkit lora模型训练器
0/小时
数字人
Heygem数字人视频生成系统批量版webui版 二次开发构建by科哥
Heygem数字人视频生成系统批量版webui版 二次开发构建by科哥
13
@科哥AIGC
科哥AIGC认证作者
229
672H
更新时间2026-01-28
支持自启动
一键批量生成 一键打包下载视频
一键批量生成 一键打包下载视频
0/小时
OCR识别
PaddleOCR在线webui文字文稿识别多种识别pdf文字识别 二次开发构建by科哥
PaddleOCR在线webui文字文稿识别多种识别pdf文字识别 二次开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
20
38H
更新时间2026-01-30
支持自启动
PaddleOCR在线webui文字文稿识别多种识别pdf文字识别 二次开发构建by科哥
PaddleOCR在线webui文字文稿识别多种识别pdf文字识别 二次开发构建by科哥
0/小时
LongCat图片生成图片编辑
LongCat:双语超强图像生成与编辑,引领写实与精准创作新标准。
LongCat:双语超强图像生成与编辑,引领写实与精准创作新标准。
1
@AI-KSK
AI-KSK认证作者
6
0H
更新时间2025-12-08
LongCat 是美团开源的双语图像生成与编辑模型,具备高效写实表现、强中文渲染与精准一致性编辑能力,在开源领域表现领先。
LongCat 是美团开源的双语图像生成与编辑模型,具备高效写实表现、强中文渲染与精准一致性编辑能力,在开源领域表现领先。
0/小时
语音合成
VoxCPM
VoxCPM
5
@十字鱼
十字鱼认证作者
40
49H
更新时间2025-12-08
支持自启动
面壁智能开源语音克隆 全新1.5版本
面壁智能开源语音克隆 全新1.5版本
0/小时
语音合成
VoxCPM 1.5B
VoxCPM 1.5B
2
@鹄仙
鹄仙认证作者
64
120H
更新时间2025-12-07
全新VoxCPM1.5B,增强长音频输出稳定性
全新VoxCPM1.5B,增强长音频输出稳定性
0/小时
视频编辑
facefusion3.5.1离线全部模型最新TensorRT加速官方原版图片换脸视频换脸高清图片 构建By科哥
facefusion3.5.1离线全部模型最新TensorRT加速官方原版图片换脸视频换脸高清图片 构建By科哥
25
@科哥AIGC
科哥AIGC认证作者
348
1447H
更新时间2026-01-30
支持自启动
facefusion3.5.0离线全部模型最新TensorRT加速官方原版图片换脸视频换脸高清图片 构建By科哥
facefusion3.5.0离线全部模型最新TensorRT加速官方原版图片换脸视频换脸高清图片 构建By科哥
0/小时
语音合成
VibeVoice语音合成系统二次webui开发构建by科哥
VibeVoice语音合成系统二次webui开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
8
0H
更新时间2026-01-29
支持自启动
基于微软 VibeVoice 的实时语音合成
基于微软 VibeVoice 的实时语音合成
0/小时
Qwen-Image图片编辑Lora训练
Qwen-Edit 2509的Lora训练AI-toolkit
Qwen-Edit 2509的Lora训练AI-toolkit
3
@梦影Erislia
34
231H
更新时间2026-01-29
Qwen-Edit 2509,qwen-edit和z-image的Lora训练DiffusionPipe
Qwen-Edit 2509,qwen-edit和z-image的Lora训练DiffusionPipe
0/小时
数字人
Imtalker
Imtalker
2
@有趣的80后程序员
有趣的80后程序员认证作者
28
28H
更新时间2026-01-29
支持自启动
语音驱动数字人、支持生成超长语音
语音驱动数字人、支持生成超长语音
0/小时
视频生成
最新视频动作迁移,SteadyDancer,南京大学&腾讯开源!
最新视频动作迁移,SteadyDancer,南京大学&腾讯开源!
45
@与AI同行
与AI同行认证作者
362
526H
更新时间2026-03-31
支持自启动
最新视频动作迁移,SteadyDancer整合包!南京大学&腾讯开源,支持视频动作迁移,支持长视频、批量队列生成、高清放大
最新视频动作迁移,SteadyDancer整合包!南京大学&腾讯开源,支持视频动作迁移,支持长视频、批量队列生成、高清放大
0/小时
目标检测图像分割
SAM3 常见使用案例大全
SAM3 常见使用案例大全
0
@敢敢のwings
敢敢のwings认证作者
16
19H
更新时间2026-01-29
SAM 3提出的PCS任务从根本上突破了这一限制,模型需要检测、分割并追踪输入图像或视频中所有符合该概念的实例。
SAM 3提出的PCS任务从根本上突破了这一限制,模型需要检测、分割并追踪输入图像或视频中所有符合该概念的实例。
0/小时
数字人
Fay数字人-3.1.1
Fay数字人-3.1.1
3
@郭泽斌
郭泽斌认证作者
226
666H
更新时间2025-12-05
Fay数字人3.1.1最小可运行版。fay是一个帮助数字人(2.5d、3d、移动、pc、网页)或大语言模型(openai兼容、deepseek)连通业务系统的mcp框架。
Fay数字人3.1.1最小可运行版。fay是一个帮助数字人(2.5d、3d、移动、pc、网页)或大语言模型(openai兼容、deepseek)连通业务系统的mcp框架。
0/小时
ComfyUI视频生成图片生成
娱乐AI,唱歌跳舞,一应俱全
娱乐AI,唱歌跳舞,一应俱全
7
@老猫本猫
85
190H
更新时间2026-01-29
支持自启动
娱乐AI,唱歌跳舞,一应俱全
娱乐AI,唱歌跳舞,一应俱全
0/小时
ComfyUI图片编辑AI电商
人物,商品,背景,随心所欲替换。
人物,商品,背景,随心所欲替换。
27
@老猫本猫
317
387H
更新时间2026-01-29
支持自启动
人物,商品,背景,随心所欲替换。
人物,商品,背景,随心所欲替换。
0/小时
视频编辑
长视频SteadyDancer动作迁移
长视频SteadyDancer动作迁移
38
@ifelse
276
392H
更新时间2025-12-05
支持自启动
去闪长视频SteadyDancer动作迁移
去闪长视频SteadyDancer动作迁移
0/小时
图片生成
Ovis-Image阿里开源文本生图像大模型在线webui体验版 构建二次开发by科哥
Ovis-Image阿里开源文本生图像大模型在线webui体验版 构建二次开发by科哥
1
@科哥AIGC
科哥AIGC认证作者
6
1H
更新时间2025-12-05
支持自启动
Ovis-Image阿里开源文本生图像大模型在线webui体验版
Ovis-Image阿里开源文本生图像大模型在线webui体验版
0/小时
视频生成
UltraVideo生成高质量超高清1k到4K视频 webUI二次开发构建By科哥
UltraVideo生成高质量超高清1k到4K视频 webUI二次开发构建By科哥
3
@科哥AIGC
科哥AIGC认证作者
23
15H
更新时间2025-12-05
基于wan2.1UltraVideo生成高质量超高清1k到4K视频
基于wan2.1UltraVideo生成高质量超高清1k到4K视频
0/小时
推理框架
vLLM-Omni
vLLM-Omni
1
@敢敢のwings
敢敢のwings认证作者
6
11H
更新时间2026-01-29
vLLM项目团队推出了vLLM-Omni框架,这是一个专门为全模态模型设计的高性能推理系统,旨在将vLLM在文本推理领域积累的性能优势,扩展到包含图像、音频、视频在内的完整多模态生态。
vLLM项目团队推出了vLLM-Omni框架,这是一个专门为全模态模型设计的高性能推理系统,旨在将vLLM在文本推理领域积累的性能优势,扩展到包含图像、音频、视频在内的完整多模态生态。
0/小时
图片生成
超强AI图片ZImage-支持批量生成、SeedVR2高清放大
超强AI图片ZImage-支持批量生成、SeedVR2高清放大
76
@与AI同行
与AI同行认证作者
936
2358H
更新时间2026-03-31
支持自启动
阿里ZImageTurbo图片生成整合包,图片真实感、细节全面提升,支持批量生成、SeedVR2高清放大,支持NSFW, 最低6G显存可用!
阿里ZImageTurbo图片生成整合包,图片真实感、细节全面提升,支持批量生成、SeedVR2高清放大,支持NSFW, 最低6G显存可用!
0/小时
其他
MetaGR
MetaGR
0
@Anaconda
2
72H
更新时间2026-01-29
Meta的生成式推荐论文开源仓库的实现。
Meta的生成式推荐论文开源仓库的实现。
0/小时
Z-ImageLora训练
Z-Image-Turbo LoRA训练-AI Toolkit-极致风格化
Z-Image-Turbo LoRA训练-AI Toolkit-极致风格化
7
@AI-KSK
AI-KSK认证作者
175
1980H
更新时间2025-12-04
支持 Z-Image-Turbo LoRA 快速训练的 AI Toolkit 镜像
支持 Z-Image-Turbo LoRA 快速训练的 AI Toolkit 镜像
0/小时
IndexTTS语音合成
IndexTTS2整合包雨落版
IndexTTS2整合包雨落版
137
@雨落实战
雨落实战认证作者
2106
10711H
更新时间2025-12-03
支持自启动
IndexTTS2.0整合包雨落版本,欢迎使用
IndexTTS2.0整合包雨落版本,欢迎使用
0/小时
视频编辑
SteadyDancer-FP8量化,视频动作迁移,支持5090新卡,支持A800计算卡,基于Comfyui,workflow,工作流,批量任务
SteadyDancer-FP8量化,视频动作迁移,支持5090新卡,支持A800计算卡,基于Comfyui,workflow,工作流,批量任务
13
@刘悦的技术博客
刘悦的技术博客认证作者
108
110H
更新时间2026-01-29
支持自启动
SteadyDancer-FP8量化,视频动作迁移,支持5090新卡,支持A800计算卡,基于Comfyui,workflow,工作流,批量任务
SteadyDancer-FP8量化,视频动作迁移,支持5090新卡,支持A800计算卡,基于Comfyui,workflow,工作流,批量任务
0/小时
Z-ImageLora训练
Z-image Lora训练,小白也能轻松上手,AI-toolkit
Z-image Lora训练,小白也能轻松上手,AI-toolkit
31
@梦影Erislia
364
3777H
更新时间2026-01-29
Z-image Lora训练,小白也能轻松上手,AI-toolkit
Z-image Lora训练,小白也能轻松上手,AI-toolkit
0/小时
图片生成
AI艺术二维码生成器在线生成个性二维码 二次开发构建by科哥
AI艺术二维码生成器在线生成个性二维码 二次开发构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
0
0H
更新时间2026-01-29
支持自启动
AI艺术二维码生成器在线生成个性二维码
AI艺术二维码生成器在线生成个性二维码
0/小时
Z-Image图片生成
Z-Image-Turbo-GGUF,局部重绘,文生图,图生图,Qwen3-vl自动提示词,支持5090新卡,支持A800,批量任务队列
Z-Image-Turbo-GGUF,局部重绘,文生图,图生图,Qwen3-vl自动提示词,支持5090新卡,支持A800,批量任务队列
17
@刘悦的技术博客
刘悦的技术博客认证作者
202
151H
更新时间2026-01-29
支持自启动
Z-Image-Turbo-GGUF,局部重绘,文生图,图生图,Qwen3-vl自动提示词,支持5090新卡,支持A800,批量任务队列
Z-Image-Turbo-GGUF,局部重绘,文生图,图生图,Qwen3-vl自动提示词,支持5090新卡,支持A800,批量任务队列
0/小时
Qwen-Image
Qwen-Image的Lora训练DiffusionPipe
Qwen-Image的Lora训练DiffusionPipe
1
@梦影Erislia
25
81H
更新时间2026-01-29
使用diffusion pipe进行qwen image的lora训练,小白也可简单上手,上传image即可开始训练
使用diffusion pipe进行qwen image的lora训练,小白也可简单上手,上传image即可开始训练
0/小时
数字人
HeyGem数字人最新多人面部驱动数字人,支持5090新卡,支持A800计算卡,修复黑框问题,GFP面部超分,修复超长视频上下游阻塞问题
HeyGem数字人最新多人面部驱动数字人,支持5090新卡,支持A800计算卡,修复黑框问题,GFP面部超分,修复超长视频上下游阻塞问题
31
@刘悦的技术博客
刘悦的技术博客认证作者
309
3186H
更新时间2026-01-29
支持自启动
HeyGem数字人最新多人面部驱动数字人,支持5090新卡,支持A800计算卡,修复黑框问题,GFP面部超分,修复超长视频上下游阻塞问题
HeyGem数字人最新多人面部驱动数字人,支持5090新卡,支持A800计算卡,修复黑框问题,GFP面部超分,修复超长视频上下游阻塞问题
0/小时
Z-Image图片生成
阿里通义开源Z-Image文生图片无限制wenbui中文特别版 构建by科哥
阿里通义开源Z-Image文生图片无限制wenbui中文特别版 构建by科哥
7
@科哥AIGC
科哥AIGC认证作者
82
565H
更新时间2026-01-30
支持自启动
文生图片无限制wenbui中文特别版
文生图片无限制wenbui中文特别版
0/小时
Wan视频生成
ComyUI批量z-image出图 SeedVR2 TTP放大 4K  Wan2.2图生视频
ComyUI批量z-image出图 SeedVR2 TTP放大 4K Wan2.2图生视频
4
@ifelse
113
664H
更新时间2026-01-29
支持自启动
ComyUI批量z-image出图 SeedVR2 TTP放大 4K Wan2.2图生视频
ComyUI批量z-image出图 SeedVR2 TTP放大 4K Wan2.2图生视频
0/小时
Z-ImageLora训练
aitookit_z-image_lora_train镜像
aitookit_z-image_lora_train镜像
21
@有趣的80后程序员
有趣的80后程序员认证作者
252
1447H
更新时间2026-01-29
aitookit_z-image_lora_train镜像
aitookit_z-image_lora_train镜像
0/小时
数字人
echomimic_v3阿里蚂蚁团队开源图片加声音生成说话数字人视频基于Comfyui加速和二次高清输出 构建By科哥
echomimic_v3阿里蚂蚁团队开源图片加声音生成说话数字人视频基于Comfyui加速和二次高清输出 构建By科哥
3
@科哥AIGC
科哥AIGC认证作者
36
528H
更新时间2026-01-30
echomimic_v3阿里蚂蚁团队开源图片加声音生成说话数字人视频基于Comfyui加速和二次高清输出 构建By科哥
echomimic_v3阿里蚂蚁团队开源图片加声音生成说话数字人视频基于Comfyui加速和二次高清输出 构建By科哥
0/小时
Z-Image图片生成
Z-Image-Turbo 最真实的生图模型
Z-Image-Turbo 最真实的生图模型
29
@匹夫
匹夫认证作者
220
362H
更新时间2026-01-30
Z-Image-Turbo 最真实的生图模型
Z-Image-Turbo 最真实的生图模型
0/小时
数据分析AI应用
Crawl4AI:基于AI的网络爬虫和数据抓取工具
Crawl4AI:基于AI的网络爬虫和数据抓取工具
5
@AI画师大阳
AI画师大阳认证作者
18
27H
更新时间2026-01-30
支持自启动
Crawl4AI:基于AI的网络爬虫和数据抓取工具
Crawl4AI:基于AI的网络爬虫和数据抓取工具
0/小时
Flux图片生成图片编辑
FLUX.2 [dev]
FLUX.2 [dev]
7
@十字鱼
十字鱼认证作者
65
73H
更新时间2025-11-28
支持自启动
FLUX.2 [dev] 是一个拥有32B参数的流匹配Transformer模型,能够生成和编辑图像。
FLUX.2 [dev] 是一个拥有32B参数的流匹配Transformer模型,能够生成和编辑图像。
0/小时
FluxComfyUI图片生成
flux.2工作流合集-加图片放大工作流
flux.2工作流合集-加图片放大工作流
25
@匹夫
匹夫认证作者
188
456H
更新时间2026-01-30
flux.2工作流合集-及图片高清放大工作流
flux.2工作流合集-及图片高清放大工作流
0/小时
Z-Image图片生成
Z-Image-Turbo · 8步极速 · 无限制生成
Z-Image-Turbo · 8步极速 · 无限制生成
9
@AI-KSK
AI-KSK认证作者
154
401H
更新时间2025-11-27
Z-Image-Turbo 是一款仅用 8 步即可生成旗舰级图像的高效扩散模型,具备快速生成、双语文本渲染、强指令理解与创意编辑能力,是当前开源图像模型中兼具速度与质量的优秀代表。
Z-Image-Turbo 是一款仅用 8 步即可生成旗舰级图像的高效扩散模型,具备快速生成、双语文本渲染、强指令理解与创意编辑能力,是当前开源图像模型中兼具速度与质量的优秀代表。
0/小时
FluxComfyUI图片生成
flux2最新发布f8优化极速版3090显卡可玩含sora2工作流 构建by科哥
flux2最新发布f8优化极速版3090显卡可玩含sora2工作流 构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
25
9H
更新时间2025-11-27
支持自启动
flux2最新发布f8优化极速版3090显卡可玩含sora2工作流 构建by科哥
flux2最新发布f8优化极速版3090显卡可玩含sora2工作流 构建by科哥
0/小时
ComfyUI
ComfyUI基础镜像纯净版0.3.50
ComfyUI基础镜像纯净版0.3.50
8
@龙没耳
龙没耳认证作者
44
224H
更新时间2026-01-30
支持自启动
ComfyUI基础镜像纯净版0.3.50
ComfyUI基础镜像纯净版0.3.50
0/小时
AI应用
PDFMathTranslate-next基于 AI 完整保留排版的 PDF 文档全文双语翻译
PDFMathTranslate-next基于 AI 完整保留排版的 PDF 文档全文双语翻译
6
@AI画师大阳
AI画师大阳认证作者
66
1666H
更新时间2026-01-30
支持自启动
基于 AI 完整保留排版的 PDF 文档全文双语翻译
基于 AI 完整保留排版的 PDF 文档全文双语翻译
0/小时
FluxComfyUI图片生成
FLUX.2:下一代视觉生成引擎
FLUX.2:下一代视觉生成引擎
4
@AI-KSK
AI-KSK认证作者
50
98H
更新时间2026-01-30
Flux.2 是 2025 年最全面、最专业、最强大的统一视觉生成模型之一。
Flux.2 是 2025 年最全面、最专业、最强大的统一视觉生成模型之一。
0/小时
ComfyUI图片编辑Qwen-Image
aha的ComfyUI镜像——姿态编辑
aha的ComfyUI镜像——姿态编辑
7
@叫我aha就好
94
248H
更新时间2026-01-30
SDPose_OOD+Pose_editor+qwen image edit 2509,姿态估计与编辑,随心所欲修改姿态
SDPose_OOD+Pose_editor+qwen image edit 2509,姿态估计与编辑,随心所欲修改姿态
0/小时
混元视频生成
HunyuanVideo 1.5开源视频生成模型-ComfyUI实现
HunyuanVideo 1.5开源视频生成模型-ComfyUI实现
6
@AI-KSK
AI-KSK认证作者
66
111H
更新时间2026-01-30
该镜像集成了刚刚开源的 HunyuanVideo 1.5 模型
该镜像集成了刚刚开源的 HunyuanVideo 1.5 模型
0/小时
ComfyUI
ComfyUI整合镜像
ComfyUI整合镜像
6
@鹄仙
鹄仙认证作者
64
256H
更新时间2026-01-30
一个Comfy UI的整合包,自用版,带插件和部分模型
一个Comfy UI的整合包,自用版,带插件和部分模型
0/小时
DeepSeekOCR识别
Deepseek orc webui在线图片识别文字pdf文件转文字 七种识别文字 构建by科哥
Deepseek orc webui在线图片识别文字pdf文件转文字 七种识别文字 构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
36
476H
更新时间2026-02-02
Deepseek orc webui在线图片识别文字pdf文件转文字
Deepseek orc webui在线图片识别文字pdf文件转文字
0/小时
混元3D生成
ComfyUI-SAM3-Hunyuan3D-Part-SAM3DBody工作流集合 构建By科哥
ComfyUI-SAM3-Hunyuan3D-Part-SAM3DBody工作流集合 构建By科哥
1
@科哥AIGC
科哥AIGC认证作者
14
21H
更新时间2026-01-30
支持自启动
sam3是谷歌开源的一个项目图像拆分,3D渲染等
sam3是谷歌开源的一个项目图像拆分,3D渲染等
0/小时
混元视频生成
HunyuanVideo-1.5
HunyuanVideo-1.5
5
@十字鱼
十字鱼认证作者
25
52H
更新时间2025-11-24
支持自启动
一个领先的超轻量级视频生成模型
一个领先的超轻量级视频生成模型
0/小时
IndexTTS语音合成
AI听书 IndexTTS vllm加速版
AI听书 IndexTTS vllm加速版
8
@CyberWon
81
73H
更新时间2026-01-23
低成本高质量快速生成有声书。
低成本高质量快速生成有声书。
0.01/小时
ComfyUIQwen-Image图片生成
一张图生成多角度工作流-万物融合工作流升级版
一张图生成多角度工作流-万物融合工作流升级版
14
@匹夫
匹夫认证作者
121
287H
更新时间2026-01-30
一张图生成多角度工作流-万物融合工作流升级版
一张图生成多角度工作流-万物融合工作流升级版
0/小时
视频生成
超强AI图生视频RemixV2-支持批量生成、首尾帧视频、高清放大
超强AI图生视频RemixV2-支持批量生成、首尾帧视频、高清放大
77
@与AI同行
与AI同行认证作者
985
5326H
更新时间2026-03-31
支持自启动
AI生成视频,Wan2.2-RemixV2整合包,支持图生视频、首尾帧视频,支持批量单图视频、批量首尾帧,支持高清放大、加载Lora、NSFW,最低8G显存可用
AI生成视频,Wan2.2-RemixV2整合包,支持图生视频、首尾帧视频,支持批量单图视频、批量首尾帧,支持高清放大、加载Lora、NSFW,最低8G显存可用
0/小时
语音合成
错金流TTS地表炸天TTS工具,一百多款自然人声,极速复刻
错金流TTS地表炸天TTS工具,一百多款自然人声,极速复刻
4
@独立工作者
47
185H
更新时间2026-02-02
地表炸天TTS工具,一百多款自然人声,极速复刻
地表炸天TTS工具,一百多款自然人声,极速复刻
0/小时
视频超分
FlashVSR 视频高清放大工具
FlashVSR 视频高清放大工具
19
@AI画师大阳
AI画师大阳认证作者
427
882H
更新时间2026-01-30
支持自启动
FlashVSR 视频高清放大工具
FlashVSR 视频高清放大工具
0/小时
语音合成
XKPLUS2
XKPLUS2
0
@REDCOPY
4
0H
更新时间2025-11-24
支持自启动
加速优化版
加速优化版
0.76/小时
语音合成
XKPLUS1
XKPLUS1
1
@REDCOPY
4
22H
更新时间2025-11-24
支持自启动
30系显卡优化版
30系显卡优化版
0.46/小时
语音合成
云端88888888
云端88888888
0
@REDCOPY
2
22H
更新时间2025-11-17
支持自启动
3080Ti专用
3080Ti专用
0.46/小时
语音合成
语音88888888
语音88888888
0
@REDCOPY
3
10H
更新时间2025-11-17
支持自启动
3080Ti专用
3080Ti专用
0.76/小时
AI应用
video-subtitle-extractor视频字幕提取器 全智能加速优化版 构建by科哥
video-subtitle-extractor视频字幕提取器 全智能加速优化版 构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
12
19H
更新时间2026-01-30
一键提取视频字幕 加速优化
一键提取视频字幕 加速优化
0/小时
语音合成语音识别
Step-Audio-EditX
Step-Audio-EditX
3
@十字鱼
十字鱼认证作者
25
15H
更新时间2025-11-14
支持自启动
一个强大的 3B 参数、基于 LLM 的强化学习音频编辑模型,擅长编辑情感、说话风格和副语言,并具有稳健的零样本文本转语音功能
一个强大的 3B 参数、基于 LLM 的强化学习音频编辑模型,擅长编辑情感、说话风格和副语言,并具有稳健的零样本文本转语音功能
0/小时
语音合成
VibeVoice:富有表现力的长篇多人对话语音合成工具
VibeVoice:富有表现力的长篇多人对话语音合成工具
12
@AI画师大阳
AI画师大阳认证作者
131
347H
更新时间2026-01-30
支持自启动
富有表现力的长篇多人对话语音合成工具
富有表现力的长篇多人对话语音合成工具
0/小时
语音合成语音克隆
IndexTTS2 B站开源超强语音克隆
IndexTTS2 B站开源超强语音克隆
351
@十字鱼
十字鱼认证作者
2419
10562H
更新时间2026-03-16
支持自启动
B站开源超强语音克隆,在情感表达和时长控制方面取得突破的自回归零样本文本合成系统
B站开源超强语音克隆,在情感表达和时长控制方面取得突破的自回归零样本文本合成系统
0/小时
Wan视频编辑ComfyUI
Remix-Wan2.2一体化多功能创作镜像
Remix-Wan2.2一体化多功能创作镜像
31
@AI-KSK
AI-KSK认证作者
217
3015H
更新时间2026-01-30
一体化整合Remix-Wan 2.2 文生视频、图生视频、首尾帧生成与 Qwen3 自动提示词的多功能创作镜像
一体化整合Remix-Wan 2.2 文生视频、图生视频、首尾帧生成与 Qwen3 自动提示词的多功能创作镜像
0/小时
视频生成
AI视频消除万物-支持消除人物、物体、水印、字幕等
AI视频消除万物-支持消除人物、物体、水印、字幕等
71
@与AI同行
与AI同行认证作者
767
1247H
更新时间2026-03-31
支持自启动
AI视频消除万物整合包,支持消除人物、物体、水印、字幕等,支持较长视频、添加队列任务,打开即用,一键运行!
AI视频消除万物整合包,支持消除人物、物体、水印、字幕等,支持较长视频、添加队列任务,打开即用,一键运行!
0/小时
图片编辑图片生成ComfyUI
ChromoEdit-GGUF模型,,图片修改,图像修改,图生视频,支持5090新卡,comfyui,工作流,workflow
ChromoEdit-GGUF模型,,图片修改,图像修改,图生视频,支持5090新卡,comfyui,工作流,workflow
7
@刘悦的技术博客
刘悦的技术博客认证作者
61
23H
更新时间2026-01-30
支持自启动
ChromoEdit-GGUF模型,,图片修改,图像修改,图生视频,支持5090新卡,comfyui,工作流,workflow
ChromoEdit-GGUF模型,,图片修改,图像修改,图生视频,支持5090新卡,comfyui,工作流,workflow
0/小时
InfiniteTalk数字人
InfiniteTalk数字人视频制作软件,图片转视频,视频人物配音
InfiniteTalk数字人视频制作软件,图片转视频,视频人物配音
36
@AI画师大阳
AI画师大阳认证作者
547
838H
更新时间2026-02-02
支持自启动
InfiniteTalk 是一个无限长度的对话视频生成模型,支持音频驱动的视频到视频和图像到视频的生成
InfiniteTalk 是一个无限长度的对话视频生成模型,支持音频驱动的视频到视频和图像到视频的生成
0/小时
ComfyUI
Diffusion_pipe_in_ComfyUI天冬
Diffusion_pipe_in_ComfyUI天冬
3
@天冬
16
77H
更新时间2025-11-11
支持自启动
为 ComfyUI 提供了完整的 Diffusion 模型训练和微调功能。这个项目允许用户在 ComfyUI 的图形界面中配置和启动各种先进 AI 模型的训练,支持 LoRA 和全量微调
为 ComfyUI 提供了完整的 Diffusion 模型训练和微调功能。这个项目允许用户在 ComfyUI 的图形界面中配置和启动各种先进 AI 模型的训练,支持 LoRA 和全量微调
0/小时
语音合成语音识别
Step-Audio-EditX
Step-Audio-EditX
3
@鹄仙
鹄仙认证作者
20
44H
更新时间2025-11-24
一个音频编辑项目,“情绪编辑”“风格编辑”“语气编辑”和“降噪变速”
一个音频编辑项目,“情绪编辑”“风格编辑”“语气编辑”和“降噪变速”
0/小时
其他
猫哥的商业化AI,SORA2
猫哥的商业化AI,SORA2
19
@老猫本猫
843
2950H
更新时间2026-01-30
支持自启动
SORA2文生视频,图生视频
SORA2文生视频,图生视频
0/小时
AI应用
AI-Trader港大开源的AI自动交易竞赛框架 汉化构建By科哥
AI-Trader港大开源的AI自动交易竞赛框架 汉化构建By科哥
1
@科哥AIGC
科哥AIGC认证作者
8
1H
更新时间2026-01-30
股市有风险 投资请谨慎!
股市有风险 投资请谨慎!
0/小时
Qwen-Image图片生成
Qwen-Image-Edit-2509多图编辑及人物一致性生成
Qwen-Image-Edit-2509多图编辑及人物一致性生成
3
@AI画师大阳
AI画师大阳认证作者
150
180H
更新时间2026-01-30
支持自启动
Qwen-Image-Edit-2509精准多图内容编辑及人物一致性图片生成
Qwen-Image-Edit-2509精准多图内容编辑及人物一致性图片生成
0/小时
视频生成
超强Sora2视频去水印
超强Sora2视频去水印
49
@与AI同行
与AI同行认证作者
273
520H
更新时间2026-03-31
支持自启动
超强Sora2视频去水印
超强Sora2视频去水印
0/小时
InfiniteTalkWan数字人
SDPOSE 超复杂骨骼识别系统 X Lynx + InfiniteTalk + VACE + Wan 无限时长视频转绘体系
SDPOSE 超复杂骨骼识别系统 X Lynx + InfiniteTalk + VACE + Wan 无限时长视频转绘体系
5
@AI-KSK
AI-KSK认证作者
36
64H
更新时间2026-01-30
以 SDPOSE 为核心,融合 Lynx、InfiniteTalk、VACE 与Wan ,构建出一个可无限时长、骨骼级精度的人体视频转绘与智能生成体系
以 SDPOSE 为核心,融合 Lynx、InfiniteTalk、VACE 与Wan ,构建出一个可无限时长、骨骼级精度的人体视频转绘与智能生成体系
0/小时
视频超分
ComfyUI_FlashVSR 实时视频超分,支持1分钟以上视频超分
ComfyUI_FlashVSR 实时视频超分,支持1分钟以上视频超分
9
@smthem
145
137H
更新时间2025-11-27
支持自启动
实时视频超分项目,显存如果够大,所有视频超分到4K
实时视频超分项目,显存如果够大,所有视频超分到4K
0/小时
QwenVL视觉理解
Qwen3-vl-abliterated视觉模型,视频理解,多图理解,批量任务,反推提示词
Qwen3-vl-abliterated视觉模型,视频理解,多图理解,批量任务,反推提示词
28
@刘悦的技术博客
刘悦的技术博客认证作者
125
1104H
更新时间2026-01-30
支持自启动
Qwen3-vl-abliterated视觉模型,视频理解,多图理解,批量任务,反推提示词
Qwen3-vl-abliterated视觉模型,视频理解,多图理解,批量任务,反推提示词
0/小时
Wan视频编辑
animate完美一致性人物迁移
animate完美一致性人物迁移
28
@
189
281H
更新时间2026-01-30
支持自启动
无惧镜头切换人物迁移
无惧镜头切换人物迁移
0/小时
视频编辑ComfyUI
4步骤完成风格转绘vlog
4步骤完成风格转绘vlog
3
@鹄仙
鹄仙认证作者
8
79H
更新时间2026-01-09
支持自启动
4步骤完成风格转绘vlog
4步骤完成风格转绘vlog
0/小时
WanLora训练
Wan2.2-Lora训练diffusionpipe
Wan2.2-Lora训练diffusionpipe
9
@梦影Erislia
86
209H
更新时间2026-01-30
Wan2.2Lora训练diffusionpipe
Wan2.2Lora训练diffusionpipe
0/小时
图片编辑图片生成
ChronoEdit
ChronoEdit
3
@十字鱼
十字鱼认证作者
10
6H
更新时间2025-11-04
支持自启动
面向图像编辑和世界模拟的时序推理
面向图像编辑和世界模拟的时序推理
0/小时
Wan视频编辑
wan2.2视频编辑人物替换背景替换
wan2.2视频编辑人物替换背景替换
65
@老徐Ai研习社
老徐Ai研习社认证作者
838
1708H
更新时间2025-11-24
支持自启动
视频编辑人物替换背景替换局部修改
视频编辑人物替换背景替换局部修改
0/小时
语音合成
SoulX-Podcast:能说方言、带情绪的真实感长播客生成工具 构建by科哥
SoulX-Podcast:能说方言、带情绪的真实感长播客生成工具 构建by科哥
6
@科哥AIGC
科哥AIGC认证作者
68
134H
更新时间2026-01-30
支持自启动
SoulX-Podcast:能说方言、带情绪的真实感长播客生成工具
SoulX-Podcast:能说方言、带情绪的真实感长播客生成工具
0/小时
Wan视频编辑
Wan2.2-Animate-14B动作模仿及视频人物替换
Wan2.2-Animate-14B动作模仿及视频人物替换
51
@AI画师大阳
AI画师大阳认证作者
470
544H
更新时间2026-01-30
支持自启动
Wan2.2-Animate-14B一张图片模仿视频人物动作及替换视频中人物
Wan2.2-Animate-14B一张图片模仿视频人物动作及替换视频中人物
0/小时
语音合成
SoulX-Podcast-1.7B语音合成,接口API调用,多人播客合成,方言合成,语速调节,支持笑声咳嗽指令,支持5090新卡,音色保存
SoulX-Podcast-1.7B语音合成,接口API调用,多人播客合成,方言合成,语速调节,支持笑声咳嗽指令,支持5090新卡,音色保存
8
@刘悦的技术博客
刘悦的技术博客认证作者
81
124H
更新时间2025-11-14
支持自启动
SoulX-Podcast-1.7B语音合成,接口API调用,多人播客合成,方言合成,语速调节,支持笑声咳嗽指令,支持5090新卡,音色保存
SoulX-Podcast-1.7B语音合成,接口API调用,多人播客合成,方言合成,语速调节,支持笑声咳嗽指令,支持5090新卡,音色保存
0/小时
图片生成
最强AI图片编辑-QwenImageEdit加速版-支持换装、换姿势、批量生成、高清放大
最强AI图片编辑-QwenImageEdit加速版-支持换装、换姿势、批量生成、高清放大
31
@与AI同行
与AI同行认证作者
313
872H
更新时间2026-03-31
支持自启动
最强AI图片编辑-QwenImageEdit-支持换装、换姿势、批量生成、SeedVR2高清放大
最强AI图片编辑-QwenImageEdit-支持换装、换姿势、批量生成、SeedVR2高清放大
0/小时
视频编辑
facefusion3.4.1图片视频换脸神器 汉化版构建by科哥
facefusion3.4.1图片视频换脸神器 汉化版构建by科哥
23
@科哥AIGC
科哥AIGC认证作者
141
198H
更新时间2025-11-24
facefusion3.4官方原版
facefusion3.4官方原版
0/小时
Flux图片生成
DYPE超大分辨率1600万像素图像生成,ComfyUI插件实现
DYPE超大分辨率1600万像素图像生成,ComfyUI插件实现
1
@smthem
12
42H
更新时间2025-11-02
支持自启动
消费级显卡开始生成4096*4096的超大尺寸图片
消费级显卡开始生成4096*4096的超大尺寸图片
0/小时
Wan视频编辑ComfyUI
wan2.2视频瞳孔转场
wan2.2视频瞳孔转场
5
@skyrimprey
7
169H
更新时间2026-01-30
挂载wan2.2瞳孔转场lora,实现专业的视频转场效果
挂载wan2.2瞳孔转场lora,实现专业的视频转场效果
0/小时
图片编辑AI工具
最强照片上色DDColor-牛哥定制版
最强照片上色DDColor-牛哥定制版
4
@NiuGee
NiuGee认证作者
19
138H
更新时间2026-01-30
支持自启动
🎨 DDColor 牛哥镜像版 - 黑白图像智能上色 牛哥针对DDColor黑白图像上色模型制作的一手镜像,这应该是目前效果最好的黑白照片智能上色解决方案之一。
🎨 DDColor 牛哥镜像版 - 黑白图像智能上色 牛哥针对DDColor黑白图像上色模型制作的一手镜像,这应该是目前效果最好的黑白照片智能上色解决方案之一。
0/小时
IndexTTS语音合成
IndexTTS2/GPT-SoVITS+Srt-AI-Voice-Assistant多角色字幕长文本一键配音镜像
IndexTTS2/GPT-SoVITS+Srt-AI-Voice-Assistant多角色字幕长文本一键配音镜像
34
@数列解析几何一生之敌
数列解析几何一生之敌认证作者
303
1785H
更新时间2026-02-02
支持自启动
Srt-AI-Voice-Assistant配音辅助工具搭配IndexTTS2/GSV的镜像
Srt-AI-Voice-Assistant配音辅助工具搭配IndexTTS2/GSV的镜像
0/小时
视频生成
超强AI生成视频-SmoothMix-V2合集-效果超强
超强AI生成视频-SmoothMix-V2合集-效果超强
37
@与AI同行
与AI同行认证作者
408
1548H
更新时间2026-03-31
支持自启动
SmoothMix-V2合集-效果超强,支持文生视频、图生视频、首尾帧、批量首尾帧视频,支持NSFW、高清修复!
SmoothMix-V2合集-效果超强,支持文生视频、图生视频、首尾帧、批量首尾帧视频,支持NSFW、高清修复!
0/小时
LongCat视频生成
美团LongCat-ComfyUI|文生视频·图生视频·视频延续|长视频生成
美团LongCat-ComfyUI|文生视频·图生视频·视频延续|长视频生成
9
@AI-KSK
AI-KSK认证作者
94
330H
更新时间2026-01-30
这是一个集成了美团LongCat模型与ComfyUI的镜像,提供文生视频、图生视频和视频延续三大功能,核心优势在于能生成长时间且质量稳定的视频。
这是一个集成了美团LongCat模型与ComfyUI的镜像,提供文生视频、图生视频和视频延续三大功能,核心优势在于能生成长时间且质量稳定的视频。
0/小时
视频生成
超强AI生成视频-Lightx2v-I2V-超强动态、分镜效果
超强AI生成视频-Lightx2v-I2V-超强动态、分镜效果
17
@与AI同行
与AI同行认证作者
184
516H
更新时间2026-03-31
支持自启动
超强AI生成视频-Lightx2v-I2V-超强动态、分镜效果。支持图生视频,首尾帧、批量首尾帧视频、批量生成、高清修复
超强AI生成视频-Lightx2v-I2V-超强动态、分镜效果。支持图生视频,首尾帧、批量首尾帧视频、批量生成、高清修复
0/小时
LongCat视频生成
美团Longcat-video视频模型
美团Longcat-video视频模型
4
@社恐的知识树
社恐的知识树认证作者
18
103H
更新时间2025-10-29
支持自启动
美团开源的长视频生成模型-Longcat,ComfyUI抢先体验版,后续优化后继续更新!
美团开源的长视频生成模型-Longcat,ComfyUI抢先体验版,后续优化后继续更新!
0/小时
数字人
LatentSync抖音出品高质量对口型软件
LatentSync抖音出品高质量对口型软件
52
@AI画师大阳
AI画师大阳认证作者
760
7318H
更新时间2026-01-30
支持自启动
高质量对口型工具
高质量对口型工具
0/小时
视频超分
FlashVSR_Ultra_Fast,图片视频超清放大,支持批量任务,支持5090新卡
FlashVSR_Ultra_Fast,图片视频超清放大,支持批量任务,支持5090新卡
38
@刘悦的技术博客
刘悦的技术博客认证作者
807
2561H
更新时间2026-01-30
支持自启动
FlashVSR_Ultra_Fast,图片视频超清放大,支持批量任务,支持5090新卡
FlashVSR_Ultra_Fast,图片视频超清放大,支持批量任务,支持5090新卡
0/小时
视频编辑ComfyUI
一键视频转绘Ditto
一键视频转绘Ditto
5
@鹄仙
鹄仙认证作者
56
67H
更新时间2026-02-02
把视频整体转会成其他风格
把视频整体转会成其他风格
0/小时
ComfyUI
积木comfyui
积木comfyui
9
@积木comfyui
43
62H
更新时间2026-02-02
支持自启动
简单易懂,用核心原理展示工作流
简单易懂,用核心原理展示工作流
0/小时
视频生成
Video-As-Prompt
Video-As-Prompt
2
@十字鱼
十字鱼认证作者
1
1H
更新时间2025-10-28
支持自启动
统一语义控制的视频生成
统一语义控制的视频生成
0/小时
Qwen-ImageComfyUIWan
Pony V7 × Qwen AIO × Smooth 2.0无限制生产|图像 / 编辑 / 视频 一体化
Pony V7 × Qwen AIO × Smooth 2.0无限制生产|图像 / 编辑 / 视频 一体化
9
@AI-KSK
AI-KSK认证作者
203
1005H
更新时间2026-02-02
这是一个整合图像生成、图像编辑和视频生产的 AI 创作工具。
这是一个整合图像生成、图像编辑和视频生产的 AI 创作工具。
0/小时
数字人
LiveTalking-V1.5
LiveTalking-V1.5
5
@有黑眼圈的小竹熊
199
1586H
更新时间2026-02-02
实时数字人解决方案
实时数字人解决方案
0.3/小时
ComfyUIWan视频生成
Comfyui_Ditto
Comfyui_Ditto
4
@skyrimprey
11
13H
更新时间2026-02-02
Ditto:基于指令的视频编辑框架,可以用于视频内元素的风格转换 本镜像为https://github.com/EzioBy/Ditto的Comfyui实现
Ditto:基于指令的视频编辑框架,可以用于视频内元素的风格转换 本镜像为https://github.com/EzioBy/Ditto的Comfyui实现
0/小时
AI应用
MinerU:高质量PDF转Markdown/JSON
MinerU:高质量PDF转Markdown/JSON
7
@AI画师大阳
AI画师大阳认证作者
182
703H
更新时间2026-02-02
支持自启动
快速高效的将PDF文档转为Markdown/JSON文件
快速高效的将PDF文档转为Markdown/JSON文件
0/小时
视频生成
超强AI视频风格重绘-Ditto-支持长视频、批量生成
超强AI视频风格重绘-Ditto-支持长视频、批量生成
12
@与AI同行
与AI同行认证作者
79
123H
更新时间2026-03-31
支持自启动
超强AI视频重绘Ditto-支持长视频、批量生成,支持视频风格转换、动漫转真人视频,超级方便!
超强AI视频重绘Ditto-支持长视频、批量生成,支持视频风格转换、动漫转真人视频,超级方便!
0/小时
3D生成
微软TRELLIS图片/文本转3D模型资产
微软TRELLIS图片/文本转3D模型资产
2
@AI画师大阳
AI画师大阳认证作者
93
241H
更新时间2026-02-02
支持自启动
高质量图片/文本转3D网格模型
高质量图片/文本转3D网格模型
0/小时
DeepSeekOCR识别
DeepSeek-OCR
DeepSeek-OCR
16
@十字鱼
十字鱼认证作者
58
685H
更新时间2025-10-24
上下文光学压缩
上下文光学压缩
0/小时
Qwen-ImageComfyUI
Qwen-image-Nunchaku智能扩图,AI绘图,关键词扩图,图像填充,图像延展,支持5090新卡
Qwen-image-Nunchaku智能扩图,AI绘图,关键词扩图,图像填充,图像延展,支持5090新卡
4
@刘悦的技术博客
刘悦的技术博客认证作者
47
32H
更新时间2026-02-02
支持自启动
Qwen-image-Nunchaku智能扩图,AI绘图,关键词扩图,图像填充,图像延展,支持5090新卡
Qwen-image-Nunchaku智能扩图,AI绘图,关键词扩图,图像填充,图像延展,支持5090新卡
0/小时
InfiniteTalk数字人
ComfyUI_infiniteTalk数字人工作流
ComfyUI_infiniteTalk数字人工作流
60
@好奇漫步
1119
12984H
更新时间2026-02-02
本镜像包含ComfyUI许多工作流,目前优先测试部署完毕infiniteTalk数字人工作流、Wan2.2生视频工作流、HoMo数字人工作流等,后续会继续部署完善更多的工作流。
本镜像包含ComfyUI许多工作流,目前优先测试部署完毕infiniteTalk数字人工作流、Wan2.2生视频工作流、HoMo数字人工作流等,后续会继续部署完善更多的工作流。
0/小时
WanQwen-Image视频生成
Qwen-image以及WAN视频系列,打开即用!
Qwen-image以及WAN视频系列,打开即用!
10
@老许爱吃肉丶
158
2216H
更新时间2026-02-02
支持自启动
comfyui工作流,Qwen-image以及WAN2.1/2.2视频,都已经部署好,里面内置工作流,打开即可使用!
comfyui工作流,Qwen-image以及WAN2.1/2.2视频,都已经部署好,里面内置工作流,打开即可使用!
0/小时
视频超分
FlashVSR视频高清放大webUI狂暴优化版 一键启用多倍放大 二次开发构建by科哥
FlashVSR视频高清放大webUI狂暴优化版 一键启用多倍放大 二次开发构建by科哥
8
@科哥AIGC
科哥AIGC认证作者
123
160H
更新时间2026-02-02
FlashVSR视频高清放大webUI狂暴优化版 一键启用多倍放大
FlashVSR视频高清放大webUI狂暴优化版 一键启用多倍放大
0/小时
Wan视频生成ComfyUI
Smooth Wan 2.2 动态↑速度↑NSFW↑文生/图生视频&首尾帧
Smooth Wan 2.2 动态↑速度↑NSFW↑文生/图生视频&首尾帧
87
@AI-KSK
AI-KSK认证作者
1019
7330H
更新时间2026-02-02
Smooth是最新的被社区广泛认可的Wan 2.2无限制合并模型
Smooth是最新的被社区广泛认可的Wan 2.2无限制合并模型
0/小时
OCR识别
baidu-paddle-ocr
baidu-paddle-ocr
3
@有趣的80后程序员
有趣的80后程序员认证作者
48
117H
更新时间2026-02-02
ocr模型天花板、支持109种语言、公式、表格、图标
ocr模型天花板、支持109种语言、公式、表格、图标
0/小时
视频超分
Flash-VSR-1.3B 图片/视频超清放大
Flash-VSR-1.3B 图片/视频超清放大
7
@刘悦的技术博客
刘悦的技术博客认证作者
88
37H
更新时间2026-02-02
支持自启动
Flash-VSR-1.3B,图片/视频超清放大,支持5090新显卡,支持批量任务
Flash-VSR-1.3B,图片/视频超清放大,支持5090新显卡,支持批量任务
0/小时
目标检测VL视觉理解
Rex-Omni
Rex-Omni
3
@十字鱼
十字鱼认证作者
20
350H
更新时间2025-10-19
支持自启动
通过下一个点预测来检测任何事物
通过下一个点预测来检测任何事物
0/小时
Wan视频生成
Wan2.2-SmoothMix 更丝滑的图生视频
Wan2.2-SmoothMix 更丝滑的图生视频
25
@刘悦的技术博客
刘悦的技术博客认证作者
246
196H
更新时间2026-02-02
支持自启动
Wan2.2-SmoothMix,更丝滑的图生视频,首尾帧连贯动画,4步采样,支持5090新卡
Wan2.2-SmoothMix,更丝滑的图生视频,首尾帧连贯动画,4步采样,支持5090新卡
0/小时
Wan视频编辑ComfyUI
Wan2.2-KJ氦气加速ComfyUI 6步极速版(唯一正版授权)
Wan2.2-KJ氦气加速ComfyUI 6步极速版(唯一正版授权)
20
@龙没耳
龙没耳认证作者
419
2872H
更新时间2026-02-02
支持自启动
Wan2.2KJ氦气加速6步极速版唯一正版授权镜像——AI来事&龙没耳联合推出
Wan2.2KJ氦气加速6步极速版唯一正版授权镜像——AI来事&龙没耳联合推出
0/小时
Wan视频编辑
Animate-v2-最强人物替换工作流
Animate-v2-最强人物替换工作流
39
@匹夫
匹夫认证作者
400
687H
更新时间2026-02-02
支持自启动
Animate-v2-最强人物替换工作流
Animate-v2-最强人物替换工作流
0/小时
图片编辑图片生成ComfyUI
DreamOmni2 ComfyUI 量化版
DreamOmni2 ComfyUI 量化版
2
@鹄仙
鹄仙认证作者
31
66H
更新时间2025-11-07
支持自启动
超级强大的图像编辑项目
超级强大的图像编辑项目
0/小时
视频生成
OVI一款使用提示生成音频音效,或者完整的有声视频开源模型
OVI一款使用提示生成音频音效,或者完整的有声视频开源模型
2
@社恐的知识树
社恐的知识树认证作者
23
13H
更新时间2026-02-02
一个类似Veo3 Sora的开源模型,使用提示词自动生成音频视频
一个类似Veo3 Sora的开源模型,使用提示词自动生成音频视频
0/小时
视频生成Wan
最强视频编辑-阿里WanAnimate-Q8超高精度-合集
最强视频编辑-阿里WanAnimate-Q8超高精度-合集
167
@与AI同行
与AI同行认证作者
3356
14158H
更新时间2026-03-31
支持自启动
最强视频编辑-阿里Wan-Animate-Q8超高精度-合集
最强视频编辑-阿里Wan-Animate-Q8超高精度-合集
0/小时
Wan视频编辑ComfyUI
视频重绘_跳舞姿势视频迁移Wan2.2图生视频
视频重绘_跳舞姿势视频迁移Wan2.2图生视频
19
@梦影Erislia
127
119H
更新时间2026-02-02
视频重绘_跳舞姿势视频迁移Wan2.2图生视频
视频重绘_跳舞姿势视频迁移Wan2.2图生视频
0/小时
ComfyUIAI电商
电商-AI模特/饰品/眼镜/假发模特,ComfyUI一键启动镜像
电商-AI模特/饰品/眼镜/假发模特,ComfyUI一键启动镜像
17
@AI美研所
206
511H
更新时间2026-02-03
支持自启动
适用电商的ComfyUI镜像环境,包括:饰品佩戴、 多姿势,多角度, 一致性模特工作流,一键换装工作流,眼镜模特工作流,假发模特工作流镜像;本镜像采取一键打包形式,不用输入一句命令,点击几次即可
适用电商的ComfyUI镜像环境,包括:饰品佩戴、 多姿势,多角度, 一致性模特工作流,一键换装工作流,眼镜模特工作流,假发模特工作流镜像;本镜像采取一键打包形式,不用输入一句命令,点击几次即可
0/小时
Wan视频编辑ComfyUI
Wan-Lynx 面部信息迁移图生视频+人脸一致性保持
Wan-Lynx 面部信息迁移图生视频+人脸一致性保持
18
@刘悦的技术博客
刘悦的技术博客认证作者
79
55H
更新时间2026-02-02
支持自启动
Wan-Lynx,面部信息迁移图生视频,人脸一致性保持,6步采样,支持5090新卡,支持批量任务,Comfyui,工作流
Wan-Lynx,面部信息迁移图生视频,人脸一致性保持,6步采样,支持5090新卡,支持批量任务,Comfyui,工作流
0/小时
VL视觉理解
Ming-UniVision
Ming-UniVision
2
@十字鱼
十字鱼认证作者
15
4H
更新时间2026-02-02
支持自启动
使用连续统一分词器进行联合图像理解和生成
使用连续统一分词器进行联合图像理解和生成
0/小时
Wan视频编辑ComfyUI
Wan2.2-N版-文生图生视频VACE-10流整合
Wan2.2-N版-文生图生视频VACE-10流整合
38
@AI-KSK
AI-KSK认证作者
346
967H
更新时间2026-02-02
支持自启动
Smooth&Remix&AllInOne-N版合并模型的一键镜像
Smooth&Remix&AllInOne-N版合并模型的一键镜像
0/小时
AI应用
PDFMathTranslate
PDFMathTranslate
5
@十字鱼
十字鱼认证作者
5
3H
更新时间2026-02-02
支持自启动
基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务
基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务
0/小时
IndexTTS语音合成
indextts2-IndexTTS2 最新 V23 版本的全面升级
indextts2-IndexTTS2 最新 V23 版本的全面升级
36
@科哥AIGC
科哥AIGC认证作者
479
1472H
更新时间2026-02-02
IndexTTS2 最新 V23 版本的全面升级
IndexTTS2 最新 V23 版本的全面升级
0/小时
混元3D生成
腾讯混元3d-Omni在线生成Hunyuan3D-Omni轻量版3d模型生成命令行版 构建by科哥
腾讯混元3d-Omni在线生成Hunyuan3D-Omni轻量版3d模型生成命令行版 构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
28
351H
更新时间2026-02-02
24gb可以运行该应用
24gb可以运行该应用
0/小时
视频生成
Ovi 来啦!开源免费,体验一下类似 SORA 2 的视频+音频生成
Ovi 来啦!开源免费,体验一下类似 SORA 2 的视频+音频生成
7
@AI-KSK
AI-KSK认证作者
61
23H
更新时间2026-02-02
认识一下 Ovi —— 一个很像 SORA 2 的免费 AI 模型。它能生成带声音的完整视频,让你探索下一代 AI 创作的无限可能!
认识一下 Ovi —— 一个很像 SORA 2 的免费 AI 模型。它能生成带声音的完整视频,让你探索下一代 AI 创作的无限可能!
0/小时
混元图片生成
HunyuanImage-3.0
HunyuanImage-3.0
11
@十字鱼
十字鱼认证作者
56
90H
更新时间2025-10-06
支持自启动
腾讯开源80B图像生成模型 原生多模态 自回归框架
腾讯开源80B图像生成模型 原生多模态 自回归框架
0/小时
视频生成
Ovi 音频视频生成
Ovi 音频视频生成
12
@十字鱼
十字鱼认证作者
57
34H
更新时间2025-10-20
支持自启动
用于音频视频生成的双主干交叉模态融合
用于音频视频生成的双主干交叉模态融合
0/小时
语音合成
GPT-SoVITS
GPT-SoVITS
75
@aiguoliuguo
aiguoliuguo认证作者
2826
13335H
更新时间2026-02-03
GPT-SoVITS-V4(v2Pro,v2ProPlus),所需素材少,训练耗时短,情绪可控。
GPT-SoVITS-V4(v2Pro,v2ProPlus),所需素材少,训练耗时短,情绪可控。
0/小时
语音分离
MSST
MSST
34
@aiguoliuguo
aiguoliuguo认证作者
1944
3728H
更新时间2025-10-05
MSST-webUI版本,更简单,加入一键处理,效率更高,更好用的干声分离以及去和声混响的项目,可以作为传统UVR的上位替代,并兼容UVR的模型,简单且快。
MSST-webUI版本,更简单,加入一键处理,效率更高,更好用的干声分离以及去和声混响的项目,可以作为传统UVR的上位替代,并兼容UVR的模型,简单且快。
0/小时
IndexTTS语音合成
index-tts2高质量声音克隆语音合成软件
index-tts2高质量声音克隆语音合成软件
40
@AI画师大阳
AI画师大阳认证作者
732
3456H
更新时间2026-02-02
支持自启动
index-tts2高质量声音克隆语音合成软件
index-tts2高质量声音克隆语音合成软件
0/小时
Wan视频编辑ComfyUI
WAN22增强版-eddy-ode采样,文生视频/图生视频
WAN22增强版-eddy-ode采样,文生视频/图生视频
17
@AI-KSK
AI-KSK认证作者
210
222H
更新时间2026-02-02
视频生产更精细、更流畅、更智能、更快速、更具视觉表现力。
视频生产更精细、更流畅、更智能、更快速、更具视觉表现力。
0/小时
混元3D生成
腾讯混元3D2.1生成3d模型hunyuan 3d 构建by科哥
腾讯混元3D2.1生成3d模型hunyuan 3d 构建by科哥
4
@科哥AIGC
科哥AIGC认证作者
36
89H
更新时间2026-02-02
24gb最低显存
24gb最低显存
0/小时
图片编辑
超强图片编辑工具OmniGen2,一句话修改图片内容
超强图片编辑工具OmniGen2,一句话修改图片内容
13
@AI画师大阳
AI画师大阳认证作者
110
88H
更新时间2026-02-02
支持自启动
一句话快速精准修改图片内容
一句话快速精准修改图片内容
0/小时
数字人
StableAvatar快速生成对口型数字人视频  12gb显卡爆改by科哥
StableAvatar快速生成对口型数字人视频 12gb显卡爆改by科哥
8
@科哥AIGC
科哥AIGC认证作者
73
58H
更新时间2025-09-30
对口型数字人视频wan2.1优化项目 12gb显卡爆改by科哥
对口型数字人视频wan2.1优化项目 12gb显卡爆改by科哥
0/小时
混元3D生成
hunyuan3D part腾讯开源3D模型分离图片3D建模应用 汉化构建By科哥
hunyuan3D part腾讯开源3D模型分离图片3D建模应用 汉化构建By科哥
0
@科哥AIGC
科哥AIGC认证作者
6
1H
更新时间2026-02-02
需要80gb显卡使用A800测试通过。
需要80gb显卡使用A800测试通过。
0/小时
ComfyUI视频生成
Lynx字节跳动高保真人脸视频生成方法comfyUI镜像
Lynx字节跳动高保真人脸视频生成方法comfyUI镜像
2
@smthem
8
22H
更新时间2026-02-02
非量化版LYNX,非KJ版,24G显存才能跑
非量化版LYNX,非KJ版,24G显存才能跑
0/小时
InfiniteTalkIndexTTS数字人
顶级中文数字人套件-Easy-IndexTTS2 · FireRedTTS · InfiniteTalk
顶级中文数字人套件-Easy-IndexTTS2 · FireRedTTS · InfiniteTalk
13
@AI-KSK
AI-KSK认证作者
138
1081H
更新时间2026-02-02
克隆目标声音,保留音色、语气与情感;将静态图片与音频驱动生成动态视频。
克隆目标声音,保留音色、语气与情感;将静态图片与音频驱动生成动态视频。
0/小时
IndexTTS语音合成
IndexTTS-V2  DeepSpeed编译加速版
IndexTTS-V2 DeepSpeed编译加速版
106
@刘悦的技术博客
刘悦的技术博客认证作者
2425
8731H
更新时间2026-02-02
支持自启动
支持异步批量任务,支持接口API并发请求,语速调节,音色保存,情绪控制
支持异步批量任务,支持接口API并发请求,语速调节,音色保存,情绪控制
0/小时
推理框架
bunkws
bunkws
1
@杭州国芯微
27
1923H
更新时间2026-02-02
Bunkws 是杭州国芯微自研的一款端到端唤醒词训练框架
Bunkws 是杭州国芯微自研的一款端到端唤醒词训练框架
0/小时
Wan视频编辑
Wan-2.2-Animate视频主体替换,支持批量任务队列
Wan-2.2-Animate视频主体替换,支持批量任务队列
41
@刘悦的技术博客
刘悦的技术博客认证作者
331
411H
更新时间2026-02-02
支持自启动
Wan-2.2-Animate视频主体替换,支持批量任务队列,初始化后,等待服务启动,大概2分钟左右,随后点击SD-WEBUI按钮即可
Wan-2.2-Animate视频主体替换,支持批量任务队列,初始化后,等待服务启动,大概2分钟左右,随后点击SD-WEBUI按钮即可
0/小时
IndexTTS语音合成
Niugee-IndexTTS-V2
Niugee-IndexTTS-V2
35
@NiuGee
NiuGee认证作者
292
813H
更新时间2026-02-02
支持自启动
目前情感效果最好,没有幻觉的文本转语音AI工具
目前情感效果最好,没有幻觉的文本转语音AI工具
0/小时
语音合成
VoxCPM-小而美的TTS
VoxCPM-小而美的TTS
5
@鹄仙
鹄仙认证作者
35
288H
更新时间2026-02-02
比IndexTTS更小的语音生成模型,支持语音克隆、文生语音
比IndexTTS更小的语音生成模型,支持语音克隆、文生语音
0/小时
Qwen-Image图片生成ComfyUI
Qwen-Image-Edit-2509 三图融合,4步采样
Qwen-Image-Edit-2509 三图融合,4步采样
23
@刘悦的技术博客
刘悦的技术博客认证作者
154
220H
更新时间2026-02-02
支持自启动
Qwen-Image-Edit-2509三图融合.4步采样,支持自定义多重Lora嵌套,AI图片编辑修改,支持批量任务队列
Qwen-Image-Edit-2509三图融合.4步采样,支持自定义多重Lora嵌套,AI图片编辑修改,支持批量任务队列
0/小时
ComfyUI
培训师的comfyUI
培训师的comfyUI
5
@鹄仙
鹄仙认证作者
60
399H
更新时间2026-02-02
组合了图像生成、视频生成、数字人的面向培训师群体的ComfyUI
组合了图像生成、视频生成、数字人的面向培训师群体的ComfyUI
0/小时
WanQwen-Image视频生成
Qwen edit+Wan2.2 出图+视频的神! 平替Banana
Qwen edit+Wan2.2 出图+视频的神! 平替Banana
28
@不止设计工作室
294
1558H
更新时间2026-02-02
qwen edit满血模型部署!替代banana,结合comfyui工作流轻松实现出图、p图、视频生成
qwen edit满血模型部署!替代banana,结合comfyui工作流轻松实现出图、p图、视频生成
0/小时
数字人
MultiTalk-生成音乐MV
MultiTalk-生成音乐MV
29
@乔大峰
乔大峰认证作者
81
169H
更新时间2026-02-02
支持自启动
MultiTalk-只需上传图片和音频,帮你生成音乐MV
MultiTalk-只需上传图片和音频,帮你生成音乐MV
0/小时
Wan视频编辑ComfyUI
WanAnimate
WanAnimate
19
@十字鱼
十字鱼认证作者
107
162H
更新时间2025-11-06
支持自启动
Wan2.2-Animate 动作迁移&人物替换 迟来的AnimateAnyone
Wan2.2-Animate 动作迁移&人物替换 迟来的AnimateAnyone
0/小时
Wan视频编辑ComfyUI
Wan-Animate-ComfyUI:角色动画生成与角色替换
Wan-Animate-ComfyUI:角色动画生成与角色替换
12
@AI-KSK
AI-KSK认证作者
130
279H
更新时间2026-02-02
Wan-Animate 是阿里巴巴通义实验室提出的一个统一框架,用于 角色动画生成与角色替换。
Wan-Animate 是阿里巴巴通义实验室提出的一个统一框架,用于 角色动画生成与角色替换。
0/小时
视频超分
SeedVR2-视频高清放大工作流
SeedVR2-视频高清放大工作流
21
@科哥AIGC
科哥AIGC认证作者
41
37H
更新时间2026-02-02
支持自启动
二次高清放大视频!3b、7b模型gguf量化加速版 不易爆显存 镜像by科哥
二次高清放大视频!3b、7b模型gguf量化加速版 不易爆显存 镜像by科哥
0/小时
语音合成
VoxCPM-来自面壁智能和清华的语音生成模型
VoxCPM-来自面壁智能和清华的语音生成模型
4
@科哥AIGC
科哥AIGC认证作者
23
17H
更新时间2026-02-02
支持自启动
几秒音频即可克隆声音 构建by科哥
几秒音频即可克隆声音 构建by科哥
0/小时
Wan视频生成
Wan2.2官方VACE-ComfyUI七大视频生成编辑工作流
Wan2.2官方VACE-ComfyUI七大视频生成编辑工作流
8
@AI-KSK
AI-KSK认证作者
153
339H
更新时间2026-02-02
开源的​​统一视频生成与编辑框架​​,Wan2.2-VACE-Fun​​一个模型即可支持文生视频、图生视频、视频编辑、局部修改、等多项任务
开源的​​统一视频生成与编辑框架​​,Wan2.2-VACE-Fun​​一个模型即可支持文生视频、图生视频、视频编辑、局部修改、等多项任务
0/小时
数字人视频生成
humo-HuMo清华大学联合字节推出的多模态视频生成框架 二改by科哥
humo-HuMo清华大学联合字节推出的多模态视频生成框架 二改by科哥
9
@科哥AIGC
科哥AIGC认证作者
18
55H
更新时间2026-02-02
支持自启动
优化1.7b可以24gb显存运行起来了!
优化1.7b可以24gb显存运行起来了!
0/小时
语音合成
FireRedTTS2
FireRedTTS2
9
@十字鱼
十字鱼认证作者
47
755H
更新时间2026-02-02
支持自启动
面向播客和聊天机器人的长对话语音生成
面向播客和聊天机器人的长对话语音生成
0/小时
ComfyUIWan
阿里Wan2.2-14B图生视频超高画质-Q8
阿里Wan2.2-14B图生视频超高画质-Q8
77
@与AI同行
与AI同行认证作者
938
4780H
更新时间2026-03-31
支持自启动
AI生成视频Wan2.2图生视频,使用量化版Wan2.2-I2V-A14B模型
AI生成视频Wan2.2图生视频,使用量化版Wan2.2-I2V-A14B模型
0/小时
Wan视频生成
Wan-2.2-Fun-Vace视频主体替换
Wan-2.2-Fun-Vace视频主体替换
14
@刘悦的技术博客
刘悦的技术博客认证作者
70
68H
更新时间2026-02-02
支持自启动
Wan-2.2-Fun-Vace,视频主体替换、跳舞视频主体替换、广告模特替换
Wan-2.2-Fun-Vace,视频主体替换、跳舞视频主体替换、广告模特替换
0/小时
数字人视频生成
HuMo: 基于协作多模态条件的人体中心视频生成
HuMo: 基于协作多模态条件的人体中心视频生成
8
@Ikaros
14
17H
更新时间2026-02-02
HuMo是一个统一的、以人为中心的视频生成框架,旨在从多模态输入(包括文本、图像和音频)生成高质量、细粒度且可控的人体视频。它支持强大的文本提示跟随、一致的主体保持和同步的音频驱动动作。
HuMo是一个统一的、以人为中心的视频生成框架,旨在从多模态输入(包括文本、图像和音频)生成高质量、细粒度且可控的人体视频。它支持强大的文本提示跟随、一致的主体保持和同步的音频驱动动作。
0/小时
语音合成语音识别
FireRedASR语音识别、语音转文字 构建by科哥
FireRedASR语音识别、语音转文字 构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
24
14H
更新时间2026-02-02
支持自启动
FireRedASR语音识别系统语音转文字语音转文本千问开源 构建by科哥
FireRedASR语音识别系统语音转文字语音转文本千问开源 构建by科哥
0/小时
语音识别
FunASR在线语音识别/语音生成   二次开发构建by科哥
FunASR在线语音识别/语音生成 二次开发构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
30
31H
更新时间2026-02-02
来自阿里开源 科哥二次构建开发webui
来自阿里开源 科哥二次构建开发webui
0/小时
语音合成
VibeVoice – 微软推出的开源文本转语音模型 汉化构建by科哥
VibeVoice – 微软推出的开源文本转语音模型 汉化构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
27
12H
更新时间2026-02-02
支持自启动
可以一次性合成4人的对话播客
可以一次性合成4人的对话播客
0/小时
SD
SD高质量CG绘画
SD高质量CG绘画
9
@AI画师大阳
AI画师大阳认证作者
155
479H
更新时间2025-09-17
支持自启动
SD高质量CG绘画
SD高质量CG绘画
0/小时
其他
alchemy
alchemy
1
@杭州国芯微
0
0H
更新时间2026-02-02
用于训练alchemy kws模型
用于训练alchemy kws模型
0/小时
目标检测图像分割
SAM 2:图像和视频中的任何内容分割
SAM 2:图像和视频中的任何内容分割
1
@Ikaros
12
9H
更新时间2026-02-02
SAM 2:图像和视频中的任何内容分割。比如切出视频中的人物、物体等,可以对目标和背景进行扣除换色等效果设置。
SAM 2:图像和视频中的任何内容分割。比如切出视频中的人物、物体等,可以对目标和背景进行扣除换色等效果设置。
0/小时
数字人
AnchorCrafter:通过人体-物体交互视频生成动画化您的产品销售数字人
AnchorCrafter:通过人体-物体交互视频生成动画化您的产品销售数字人
9
@Ikaros
21
4502H
更新时间2026-02-02
AnchorCrafter,生成带货数字人视频。通过人体-物体交互视频生成动画化您的产品销售数字人
AnchorCrafter,生成带货数字人视频。通过人体-物体交互视频生成动画化您的产品销售数字人
0/小时
数字人
OpenAvatarChat——十字鱼镜像
OpenAvatarChat——十字鱼镜像
71
@十字鱼
十字鱼认证作者
655
8548H
更新时间2026-02-03
支持自启动
阿里开源实时交互数字。 模块化的交互数字人对话实现,能够在单台PC上运行完整功能。
阿里开源实时交互数字。 模块化的交互数字人对话实现,能够在单台PC上运行完整功能。
0/小时
数字人视频生成
HuMo
HuMo
5
@十字鱼
十字鱼认证作者
11
10H
更新时间2026-02-02
支持自启动
以人为中心的视频生成方法——协作多模态条件化
以人为中心的视频生成方法——协作多模态条件化
0/小时
语音合成语音克隆
超强AI音频变声器SeedVC-2.1
超强AI音频变声器SeedVC-2.1
27
@与AI同行
与AI同行认证作者
234
2211H
更新时间2026-03-31
支持自启动
超强AI音频变声器SeedVC-2.1
超强AI音频变声器SeedVC-2.1
0/小时
语音合成语音克隆
最强AI音色克隆IndexTTS-V2-批量生成
最强AI音色克隆IndexTTS-V2-批量生成
188
@与AI同行
与AI同行认证作者
2210
7303H
更新时间2026-03-31
支持自启动
最强AI音色克隆IndexTTS-V2-批量生成
最强AI音色克隆IndexTTS-V2-批量生成
0/小时
数字人
AnchorCrafter-WebUI
AnchorCrafter-WebUI
15
@乔大峰
乔大峰认证作者
13
20H
更新时间2026-02-02
支持自启动
开箱即用,生成真实的带货视频
开箱即用,生成真实的带货视频
0/小时
IndexTTS语音合成
index-tts2 声音克隆
index-tts2 声音克隆
31
@有趣的80后程序员
有趣的80后程序员认证作者
326
1556H
更新时间2025-11-07