优云智算
控制台
立即注册
镜像社区
我的收藏

优云智算镜像社区 - 海量AI模型一键部署

快捷筛选

官方镜像免费镜像支持自启动

AIGC热门

数字人视频超分OCR识别AI漫剧AI音乐AI电商AI应用

图像/视频生成

ComfyUIWanZ-ImageQwen-ImageLTXInfiniteTalkLongCatFlux混元Lora训练SD3D生成图片生成图片编辑视频生成视频编辑

语音/TTS生成

IndexTTSQwen3-TTSCosyVoiceSVC语音合成语音分离语音识别

LLM

DeepSeekQwenGLM推理框架行业模型文本模型ChatBot

计算机视觉

VL视觉理解目标检测图像分割三维重建具身智能

科学计算

分子动力生物信息物理模拟数据分析

其他

其他
默认排序
视频生成
RecommendCount
LTX-2.3视频生成合集!支持文生视频、图生视频、数字人视频等
LTX-2.3视频生成合集!支持文生视频、图生视频、数字人视频等
157
@与AI同行
与AI同行认证作者
2358
4820H
更新时间2026-05-11
支持自启动
开源版Sora2发布,LTX-2.3整合包合集,支持文生视频、图生视频、数字人!支持20s视频、1080P视频直出、批量队列生成、高清放大!
开源版Sora2发布,LTX-2.3整合包合集,支持文生视频、图生视频、数字人!支持20s视频、1080P视频直出、批量队列生成、高清放大!
0/小时
数字人
RecommendCount
LiveTalking
LiveTalking
99
@lipku
lipku认证作者
3880
70617H
更新时间2026-04-13
LiveTalking镜像提供实时交互数字人解决方案,支持ERNerf、MuseTalk、Wav2Lip,实现单张人脸照片驱动的超低延迟(<100ms)唇形同步、表情及头部运动控制。
LiveTalking镜像提供实时交互数字人解决方案,支持ERNerf、MuseTalk、Wav2Lip,实现单张人脸照片驱动的超低延迟(<100ms)唇形同步、表情及头部运动控制。
0/小时
数字人
RecommendCount
最强AI数字人InfiniteTalk-图片和视频数字人
最强AI数字人InfiniteTalk-图片和视频数字人
555
@与AI同行
与AI同行认证作者
12486
83203H
更新时间2026-03-31
支持自启动
支持图片数字人、视频数字人、双人数字人,支持说话+唱歌对口型、长视频、完整歌曲生成、批量生成、高清放大!
支持图片数字人、视频数字人、双人数字人,支持说话+唱歌对口型、长视频、完整歌曲生成、批量生成、高清放大!
0/小时
语音合成语音克隆
RecommendCount
SVC-Fusion
SVC-Fusion
106
@aiguoliuguo
aiguoliuguo认证作者
6676
37367H
更新时间2026-02-27
本整合包将整合So-Vits-SVC4.1、DDSP-SVC-6.3/6.1/6.0、ReFlow-VAE-SVC多种SVC模型训练及推理
本整合包将整合So-Vits-SVC4.1、DDSP-SVC-6.3/6.1/6.0、ReFlow-VAE-SVC多种SVC模型训练及推理
0/小时
LongCat图片生成图片编辑
LongCat-Image-Edit-Turbo,文生图,图生图,局部重绘,4k超分,批量任务,支持50系
LongCat-Image-Edit-Turbo,文生图,图生图,局部重绘,4k超分,批量任务,支持50系
1
@刘悦的技术博客
刘悦的技术博客认证作者
5
0H
更新时间2026-05-12
支持自启动
LongCat-Image-Edit-Turbo,文生图,图生图,局部重绘,4k超分,批量任务,支持50系
LongCat-Image-Edit-Turbo,文生图,图生图,局部重绘,4k超分,批量任务,支持50系
0/小时
ComfyUILTXInfiniteTalk
官方出手:LTX2.3视频人物一键改台词
官方出手:LTX2.3视频人物一键改台词
0
@AI-KSK
AI-KSK认证作者
4
2H
更新时间2026-05-12
支持自启动
基于 LTX2.3 的视频改台词配音镜像,支持新语音生成、口型同步与说话人风格保留。
基于 LTX2.3 的视频改台词配音镜像,支持新语音生成、口型同步与说话人风格保留。
0/小时
语音合成AI音乐
RVC-WebUI
RVC-WebUI
2
@乔大峰
乔大峰认证作者
13
18H
更新时间2026-05-12
RVC-WebUI网页端训练镜像支持RVC/Replay翻唱模型/变声器
RVC-WebUI网页端训练镜像支持RVC/Replay翻唱模型/变声器
0/小时
ComfyUI图片生成
AI绘图开始分叉了!HiDream O1 像素空间新架构 × SenseNova U1 多模态图像工作台
AI绘图开始分叉了!HiDream O1 像素空间新架构 × SenseNova U1 多模态图像工作台
0
@AI-KSK
AI-KSK认证作者
2
3H
更新时间2026-05-11
支持自启动
HiDream O1 探索像素空间生成新架构,SenseNova U1 打通多模态生成、编辑、理解与图文交错,一期看懂 AI 图像工作流的两条新路线。
HiDream O1 探索像素空间生成新架构,SenseNova U1 打通多模态生成、编辑、理解与图文交错,一期看懂 AI 图像工作流的两条新路线。
0/小时
数字人
羲和AI爆款IP口播智能体
羲和AI爆款IP口播智能体
0
@羲和AI爆款IP口播智能体
6
13H
更新时间2026-05-12
支持自启动
羲和AI爆款IP口播智能体官方团队打造
羲和AI爆款IP口播智能体官方团队打造
0/小时
SVC
SVC-Fusion_api_rvc
SVC-Fusion_api_rvc
0
@杭州
156
89H
更新时间2026-05-11
支持自启动
支持了rvc模型算法的SVC-Fusion_api
支持了rvc模型算法的SVC-Fusion_api
0/小时
数字人AI漫剧AI电商
ComfyUI-音图视量产-DD布丁AIGC-多人小说配音-短剧-二创-电商
ComfyUI-音图视量产-DD布丁AIGC-多人小说配音-短剧-二创-电商
5
@DD布丁AIGC
26
35H
更新时间2026-05-11
支持自启动
从多人配音到短剧量产,自研节点驱动的 AIGC 工业化终极方案。(这不只是一个装好插件的镜像,这是一套我跑通了千万级流量、踩过无数坑后,沉淀下来的‘生产力闭环’。)
从多人配音到短剧量产,自研节点驱动的 AIGC 工业化终极方案。(这不只是一个装好插件的镜像,这是一套我跑通了千万级流量、踩过无数坑后,沉淀下来的‘生产力闭环’。)
0/小时
图片生成视频生成AI漫剧
Huobao-Drama
Huobao-Drama
22
@huobao-ai
huobao-ai认证作者
112
365H
更新时间2026-05-11
支持自启动
Huobao Drama 是一个基于 AI 的短剧自动化生产平台,实现从剧本生成、角色设计、分镜制作到视频合成的全流程自动化
Huobao Drama 是一个基于 AI 的短剧自动化生产平台,实现从剧本生成、角色设计、分镜制作到视频合成的全流程自动化
0/小时
LTX视频生成ComfyUI
Sulphur-2-GGUF-图生视频-文生视频,自动补帧,支持50系,自定义分辨率,自适应端口,批量任务队列
Sulphur-2-GGUF-图生视频-文生视频,自动补帧,支持50系,自定义分辨率,自适应端口,批量任务队列
8
@刘悦的技术博客
刘悦的技术博客认证作者
42
70H
更新时间2026-05-09
支持自启动
Sulphur-2-GGUF-图生视频-文生视频,自动补帧,支持50系,自定义分辨率,自适应端口,批量任务队列
Sulphur-2-GGUF-图生视频-文生视频,自动补帧,支持50系,自定义分辨率,自适应端口,批量任务队列
0/小时
数字人
ltx2.3图片可控分镜数字人
ltx2.3图片可控分镜数字人
0
@pappyai
0
0H
更新时间2026-05-11
支持自启动
ltx2.3可控分镜图片数字人生成。
ltx2.3可控分镜图片数字人生成。
0/小时
语音识别
准确率极高的离线字幕.SRT生成,带时间轴,下载即可使用
准确率极高的离线字幕.SRT生成,带时间轴,下载即可使用
0
@星尘小赵
0
0H
更新时间2026-05-11
支持自启动
普通话不标准也能准确率极高的字幕.SRT,带时间轴,下载即可使用,支持中英文
普通话不标准也能准确率极高的字幕.SRT,带时间轴,下载即可使用,支持中英文
0/小时
Qwen
GRPO_qwen2.5_1.5B
GRPO_qwen2.5_1.5B
0
@云龙老师
0
0H
更新时间2026-05-08
通过该镜像可以实现qwen2.5-1.5B的强化学习训练
通过该镜像可以实现qwen2.5-1.5B的强化学习训练
0.1/小时
文本模型数字人行业模型
Gemma-4-26B-A4B-it-Uncensored,8K上下文,AI女友,大语言模型,语音对话,适合甜品卡,支持50系
Gemma-4-26B-A4B-it-Uncensored,8K上下文,AI女友,大语言模型,语音对话,适合甜品卡,支持50系
1
@刘悦的技术博客
刘悦的技术博客认证作者
6
6H
更新时间2026-05-08
支持自启动
Gemma-4-26B-A4B-it-Uncensored,8K上下文,AI女友,大语言模型,语音对话,适合甜品卡,支持50系
Gemma-4-26B-A4B-it-Uncensored,8K上下文,AI女友,大语言模型,语音对话,适合甜品卡,支持50系
0/小时
视频生成Wan
TurboDiffusion清华大学等推出的视频生成加速框架 webUI二次修改构建by科哥
TurboDiffusion清华大学等推出的视频生成加速框架 webUI二次修改构建by科哥
4
@鸡你太美
鸡你太美认证作者
58
47H
更新时间2026-05-08
支持自启动
ai视频生成速度提升百倍!基于wan2.1,wan2.2加速ai优化推理速度
ai视频生成速度提升百倍!基于wan2.1,wan2.2加速ai优化推理速度
0/小时
语音合成
MOSS TTSD 0.7
MOSS TTSD 0.7
1
@super-Z
2
0H
更新时间2026-05-08
MOSS TTSD 0.7,主要用于双人对话生成
MOSS TTSD 0.7,主要用于双人对话生成
0/小时
ComfyUILTX视频生成
Sulphur& 10Eros ltx2.3视频生产解锁镜像
Sulphur& 10Eros ltx2.3视频生产解锁镜像
17
@AI-KSK
AI-KSK认证作者
77
182H
更新时间2026-05-08
支持自启动
Sulphur-10Eros-LTX2.3 解锁视频生产镜像,基于 ComfyUI 搭建,内置 Sulphur Distill BF16、10Eros BF16,支持官方工作流和高自由度私域视频创作。
Sulphur-10Eros-LTX2.3 解锁视频生产镜像,基于 ComfyUI 搭建,内置 Sulphur Distill BF16、10Eros BF16,支持官方工作流和高自由度私域视频创作。
0/小时
ComfyUI图片生成Flux
冰封漫画推文专用镜像
冰封漫画推文专用镜像
1
@冰封团队AIGO
11
18H
更新时间2026-05-08
支持自启动
推文漫画文生图专用镜像
推文漫画文生图专用镜像
0/小时
AI漫剧Lora训练AI电商
20260506_aitoolkit全能lora模型训练王
20260506_aitoolkit全能lora模型训练王
7
@老徐Ai研习社
老徐Ai研习社认证作者
32
164H
更新时间2026-05-06
支持自启动
aitoolkit全能lora模型训练王
aitoolkit全能lora模型训练王
0/小时
其他
anima炼丹v2
anima炼丹v2
1
@zhanglang
14
50H
更新时间2026-05-08
anima炼丹
anima炼丹
0/小时
ComfyUILTX视频生成
LTX-2.3-10Eros-图生视频-文生视频-多人对话-单人数字人
LTX-2.3-10Eros-图生视频-文生视频-多人对话-单人数字人
5
@刘悦的技术博客
刘悦的技术博客认证作者
75
94H
更新时间2026-05-08
支持自启动
LTX-2.3-10Eros-图生视频-文生视频-多人对话-单人数字人,8G显存可用,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
LTX-2.3-10Eros-图生视频-文生视频-多人对话-单人数字人,8G显存可用,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
0/小时
ComfyUI图片生成图片编辑
Pmaster-v3.5-Turbo,文生图,图生图,洗图
Pmaster-v3.5-Turbo,文生图,图生图,洗图
1
@刘悦的技术博客
刘悦的技术博客认证作者
18
16H
更新时间2026-05-08
支持自启动
Pmaster-v3.5-Turbo,文生图,图生图,洗图,6G显存可用,4k超分,局部重绘,自动提示词,支持50系,批量任务队列
Pmaster-v3.5-Turbo,文生图,图生图,洗图,6G显存可用,4k超分,局部重绘,自动提示词,支持50系,批量任务队列
0/小时
ComfyUI图片生成视频生成
sd2-fast在线使用sedance2.0-fast无须排队高并发api企业框架接口视频生成
sd2-fast在线使用sedance2.0-fast无须排队高并发api企业框架接口视频生成
5
@鸡你太美
鸡你太美认证作者
13
23H
更新时间2026-05-08
支持自启动
任意机器可以运行该项目开机自动运行
任意机器可以运行该项目开机自动运行
0/小时
语音合成IndexTTSQwen3-TTS
声音克隆OmniVoice——600+语言音色克隆 - 音色设计 - 多语言语音生成
声音克隆OmniVoice——600+语言音色克隆 - 音色设计 - 多语言语音生成
3
@星尘小赵
22
21H
更新时间2026-05-08
支持自启动
支持600+语言音色克隆 - 音色设计 - 多语言语音生成
支持600+语言音色克隆 - 音色设计 - 多语言语音生成
0/小时
数字人LTX视频生成
LTX-2.3-22B-DISTILLED-1.1-VBVR-文生视频-首尾帧,单图无限时长
LTX-2.3-22B-DISTILLED-1.1-VBVR-文生视频-首尾帧,单图无限时长
17
@刘悦的技术博客
刘悦的技术博客认证作者
124
128H
更新时间2026-05-08
支持自启动
LTX-2.3-22B-DISTILLED-1.1-VBVR-文生视频-首尾帧,单图无限时长,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
LTX-2.3-22B-DISTILLED-1.1-VBVR-文生视频-首尾帧,单图无限时长,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
0/小时
数字人ComfyUILTX
LTX-2.3-22B-DISTILLED-1.1-VBVR-图片数字人-自动补帧
LTX-2.3-22B-DISTILLED-1.1-VBVR-图片数字人-自动补帧
12
@刘悦的技术博客
刘悦的技术博客认证作者
88
100H
更新时间2026-05-08
支持自启动
LTX-2.3-22B-DISTILLED-1.1-VBVR-图片数字人-自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词
LTX-2.3-22B-DISTILLED-1.1-VBVR-图片数字人-自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词
0/小时
LTXComfyUI视频生成
LTX-2.3-DISTILLED-1.1-多人对话-男女对唱-图片数字人
LTX-2.3-DISTILLED-1.1-多人对话-男女对唱-图片数字人
7
@刘悦的技术博客
刘悦的技术博客认证作者
48
71H
更新时间2026-05-08
支持自启动
LTX-2.3-DISTILLED-1.1-多人对话-男女对唱-图片数字人,8G显存可用,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
LTX-2.3-DISTILLED-1.1-多人对话-男女对唱-图片数字人,8G显存可用,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
0/小时
AI漫剧数字人ComfyUI
202604全新ComfyUI整合包,主流模型都有,附带40个实用工作流,体积不到100G
202604全新ComfyUI整合包,主流模型都有,附带40个实用工作流,体积不到100G
35
@老徐Ai研习社
老徐Ai研习社认证作者
383
1618H
更新时间2026-05-11
支持自启动
ComfyUI整合包20260506
ComfyUI整合包20260506
0/小时
图片生成ComfyUI
RedMix-Ernie-Image,4k超分,文生图,图生图,自动提示词,批量任务
RedMix-Ernie-Image,4k超分,文生图,图生图,自动提示词,批量任务
3
@刘悦的技术博客
刘悦的技术博客认证作者
38
17H
更新时间2026-05-02
支持自启动
RedMix-Ernie-Image,4k超分,文生图,图生图,自动提示词,批量任务
RedMix-Ernie-Image,4k超分,文生图,图生图,自动提示词,批量任务
0/小时
LTX视频生成视频编辑
LTX-2.3-DISTILLED-1.1-视频编辑-视频内容修改
LTX-2.3-DISTILLED-1.1-视频编辑-视频内容修改
5
@刘悦的技术博客
刘悦的技术博客认证作者
31
52H
更新时间2026-04-30
支持自启动
LTX-2.3-DISTILLED-1.1-视频编辑-视频内容修改
LTX-2.3-DISTILLED-1.1-视频编辑-视频内容修改
0/小时
语音合成
超强AI语音克隆,VOXCPM-V2合集,语音克隆 | 音色保存 | 多音字 | 批量生成 | 超长文本生成
超强AI语音克隆,VOXCPM-V2合集,语音克隆 | 音色保存 | 多音字 | 批量生成 | 超长文本生成
12
@与AI同行
与AI同行认证作者
73
46H
更新时间2026-04-30
支持自启动
超强AI语音克隆,VOXCPM-V2合集,语音克隆 | 音色保存 | 多音字 | 批量生成 | 超长文本生成
超强AI语音克隆,VOXCPM-V2合集,语音克隆 | 音色保存 | 多音字 | 批量生成 | 超长文本生成
0/小时
其他
sora2文生视频、图生视频工作流
sora2文生视频、图生视频工作流
85
@鸡你太美
鸡你太美认证作者
213
743H
更新时间2026-05-08
支持自启动
增加GPT-image2图片2k4k和gork30秒延长工作流
增加GPT-image2图片2k4k和gork30秒延长工作流
0/小时
ComfyUIFlux图片生成
Flux2 Klein 微操级控图 一致性镜像
Flux2 Klein 微操级控图 一致性镜像
7
@AI-KSK
AI-KSK认证作者
42
44H
更新时间2026-04-30
支持自启动
基于 ComfyUI、Flux2 Klein 9B,集成提示词增强、参考图控制、身份保持、颜色锚定和实验采样,适合保脸换姿势、多图合成、图生图精修与高一致性人像编辑。
基于 ComfyUI、Flux2 Klein 9B,集成提示词增强、参考图控制、身份保持、颜色锚定和实验采样,适合保脸换姿势、多图合成、图生图精修与高一致性人像编辑。
0/小时
AI音乐
最强免费生成音乐,ACE-Step-V1.5-XL,免费版Suno,商业级别音乐效果!
最强免费生成音乐,ACE-Step-V1.5-XL,免费版Suno,商业级别音乐效果!
2
@与AI同行
与AI同行认证作者
17
9H
更新时间2026-04-30
支持自启动
最强免费生成音乐,ACE-Step-V1.5-XL,免费版Suno,商业级别音乐效果
最强免费生成音乐,ACE-Step-V1.5-XL,免费版Suno,商业级别音乐效果
0/小时
具身智能
openVLA
openVLA
1
@
1
0H
更新时间2026-04-30
优云首个openvla推理镜像,实现输入图片,得到动作输出
优云首个openvla推理镜像,实现输入图片,得到动作输出
0.1/小时
Qwen-imageWanLora训练
AiToolKit汉化版
AiToolKit汉化版
100
@Doc_workBox
Doc_workBox认证作者
1639
18456H
更新时间2026-04-27
支持自启动
Aitoolkit汉化版,自适应UI方便手机端查看训练进度
Aitoolkit汉化版,自适应UI方便手机端查看训练进度
0/小时
ComfyUILTX数字人
LTX2.3 大丝袜视频工作流 I2V/T2V/V2V/首尾帧/音频一体化镜像
LTX2.3 大丝袜视频工作流 I2V/T2V/V2V/首尾帧/音频一体化镜像
8
@AI-KSK
AI-KSK认证作者
94
68H
更新时间2026-04-30
支持自启动
LTX2.3 DaSiWa 视频生成整合镜像,基于 ComfyUI 封装,内置 OmniForge 工作流,支持图生视频、文生视频、首尾帧过渡、视频转视频与音频生成
LTX2.3 DaSiWa 视频生成整合镜像,基于 ComfyUI 封装,内置 OmniForge 工作流,支持图生视频、文生视频、首尾帧过渡、视频转视频与音频生成
0/小时
AI音乐Lora训练ComfyUI
ACE-Step-1.5UI音乐生成和Lora训练
ACE-Step-1.5UI音乐生成和Lora训练
19
@梦影Erislia
138
508H
更新时间2026-04-26
ACE-Step-1.5UI音乐生成和Lora训练
ACE-Step-1.5UI音乐生成和Lora训练
0/小时
AI漫剧
融光短视频创作平台webUI开源全流程AI视频创作平台自动化工作流
融光短视频创作平台webUI开源全流程AI视频创作平台自动化工作流
2
@鸡你太美
鸡你太美认证作者
13
39H
更新时间2026-04-27
支持自启动
可以无卡模式运行改项目
可以无卡模式运行改项目
0/小时
图片生成图片编辑
GPT-Image-2,4k超分,文生图,图生图,自动提示词,批量任务,基于国内DMXAPI接口平台
GPT-Image-2,4k超分,文生图,图生图,自动提示词,批量任务,基于国内DMXAPI接口平台
4
@刘悦的技术博客
刘悦的技术博客认证作者
62
52H
更新时间2026-04-26
支持自启动
GPT-Image-2,4k超分,文生图,图生图,自动提示词,批量任务,基于国内DMXAPI接口平台
GPT-Image-2,4k超分,文生图,图生图,自动提示词,批量任务,基于国内DMXAPI接口平台
0/小时
语音合成语音识别
OmniVoice,批量任务,智能字幕SRT配音,多人对话,接口api使用,速度1比0.3,支持超长文本,声音克隆
OmniVoice,批量任务,智能字幕SRT配音,多人对话,接口api使用,速度1比0.3,支持超长文本,声音克隆
4
@刘悦的技术博客
刘悦的技术博客认证作者
36
112H
更新时间2026-04-25
支持自启动
OmniVoice,批量任务,智能字幕SRT配音,多人对话,接口api使用,速度1比0.3,支持超长文本,声音克隆
OmniVoice,批量任务,智能字幕SRT配音,多人对话,接口api使用,速度1比0.3,支持超长文本,声音克隆
0/小时
语音合成
OmniVoice维吾尔语TTS在线webui文本转语音声音专版
OmniVoice维吾尔语TTS在线webui文本转语音声音专版
2
@鸡你太美
鸡你太美认证作者
22
28H
更新时间2026-04-27
支持自启动
维吾尔语TTS在线webui文本转语音声音专版
维吾尔语TTS在线webui文本转语音声音专版
0/小时
图片生成
AI图片新王登基,GPT-Image-2合集,超强图片细节,低至0.04元/张!图片生成 | 多图编辑 | 批量生成 | 最火爆的60+种提示词玩法
AI图片新王登基,GPT-Image-2合集,超强图片细节,低至0.04元/张!图片生成 | 多图编辑 | 批量生成 | 最火爆的60+种提示词玩法
12
@与AI同行
与AI同行认证作者
155
697H
更新时间2026-04-24
支持自启动
AI图片新王登基,GPT-Image-2合集,超强图片细节,低至0.04元/张!图片生成 | 多图编辑 | 批量生成 | 最火爆的60+种提示词玩法
AI图片新王登基,GPT-Image-2合集,超强图片细节,低至0.04元/张!图片生成 | 多图编辑 | 批量生成 | 最火爆的60+种提示词玩法
0/小时
数字人
infinitetakl数字人云端版本
infinitetakl数字人云端版本
7
@pappyai
36
137H
更新时间2026-05-09
支持自启动
infinitetakl数字人,支持单人对口型,双人对口型以及单人视频对口型
infinitetakl数字人,支持单人对口型,双人对口型以及单人视频对口型
0/小时
视频编辑
facefusion3.5.1离线全部模型最新TensorRT加速官方原版图片换脸视频换脸高清图片 构建By科哥
facefusion3.5.1离线全部模型最新TensorRT加速官方原版图片换脸视频换脸高清图片 构建By科哥
30
@鸡你太美
鸡你太美认证作者
420
1752H
更新时间2026-04-27
支持自启动
facefusion3.6.1全模型离线
facefusion3.6.1全模型离线
0/小时
语音合成IndexTTSSVC
动漫短剧多人对话配音ComfyUi_voxcpm2
动漫短剧多人对话配音ComfyUi_voxcpm2
1
@星尘小赵
8
15H
更新时间2026-04-24
支持自启动
支持多种语言的,单多人对话声音克隆配音
支持多种语言的,单多人对话声音克隆配音
0/小时
ComfyUI图片生成
Ernie-Image-AIO-Rapid,4k超分,文生图,图生图,自动提示词,批量任务,支持50系
Ernie-Image-AIO-Rapid,4k超分,文生图,图生图,自动提示词,批量任务,支持50系
6
@刘悦的技术博客
刘悦的技术博客认证作者
43
17H
更新时间2026-04-23
支持自启动
Ernie-Image-AIO-Rapid,4k超分,文生图,图生图,自动提示词,批量任务,支持50系
Ernie-Image-AIO-Rapid,4k超分,文生图,图生图,自动提示词,批量任务,支持50系
0/小时
AI音乐ComfyUILTX
202604ComfyUI全能整合包,LTX2.3最新cu130环境更快更稳定
202604ComfyUI全能整合包,LTX2.3最新cu130环境更快更稳定
11
@老徐Ai研习社
老徐Ai研习社认证作者
134
437H
更新时间2026-04-22
支持自启动
cu130环境更快更稳定
cu130环境更快更稳定
0/小时
IndexTTS语音合成SVC
AI动漫配音—VoxCPM2一键语音克隆、配音、训练、支持LoRA
AI动漫配音—VoxCPM2一键语音克隆、配音、训练、支持LoRA
11
@星尘小赵
58
132H
更新时间2026-04-23
支持自启动
VoxCPM2支持AI动漫配音等多种应用场景,一键语音克隆、配音、训练、支持LoRA
VoxCPM2支持AI动漫配音等多种应用场景,一键语音克隆、配音、训练、支持LoRA
0/小时
文本模型
谷歌最新本地模型gemma4最强智能助理hermes agent一个本地免token的智能助理模型全部离线
谷歌最新本地模型gemma4最强智能助理hermes agent一个本地免token的智能助理模型全部离线
6
@鸡你太美
鸡你太美认证作者
61
89H
更新时间2026-04-27
支持自启动
谷歌最新本地模型gemma4最强智能助理hermes agent一个本地免token的智能助理模型全部离线
谷歌最新本地模型gemma4最强智能助理hermes agent一个本地免token的智能助理模型全部离线
0/小时
推理框架
ollama
ollama
0
@苍耳阿猫
苍耳阿猫认证作者
13
62H
更新时间2026-04-21
ollama-0.21.0
ollama-0.21.0
0/小时
ComfyUIWan视频生成
Wan2.2_LightX2V-260412-文生视频-首尾帧-单图无限时长,自动补帧,自定义分辨率,自适应端口,自动提示词,自动任务控制
Wan2.2_LightX2V-260412-文生视频-首尾帧-单图无限时长,自动补帧,自定义分辨率,自适应端口,自动提示词,自动任务控制
22
@刘悦的技术博客
刘悦的技术博客认证作者
169
303H
更新时间2026-04-20
支持自启动
Wan2.2_LightX2V-260412-文生视频-首尾帧-单图无限时长,自动补帧,自定义分辨率,自适应端口,自动提示词,自动任务控制
Wan2.2_LightX2V-260412-文生视频-首尾帧-单图无限时长,自动补帧,自定义分辨率,自适应端口,自动提示词,自动任务控制
0/小时
ComfyUILTX视频生成
LTX-2.3-DISTILLED-1.1-IC-Lora-动作迁移,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
LTX-2.3-DISTILLED-1.1-IC-Lora-动作迁移,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
11
@刘悦的技术博客
刘悦的技术博客认证作者
172
182H
更新时间2026-04-19
支持自启动
LTX-2.3-DISTILLED-1.1-IC-Lora-动作迁移,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
LTX-2.3-DISTILLED-1.1-IC-Lora-动作迁移,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
0/小时
图片生成视频生成其他
猫影短剧AI驱动的小说转短剧全流程生产平台小说文本自动转换为短剧视频 构建by科哥
猫影短剧AI驱动的小说转短剧全流程生产平台小说文本自动转换为短剧视频 构建by科哥
9
@鸡你太美
鸡你太美认证作者
57
106H
更新时间2026-04-27
支持自启动
可以无卡模式运行改项目0.15元每小时按秒计费
可以无卡模式运行改项目0.15元每小时按秒计费
0/小时
图生文图片生成视频生成
火宝AI短视频创作系统可以无卡模型运行该项目使用前阅读使用说明
火宝AI短视频创作系统可以无卡模型运行该项目使用前阅读使用说明
0
@鸡你太美
鸡你太美认证作者
14
60H
更新时间2026-04-27
支持自启动
可以无卡模式运行改项目0.15元每小时按秒计费
可以无卡模式运行改项目0.15元每小时按秒计费
0/小时
图片生成视频生成其他
moyin AI影视生产级工具支持 Seedance 2.0剧本到成片全流程批量化 构建by科哥
moyin AI影视生产级工具支持 Seedance 2.0剧本到成片全流程批量化 构建by科哥
13
@鸡你太美
鸡你太美认证作者
54
60H
更新时间2026-04-27
支持自启动
可以无卡模式运行改项目0.15元每小时按秒计费
可以无卡模式运行改项目0.15元每小时按秒计费
0/小时
图片生成视频生成
Toonflow一款AI短剧创作工具将小说自动转化为剧本生成 AI 图片和视频的平台 构建by科哥
Toonflow一款AI短剧创作工具将小说自动转化为剧本生成 AI 图片和视频的平台 构建by科哥
9
@鸡你太美
鸡你太美认证作者
50
43H
更新时间2026-04-27
支持自启动
可以无卡模式运行改项目0.15元每小时按秒计费
可以无卡模式运行改项目0.15元每小时按秒计费
0/小时
语音合成Lora训练
VoxCPM2 一键切片打标训练集准备&训练生成一体化镜像
VoxCPM2 一键切片打标训练集准备&训练生成一体化镜像
3
@AI-KSK
AI-KSK认证作者
23
19H
更新时间2026-04-19
支持自启动
集成 VoxCPM2 一键切片、自动打标、训练集整理、LoRA 训练与生成推理,开箱即用的全流程声音克隆训练镜像。
集成 VoxCPM2 一键切片、自动打标、训练集整理、LoRA 训练与生成推理,开箱即用的全流程声音克隆训练镜像。
0/小时
数字人ComfyUIInfiniteTalk
InfiniteTalk数字人量化版
InfiniteTalk数字人量化版
4
@阿凯CDZK6688
46
55H
更新时间2026-05-10
支持自启动
InfiniteTalk数字人量化版4090效果最好,3090也可用
InfiniteTalk数字人量化版4090效果最好,3090也可用
0.1/小时
ComfyUI图片生成
ERNIE-Image:开源图像生成新王炸
ERNIE-Image:开源图像生成新王炸
6
@AI-KSK
AI-KSK认证作者
38
101H
更新时间2026-04-17
支持自启动
ERNIE-Image ComfyUI镜像,集成百度开源文生图模型,擅长文字排版、复杂指令与结构化出图,适合海报、信息图等场景
ERNIE-Image ComfyUI镜像,集成百度开源文生图模型,擅长文字排版、复杂指令与结构化出图,适合海报、信息图等场景
0/小时
语音合成
VoxCPM2雨落版整合包
VoxCPM2雨落版整合包
8
@雨落实战
雨落实战认证作者
73
167H
更新时间2026-04-17
支持自启动
VoxCPM2雨落版整合包,支持多种业务场景
VoxCPM2雨落版整合包,支持多种业务场景
0/小时
ComfyUI图片生成
Ernie-Image-Turbo-uncensored,文生图,图生图,自动提示词,批量任务,支持50系
Ernie-Image-Turbo-uncensored,文生图,图生图,自动提示词,批量任务,支持50系
3
@刘悦的技术博客
刘悦的技术博客认证作者
57
47H
更新时间2026-04-16
支持自启动
Ernie-Image-Turbo-uncensored,文生图,图生图,自动提示词,批量任务,支持50系
Ernie-Image-Turbo-uncensored,文生图,图生图,自动提示词,批量任务,支持50系
0/小时
数字人视频生成
Musetalk训练专用
Musetalk训练专用
0
@有黑眼圈的小竹熊
3
1H
更新时间2026-04-17
支持自启动
Musetalk训练专用
Musetalk训练专用
0.3/小时
Lora训练图片生成其他
二次元AnimaPreview3的Lora训练UI
二次元AnimaPreview3的Lora训练UI
27
@梦影Erislia
266
2206H
更新时间2026-04-15
二次元AnimaPreview3的Lora训练UI
二次元AnimaPreview3的Lora训练UI
0/小时
语音合成
最强AI语音克隆,LongcatAudio合集,语音克隆 | 音色保存 | 多人对话 | 字幕生成语音| 多音字 | 批量生成
最强AI语音克隆,LongcatAudio合集,语音克隆 | 音色保存 | 多人对话 | 字幕生成语音| 多音字 | 批量生成
11
@与AI同行
与AI同行认证作者
81
65H
更新时间2026-04-15
支持自启动
最强AI语音克隆,LongcatAudio合集,语音克隆 | 音色保存 | 多人对话 | 字幕生成语音| 多音字 | 批量生成,6G显存可用!
最强AI语音克隆,LongcatAudio合集,语音克隆 | 音色保存 | 多人对话 | 字幕生成语音| 多音字 | 批量生成,6G显存可用!
0/小时
Lora训练图片生成其他
百度ERNIE-Image的Lora训练AI-TOOLKIT
百度ERNIE-Image的Lora训练AI-TOOLKIT
0
@梦影Erislia
26
211H
更新时间2026-04-15
百度ERNIE-Image的Lora训练AI-TOOLKIT
百度ERNIE-Image的Lora训练AI-TOOLKIT
0/小时
视频生成
VAD-fast3.0 图生视频模型,可批量生成,3分钟出15秒视频
VAD-fast3.0 图生视频模型,可批量生成,3分钟出15秒视频
5
@Ai老邱
34
14H
更新时间2026-04-15
支持自启动
图生视频模型,可真人批量生成,3分钟出15秒视频
图生视频模型,可真人批量生成,3分钟出15秒视频
0/小时
文本模型
hermes-webui中文版支持自定义任意大模型支持微信飞书等接入
hermes-webui中文版支持自定义任意大模型支持微信飞书等接入
2
@鸡你太美
鸡你太美认证作者
11
42H
更新时间2026-04-27
支持自启动
hermes-webui中文版支持自定义任意大模型支持微信飞书等接入
hermes-webui中文版支持自定义任意大模型支持微信飞书等接入
0/小时
AI应用语音合成
ComfyUI_voxcpm全能生成_那颗星星(支持多人配音,支持lora训练,老版本支持)
ComfyUI_voxcpm全能生成_那颗星星(支持多人配音,支持lora训练,老版本支持)
13
@那颗星星
61
202H
更新时间2026-04-15
支持自启动
最强大的VoxCPM节点,支持多人配音、支持训练lora(包含数据集准备节点,傻瓜式操作)、兼容老模型
最强大的VoxCPM节点,支持多人配音、支持训练lora(包含数据集准备节点,傻瓜式操作)、兼容老模型
0/小时
ComfyUILora训练语音合成
VoxCPM2语音克隆工作流LORA训练comfy支持
VoxCPM2语音克隆工作流LORA训练comfy支持
4
@梦影Erislia
38
33H
更新时间2026-04-14
VoxCPM2 TTS语音克隆工作流LORA训练comfy支持
VoxCPM2 TTS语音克隆工作流LORA训练comfy支持
0/小时
语音合成
最强AI音色克隆,OmniVoice合集,音色克隆 | 语气控制 | 音色保存 | 多音字 | 批量生成
最强AI音色克隆,OmniVoice合集,音色克隆 | 语气控制 | 音色保存 | 多音字 | 批量生成
13
@与AI同行
与AI同行认证作者
611
764H
更新时间2026-04-13
支持自启动
最强AI音色克隆,OmniVoice合集,音色克隆 | 语气控制 | 音色保存 | 多音字 | 批量生成
最强AI音色克隆,OmniVoice合集,音色克隆 | 语气控制 | 音色保存 | 多音字 | 批量生成
0/小时
FluxComfyUI图片生成
Flux.2-Klein-9B-GGUF
Flux.2-Klein-9B-GGUF
77
@刘悦的技术博客
刘悦的技术博客认证作者
919
1635H
更新时间2026-04-13
支持自启动
Flux.2-Klein-9B-GGUF,局部重绘,文生图,图像编辑,多图编辑,自动提示词,批量任务,支持最新50系和计算卡
Flux.2-Klein-9B-GGUF,局部重绘,文生图,图像编辑,多图编辑,自动提示词,批量任务,支持最新50系和计算卡
0/小时
语音合成AI音乐
Ace-Step-1.5-XL-Turbo,歌曲生成,音乐生成,文字转歌曲,歌曲创作,支持50系
Ace-Step-1.5-XL-Turbo,歌曲生成,音乐生成,文字转歌曲,歌曲创作,支持50系
4
@刘悦的技术博客
刘悦的技术博客认证作者
31
279H
更新时间2026-04-12
支持自启动
Ace-Step-1.5-XL-Turbo,歌曲生成,音乐生成,文字转歌曲,歌曲创作,支持50系
Ace-Step-1.5-XL-Turbo,歌曲生成,音乐生成,文字转歌曲,歌曲创作,支持50系
0/小时
IndexTTSQwen3-TTSCosyVoice
咸鱼鱼VoxCPM
咸鱼鱼VoxCPM
2
@后期咸鱼鱼-小帆
77
94H
更新时间2026-04-13
支持自启动
VoxCPM2
VoxCPM2
0/小时
语音合成
VoxCPM2
VoxCPM2
2
@鹄仙
鹄仙认证作者
40
200H
更新时间2026-04-11
多语言的声音克隆和设计项目,支持lora训练
多语言的声音克隆和设计项目,支持lora训练
0/小时
语音合成IndexTTS语音识别
LongCat-AudioDiT 剧本创作台
LongCat-AudioDiT 剧本创作台
0
@K哥讲AI
9
141H
更新时间2026-04-13
支持自启动
LongCat-AudioDiT WebUI 是基于该模型的可视化工具,支持音色库管理、剧本队列编排、长文本切分及音频生成,模块化设计配中文注释,本地部署开源免费,小白可轻松实现高质量语音克隆。
LongCat-AudioDiT WebUI 是基于该模型的可视化工具,支持音色库管理、剧本队列编排、长文本切分及音频生成,模块化设计配中文注释,本地部署开源免费,小白可轻松实现高质量语音克隆。
0/小时
AI漫剧
AutoAnimation短剧漫剧自动化工具
AutoAnimation短剧漫剧自动化工具
46
@IAI666
296
1152H
更新时间2026-04-10
AutoAnimation短剧漫剧自动化工具及配套ComfyUI包含ZImage、flux2-kelin、qwenedit2511、wan2.2、qwen-tts、index-tts
AutoAnimation短剧漫剧自动化工具及配套ComfyUI包含ZImage、flux2-kelin、qwenedit2511、wan2.2、qwen-tts、index-tts
0.15/小时
ComfyUILTXLora训练
ltx2.3-aitookit
ltx2.3-aitookit
2
@有趣的80后程序员
有趣的80后程序员认证作者
39
35H
更新时间2026-04-13
支持自启动
ltx2.3 aitookit Lora训练镜像
ltx2.3 aitookit Lora训练镜像
0/小时
IndexTTS语音合成AI应用
indextts-v1.52支持api调用deepspeed推理加速,并发请求,为AI直播优化的版本
indextts-v1.52支持api调用deepspeed推理加速,并发请求,为AI直播优化的版本
1
@屾哥日记
25
3427H
更新时间2026-04-10
支持自启动
indextts-v1.52支持api调用deepspeed推理加速,并发请求,为AI直播优化的版本
indextts-v1.52支持api调用deepspeed推理加速,并发请求,为AI直播优化的版本
0/小时
物理模拟分子动力
Gromacs系列
Gromacs系列
23
@苍耳阿猫
苍耳阿猫认证作者
533
15780H
更新时间2026-04-09
该镜像集成开源高性能分子动力学模拟软件,通过强化多精度算法与GPU并行加速(支持NVIDIA/AMD显卡)实现纳秒级生物大分子运动模拟,优化AI辅助建模与超大体系计算效率,提供跨平台开箱即用解决方案
该镜像集成开源高性能分子动力学模拟软件,通过强化多精度算法与GPU并行加速(支持NVIDIA/AMD显卡)实现纳秒级生物大分子运动模拟,优化AI辅助建模与超大体系计算效率,提供跨平台开箱即用解决方案
0/小时
GLMOCR识别
GLM-OCR
GLM-OCR
1
@苍耳阿猫
苍耳阿猫认证作者
3
1H
更新时间2026-04-09
GLM-OCR
GLM-OCR
0/小时
语音合成Qwen3-TTSAI电商
【VoxCPM2/Qwen3TTS/IndexTTS2/OmniVoice】N合一AI语音整合TTS ALL in ONE
【VoxCPM2/Qwen3TTS/IndexTTS2/OmniVoice】N合一AI语音整合TTS ALL in ONE
79
@淼淼爸的ai笔记
淼淼爸的ai笔记认证作者
901
4727H
更新时间2026-04-09
支持自启动
本镜像专为AI语音直播项目打造,也可以直接在线推理webui使用,集成VoxCPM2/IndexTTS-2等, 支持API调用,直播带货,tiktok直播,在线克隆,语气语调自然,音色还原度高
本镜像专为AI语音直播项目打造,也可以直接在线推理webui使用,集成VoxCPM2/IndexTTS-2等, 支持API调用,直播带货,tiktok直播,在线克隆,语气语调自然,音色还原度高
0/小时
语音合成语音识别
VOXCPM2语音合成,TTS,多音字控制,接口API调用,语速调节,支持50系,支持老显卡,音色保存,方言控制,开源阅读,支持超长文本
VOXCPM2语音合成,TTS,多音字控制,接口API调用,语速调节,支持50系,支持老显卡,音色保存,方言控制,开源阅读,支持超长文本
7
@刘悦的技术博客
刘悦的技术博客认证作者
93
102H
更新时间2026-04-08
支持自启动
VOXCPM2语音合成,TTS,多音字控制,接口API调用,语速调节,支持50系,支持老显卡,音色保存,方言控制,开源阅读,支持超长文本
VOXCPM2语音合成,TTS,多音字控制,接口API调用,语速调节,支持50系,支持老显卡,音色保存,方言控制,开源阅读,支持超长文本
0/小时
AI音乐
AI音乐制作ACE-Step-1.5XL官方包
AI音乐制作ACE-Step-1.5XL官方包
7
@鹄仙
鹄仙认证作者
45
206H
更新时间2026-04-08
专业级别的AI音乐制作项目升级XL
专业级别的AI音乐制作项目升级XL
0/小时
文本模型推理框架
Gemma-4 + GPT-OSS-120B 双破限大模型 WebUI 开箱即用镜像
Gemma-4 + GPT-OSS-120B 双破限大模型 WebUI 开箱即用镜像
19
@AI-KSK
AI-KSK认证作者
90
100H
更新时间2026-04-09
支持自启动
基于 Ollama + Open WebUI 搭建的双破限大模型共享镜像,集成 Gemma-4 与 GPT-OSS-120B 两类核心模型,支持浏览器直接访问与可视化聊天。
基于 Ollama + Open WebUI 搭建的双破限大模型共享镜像,集成 Gemma-4 与 GPT-OSS-120B 两类核心模型,支持浏览器直接访问与可视化聊天。
0/小时
数字人LTXComfyUI
LTX-2.3-VBVR-图片数字人,真正无限时长,分片推理,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
LTX-2.3-VBVR-图片数字人,真正无限时长,分片推理,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
11
@刘悦的技术博客
刘悦的技术博客认证作者
93
159H
更新时间2026-04-07
支持自启动
LTX-2.3-VBVR-图片数字人,真正无限时长,分片推理,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
LTX-2.3-VBVR-图片数字人,真正无限时长,分片推理,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
0/小时
视频生成LTX
LTX-2.3-VBVR-文生视频-首尾帧,单图无限时长,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
LTX-2.3-VBVR-文生视频-首尾帧,单图无限时长,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
12
@刘悦的技术博客
刘悦的技术博客认证作者
99
105H
更新时间2026-04-07
支持自启动
LTX-2.3-VBVR-文生视频-首尾帧,单图无限时长,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
LTX-2.3-VBVR-文生视频-首尾帧,单图无限时长,自动补帧,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
0/小时
语音合成语音识别
OmniVoice,接口api使用,支持600种语言,4G显存可用,速度1比0.3,文本指令,支持呻吟笑声,文字转语音,支持超长文本,声音克隆,小米k2-fsa团队开源
OmniVoice,接口api使用,支持600种语言,4G显存可用,速度1比0.3,文本指令,支持呻吟笑声,文字转语音,支持超长文本,声音克隆,小米k2-fsa团队开源
15
@刘悦的技术博客
刘悦的技术博客认证作者
180
687H
更新时间2026-04-05
支持自启动
OmniVoice,接口api使用,支持600种语言,4G显存可用,速度1比0.3,文本指令,支持呻吟笑声,文字转语音,支持超长文本,声音克隆,小米k2-fsa团队开源
OmniVoice,接口api使用,支持600种语言,4G显存可用,速度1比0.3,文本指令,支持呻吟笑声,文字转语音,支持超长文本,声音克隆,小米k2-fsa团队开源
0/小时
语音合成语音识别
LongCat-AudioDiT-1B-3.5B,TTS,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,文字转语音,TTS
LongCat-AudioDiT-1B-3.5B,TTS,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,文字转语音,TTS
2
@刘悦的技术博客
刘悦的技术博客认证作者
39
40H
更新时间2026-04-05
支持自启动
LongCat-AudioDiT-1B-3.5B,6G显存可用,TTS,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,文字转语音,TTS
LongCat-AudioDiT-1B-3.5B,6G显存可用,TTS,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,文字转语音,TTS
0/小时
语音合成
ComfyUI-OmniVoice-TTS小米团队开源单人多人声音克隆语音克隆捏声音
ComfyUI-OmniVoice-TTS小米团队开源单人多人声音克隆语音克隆捏声音
3
@鸡你太美
鸡你太美认证作者
38
31H
更新时间2026-04-27
支持自启动
ComfyUI-OmniVoice-TTS小米团队开源单人多人声音克隆语音克隆捏声音
ComfyUI-OmniVoice-TTS小米团队开源单人多人声音克隆语音克隆捏声音
0/小时
其他
trading-agents针对国内股票的股票交易Agent
trading-agents针对国内股票的股票交易Agent
1
@鸡你太美
鸡你太美认证作者
7
45H
更新时间2026-04-27
支持自启动
trading-agents针对国内股票的股票交易Agent
trading-agents针对国内股票的股票交易Agent
0/小时
视频生成
最强AI视频抠像,MatAnyone2,超强抠像效果,支持超长视频!
最强AI视频抠像,MatAnyone2,超强抠像效果,支持超长视频!
8
@与AI同行
与AI同行认证作者
69
124H
更新时间2026-04-06
支持自启动
最强AI视频抠像,MatAnyone2,超强抠像效果,支持超长视频!
最强AI视频抠像,MatAnyone2,超强抠像效果,支持超长视频!
0/小时
Lora训练
ai-toolkit全能Lora模型训练王
ai-toolkit全能Lora模型训练王
11
@老徐Ai研习社
老徐Ai研习社认证作者
153
2038H
更新时间2026-04-09
支持自启动
主流模型都有
主流模型都有
0/小时
ComfyUI视频生成视频编辑
wan2.2动作迁移
wan2.2动作迁移
18
@
166
47H
更新时间2026-04-02
wan2.2动作迁移
wan2.2动作迁移
0/小时
ComfyUIQwen-Image图片编辑
Qwen-Edit-2511-Rapid-V23,图像编辑,表情控制,多图编辑,自动提示词,批量任务,支持50系
Qwen-Edit-2511-Rapid-V23,图像编辑,表情控制,多图编辑,自动提示词,批量任务,支持50系
21
@刘悦的技术博客
刘悦的技术博客认证作者
247
707H
更新时间2026-04-01
支持自启动
Qwen-Edit-2511-Rapid-V23,图像编辑,表情控制,多图编辑,自动提示词,批量任务,支持50系
Qwen-Edit-2511-Rapid-V23,图像编辑,表情控制,多图编辑,自动提示词,批量任务,支持50系
0/小时
AI应用图片编辑图像分割
Live2d神器一键拆分See-through
Live2d神器一键拆分See-through
37
@梦影Erislia
568
1305H
更新时间2026-03-31
Live2d神器一键拆分See-through
Live2d神器一键拆分See-through
0/小时
语音合成
MOSS-TTS 语音模型
MOSS-TTS 语音模型
5
@刘悦的技术博客
刘悦的技术博客认证作者
50
64H
更新时间2026-03-31
支持自启动
MOSS-TTS,接口API,语音合成,声音克隆,TTS,支持超长文本,支持50系
MOSS-TTS,接口API,语音合成,声音克隆,TTS,支持超长文本,支持50系
0/小时
ComfyUILTX视频生成
LTX-2.3-Transition-文生视频
LTX-2.3-Transition-文生视频
6
@刘悦的技术博客
刘悦的技术博客认证作者
107
115H
更新时间2026-03-30
支持自启动
LTX-2.3-Transition-文生视频-首尾帧,无限时长,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
LTX-2.3-Transition-文生视频-首尾帧,无限时长,支持50系,自定义分辨率,自适应端口,自动提示词,批量任务队列
0/小时
ComfyUIWan视频生成
Wan 2.2 无限制 3.0
Wan 2.2 无限制 3.0
37
@AI-KSK
AI-KSK认证作者
351
636H
更新时间2026-04-09
集成 SmoothMix T2V 3.0 与 Remix I2V 3.0,支持无限制文本生视频与图生视频创作,兼顾画质、动态、运镜与一致性,适合快速出片与高完成度表达。
集成 SmoothMix T2V 3.0 与 Remix I2V 3.0,支持无限制文本生视频与图生视频创作,兼顾画质、动态、运镜与一致性,适合快速出片与高完成度表达。
0/小时
视频生成
X-Dub-WebUI
X-Dub-WebUI
1
@鸡你太美
鸡你太美认证作者
12
8H
更新时间2026-04-27
支持自启动
X-Dub-WebUI可灵团队推出的视频驱动唇形生成与任意尺寸视频数字人视频生成 二次开发webui构建By科哥
X-Dub-WebUI可灵团队推出的视频驱动唇形生成与任意尺寸视频数字人视频生成 二次开发webui构建By科哥
0/小时
LTX视频生成数字人
LTX-2.3-Transition--图片数字人
LTX-2.3-Transition--图片数字人
10
@刘悦的技术博客
刘悦的技术博客认证作者
83
91H
更新时间2026-03-30
支持自启动
LTX-2.3-Transition--图片数字人,更好的稳定性,无限时长,支持50系,自定义分辨率
LTX-2.3-Transition--图片数字人,更好的稳定性,无限时长,支持50系,自定义分辨率
0/小时
图片生成图片编辑
最强AI图片编辑,FireRed-Edit整合包合集,商用顶级图片效果!
最强AI图片编辑,FireRed-Edit整合包合集,商用顶级图片效果!
25
@与AI同行
与AI同行认证作者
240
477H
更新时间2026-03-31
支持自启动
最强AI图片编辑,FireRed-Edit整合包合集,商用顶级图片效果!支持多图编辑、局部涂抹编辑、高清放大,解压即用,一键启动!
最强AI图片编辑,FireRed-Edit整合包合集,商用顶级图片效果!支持多图编辑、局部涂抹编辑、高清放大,解压即用,一键启动!
0/小时
ComfyUI视频编辑视频生成
陈晨的comfyui云端镜像系列
陈晨的comfyui云端镜像系列
11
@陈晨
97
183H
更新时间2026-03-30
支持自启动
内置多个工作流 开箱即用
内置多个工作流 开箱即用
0/小时
数字人ComfyUI视频生成
图片·声音·视频·2603comfyui全能整合包
图片·声音·视频·2603comfyui全能整合包
30
@老徐Ai研习社
老徐Ai研习社认证作者
293
1953H
更新时间2026-03-26
支持自启动
图片·声音·视频·2603comfyui全能整合包
图片·声音·视频·2603comfyui全能整合包
0/小时
ComfyUILTX视频生成
LTX-2.3 LoRA训练 +AIToolkit 4090/48G/5090 一键开训
LTX-2.3 LoRA训练 +AIToolkit 4090/48G/5090 一键开训
5
@AI-KSK
AI-KSK认证作者
62
321H
更新时间2026-03-28
集成AIToolkit与LTX-2 LoRA训练全套环境,适配4090 48G/5090预设参数,支持一键启动、缓存优化、依赖预装,开箱即可进行音视频LoRA训练
集成AIToolkit与LTX-2 LoRA训练全套环境,适配4090 48G/5090预设参数,支持一键启动、缓存优化、依赖预装,开箱即可进行音视频LoRA训练
0/小时
数字人ComfyUIFlux
LTX2.3 创作增强旗舰版
LTX2.3 创作增强旗舰版
17
@AI-KSK
AI-KSK认证作者
121
205H
更新时间2026-03-26
基于LTX2.3深度整合的全功能创作镜像,集成ID-LoRA、换头、局部重绘、多图首尾帧等特色能力,环境完整、依赖丰富,适合视频生成、角色一致性控制与多场景创作。
基于LTX2.3深度整合的全功能创作镜像,集成ID-LoRA、换头、局部重绘、多图首尾帧等特色能力,环境完整、依赖丰富,适合视频生成、角色一致性控制与多场景创作。
0/小时
LTXLora训练视频生成
LTX2.3Lora训练用AI-toolkit,简单配置一键训练
LTX2.3Lora训练用AI-toolkit,简单配置一键训练
4
@梦影Erislia
96
1425H
更新时间2026-03-25
LTX2.3Lora训练用AI-toolkit,简单配置一键训练
LTX2.3Lora训练用AI-toolkit,简单配置一键训练
0/小时
其他
那颗星星自制香蕉pro和sora2工作流
那颗星星自制香蕉pro和sora2工作流
30
@那颗星星
280
2972H
更新时间2026-03-25
支持自启动
内含我所有自制的comfyui节点和工作流
内含我所有自制的comfyui节点和工作流
0/小时
ComfyUIWan视频生成
Wan2.2-ReMixV3.0
Wan2.2-ReMixV3.0
27
@刘悦的技术博客
刘悦的技术博客认证作者
337
575H
更新时间2026-03-30
支持自启动
Wan2.2-ReMixV3.0-SVI2-VBVR,文生视频,图生视频,无限时长,首尾帧,自动补帧,自适应端口号,支持50系,支持批量任务
Wan2.2-ReMixV3.0-SVI2-VBVR,文生视频,图生视频,无限时长,首尾帧,自动补帧,自适应端口号,支持50系,支持批量任务
0/小时
ComfyUILTX图片编辑
Comfy打开即用LTX2.3Dasiwa视频生成qwen图像编辑
Comfy打开即用LTX2.3Dasiwa视频生成qwen图像编辑
8
@梦影Erislia
65
250H
更新时间2026-03-24
Comfy打开即用LTX2.3Dasiwa视频生成qwen图像编辑
Comfy打开即用LTX2.3Dasiwa视频生成qwen图像编辑
0/小时
数据分析其他
MiroFish一个ai预测系统数据模型预测ai系统 构建by科哥
MiroFish一个ai预测系统数据模型预测ai系统 构建by科哥
3
@鸡你太美
鸡你太美认证作者
16
34H
更新时间2026-04-27
支持自启动
MiroFish一个ai预测系统数据模型预测ai系统 构建by科哥
MiroFish一个ai预测系统数据模型预测ai系统 构建by科哥
0/小时
ComfyUI视频编辑Wan
Animate动作迁移
Animate动作迁移
34
@小猪AI-闲鱼
293
839H
更新时间2026-03-23
支持自启动
完美复刻视频主体动作
完美复刻视频主体动作
0/小时
AI应用视频编辑图片编辑
MatAnyone2
MatAnyone2
3
@刘悦的技术博客
刘悦的技术博客认证作者
78
90H
更新时间2026-03-23
支持自启动
MatAnyone2,视频图片一键去背,换背景,智能提取前景主体,支持GPU和纯CPU推理,绿幕生成器
MatAnyone2,视频图片一键去背,换背景,智能提取前景主体,支持GPU和纯CPU推理,绿幕生成器
0/小时
语音合成SVC
SVC-WebUI
SVC-WebUI
57
@乔大峰
乔大峰认证作者
1244
14452H
更新时间2026-04-22
一键训练SVC模型,支持上传压缩干声文件,训练完成发送提醒,一键清空训练环境,追求的就是高效率
一键训练SVC模型,支持上传压缩干声文件,训练完成发送提醒,一键清空训练环境,追求的就是高效率
0/小时
AI音乐
SoulX-Singer-SVC
SoulX-Singer-SVC
10
@鹄仙
鹄仙认证作者
100
212H
更新时间2026-03-20
一键翻唱神器
一键翻唱神器
0/小时
Lora训练LTX其他
LTX2.3Lora训练支持Musubi-tuner
LTX2.3Lora训练支持Musubi-tuner
4
@梦影Erislia
73
352H
更新时间2026-03-18
LTX2.3Lora训练支持Musubi-tuner
LTX2.3Lora训练支持Musubi-tuner
0/小时
Qwen3-TTS语音合成语音识别
Faster-Qwen3-TTS
Faster-Qwen3-TTS
13
@刘悦的技术博客
刘悦的技术博客认证作者
102
353H
更新时间2026-03-18
支持自启动
Faster-Qwen3-TTS,流式接口API,实时推理,速度1比0.5,多人对话,智能多音字,4G显存可用,批量任务,支持超长文本,支持50系显卡,支持老显卡
Faster-Qwen3-TTS,流式接口API,实时推理,速度1比0.5,多人对话,智能多音字,4G显存可用,批量任务,支持超长文本,支持50系显卡,支持老显卡
0/小时
语音合成
Fish-Speech-S2-Pro-4B
Fish-Speech-S2-Pro-4B
6
@刘悦的技术博客
刘悦的技术博客认证作者
83
191H
更新时间2026-03-18
支持自启动
Fish-Speech-S2-Pro-4B,接口api使用,支持62种语言,文本指令,文字转语音,声音克隆,zero-shot
Fish-Speech-S2-Pro-4B,接口api使用,支持62种语言,文本指令,文字转语音,声音克隆,zero-shot
0/小时
AI音乐
SongGeneration音乐生成
SongGeneration音乐生成
6
@鹄仙
鹄仙认证作者
20
15H
更新时间2026-03-20
音乐生成工具,应用简单
音乐生成工具,应用简单
0/小时
ComfyUIZ-Image图片生成
Z-Image Turbo 无限制生成控制放大一体化镜像
Z-Image Turbo 无限制生成控制放大一体化镜像
27
@AI-KSK
AI-KSK认证作者
302
677H
更新时间2026-03-13
集成文生图、图生图、ControlNet 控制、提示词优化、放大增强等全员破限工作流。
集成文生图、图生图、ControlNet 控制、提示词优化、放大增强等全员破限工作流。
0/小时
ComfyUIWan视频超分
视频批量补帧、超分放大与细节修复,ComfyUI视频增强镜像,Seedance2.0黄金搭档
视频批量补帧、超分放大与细节修复,ComfyUI视频增强镜像,Seedance2.0黄金搭档
27
@AI-KSK
AI-KSK认证作者
143
456H
更新时间2026-03-12
集成 FlashVSR / GIMM / LTX-2 / SeedVR2 的 ComfyUI 视频增强镜像,一键批量补帧、放大、细节修复。
集成 FlashVSR / GIMM / LTX-2 / SeedVR2 的 ComfyUI 视频增强镜像,一键批量补帧、放大、细节修复。
0/小时
LTXComfyUI数字人
LTX-2.3-GGUF-图片数字人
LTX-2.3-GGUF-图片数字人
13
@刘悦的技术博客
刘悦的技术博客认证作者
183
336H
更新时间2026-03-18
支持自启动
LTX-2.3-GGUF-图片数字人-无限时长,更好的一致性,8步采样,支持50系,自定义分辨率,自动补帧,自动提示词,批量任务队列
LTX-2.3-GGUF-图片数字人-无限时长,更好的一致性,8步采样,支持50系,自定义分辨率,自动补帧,自动提示词,批量任务队列
0/小时
ComfyUILTX视频生成
LTX-2.3-GGUF-图生视频
LTX-2.3-GGUF-图生视频
24
@刘悦的技术博客
刘悦的技术博客认证作者
332
561H
更新时间2026-03-18
支持自启动
LTX-2.3-GGUF-图生视频-无限时长,更好的一致性,8步采样,自定义分辨率,自动补帧,自动提示词,批量任务队列
LTX-2.3-GGUF-图生视频-无限时长,更好的一致性,8步采样,自定义分辨率,自动补帧,自动提示词,批量任务队列
0/小时
Lora训练推理框架文本模型
大模型微调部署测评_LLaMa-Factory>vLLM>opencompass
大模型微调部署测评_LLaMa-Factory>vLLM>opencompass
2
@影赤
26
141H
更新时间2026-03-10
大模型微调部署测评全流程环境已安装
大模型微调部署测评全流程环境已安装
0/小时
ComfyUILTXWan
图片-声音-视频Comfyui全量整合包-LTX2.3-Wan2.2-Z-Image-Turbo漫剧全能助手
图片-声音-视频Comfyui全量整合包-LTX2.3-Wan2.2-Z-Image-Turbo漫剧全能助手
56
@老徐Ai研习社
老徐Ai研习社认证作者
574
3714H
更新时间2026-03-10
支持自启动
漫剧全能助手
漫剧全能助手
0/小时
ComfyUIQwen-Image图片编辑
FireRed-ImageEdit-V1.1-GGUF
FireRed-ImageEdit-V1.1-GGUF
20
@刘悦的技术博客
刘悦的技术博客认证作者
158
214H
更新时间2026-03-18
支持自启动
FireRed-ImageEdit-V1.1-GGUF,局部重绘,图像编辑,4步采样,多图编辑,支持50系,自定义分辨率
FireRed-ImageEdit-V1.1-GGUF,局部重绘,图像编辑,4步采样,多图编辑,支持50系,自定义分辨率
0/小时
LTXComfyUI视频生成
LTX-2.3 开源音视频一体生成模型|文生视频+图生视频
LTX-2.3 开源音视频一体生成模型|文生视频+图生视频
11
@AI-KSK
AI-KSK认证作者
119
365H
更新时间2026-03-10
基于 LTX-2.3 的音视频一体生成模型镜像,支持文生视频、图生视频等常见生成方式
基于 LTX-2.3 的音视频一体生成模型镜像,支持文生视频、图生视频等常见生成方式
0/小时
Lora训练
Z-Image 模型一站式训练 & 推理-None_Z-trainer
Z-Image 模型一站式训练 & 推理-None_Z-trainer
5
@zypAIGC
26
9H
更新时间2026-03-06
支持自启动
Z-Image 模型一站式训练 & 推理-None_Z-trainer
Z-Image 模型一站式训练 & 推理-None_Z-trainer
0.2/小时
ComfyUIWan视频生成
Wan2.2-SmoothMixV20-SVI2-VBVR,图生视频,无限时长,自动补帧,8步采样,无须手动复制粘贴节点,,支持批量任务,Comfyui
Wan2.2-SmoothMixV20-SVI2-VBVR,图生视频,无限时长,自动补帧,8步采样,无须手动复制粘贴节点,,支持批量任务,Comfyui
36
@刘悦的技术博客
刘悦的技术博客认证作者
409
895H
更新时间2026-03-06
支持自启动
Wan2.2-SmoothMixV20-SVI2-VBVR,图生视频,无限时长,自动补帧,8步采样,无须手动复制粘贴节点,,支持批量任务,Comfyui
Wan2.2-SmoothMixV20-SVI2-VBVR,图生视频,无限时长,自动补帧,8步采样,无须手动复制粘贴节点,,支持批量任务,Comfyui
0/小时
Lora训练
diffusion-pipe+ai-toolkit丹炉
diffusion-pipe+ai-toolkit丹炉
3
@zypAIGC
6
10H
更新时间2026-03-06
支持自启动
diffusion-pipe+ai-toolkit
diffusion-pipe+ai-toolkit
0.1/小时
ComfyUIZ-Image图片生成
Qwen3-4b-Z-Image-Engineer,文生图,图生图,洗图,6G显存可用,局部重绘,自动提示词,支持50系,批量任务队列
Qwen3-4b-Z-Image-Engineer,文生图,图生图,洗图,6G显存可用,局部重绘,自动提示词,支持50系,批量任务队列
28
@刘悦的技术博客
刘悦的技术博客认证作者
317
581H
更新时间2026-03-10
支持自启动
Qwen3-4b-Z-Image-Engineer,文生图,图生图,洗图,6G显存可用,局部重绘,自动提示词,支持50系,批量任务队列
Qwen3-4b-Z-Image-Engineer,文生图,图生图,洗图,6G显存可用,局部重绘,自动提示词,支持50系,批量任务队列
0/小时
视频生成
SoulX-FlashTalk数字人视频图片生成ai数字人说话数字人 webui二次开发
SoulX-FlashTalk数字人视频图片生成ai数字人说话数字人 webui二次开发
4
@鸡你太美
鸡你太美认证作者
1
20H
更新时间2026-05-09
支持自启动
SoulX-FlashTalk数字人视频图片生成ai数字人说话数字人 webui二次开发 构建by科哥
SoulX-FlashTalk数字人视频图片生成ai数字人说话数字人 webui二次开发 构建by科哥
0/小时
生物信息分子动力
RFantibody
RFantibody
0
@苍耳阿猫
苍耳阿猫认证作者
1
0H
更新时间2026-03-03
RFantibody
RFantibody
0/小时
AI应用
OpenClaw / ClawdBot
OpenClaw / ClawdBot
20
@优云智算
497
11261H
更新时间2026-03-16
OpenClaw 2026.3.2版本,支持飞书、Telegram接入,支持优云智算模型API
OpenClaw 2026.3.2版本,支持飞书、Telegram接入,支持优云智算模型API
0/小时
数字人WanLTX
SoulX-FlashHead-图片数字人,支持贴回全身数字人,低配版InfiniteTalk,唱歌数字人,支持长视频
SoulX-FlashHead-图片数字人,支持贴回全身数字人,低配版InfiniteTalk,唱歌数字人,支持长视频
17
@刘悦的技术博客
刘悦的技术博客认证作者
115
177H
更新时间2026-03-03
支持自启动
SoulX-FlashHead-图片数字人,支持贴回全身数字人,低配版InfiniteTalk,唱歌数字人,支持长视频
SoulX-FlashHead-图片数字人,支持贴回全身数字人,低配版InfiniteTalk,唱歌数字人,支持长视频
0/小时
Qwen
Qwen3.5_35b_a3b_Q4_K_M
Qwen3.5_35b_a3b_Q4_K_M
4
@
44
323H
更新时间2026-03-02
qwen3.5
qwen3.5
0.1/小时
ComfyUIWan视频生成
Wan2.2双增强:UnifiedReward让文生视频更符合审美预期,VBVR让图生视频更符合真实运动逻辑
Wan2.2双增强:UnifiedReward让文生视频更符合审美预期,VBVR让图生视频更符合真实运动逻辑
9
@AI-KSK
AI-KSK认证作者
179
417H
更新时间2026-03-06
这个镜像内置 Wan2.2 两套增强技术:UnifiedReward 让文生视频更好看、更符合偏好,VBVR 让图生视频动作更合理、更符合逻辑。
这个镜像内置 Wan2.2 两套增强技术:UnifiedReward 让文生视频更好看、更符合偏好,VBVR 让图生视频动作更合理、更符合逻辑。
0/小时
语音识别Qwen3-TTS语音分离
Qwen3-ASR-1.7B,语音转文字字幕,视频转字幕,支持50系显卡,批量任务,支持热词控制
Qwen3-ASR-1.7B,语音转文字字幕,视频转字幕,支持50系显卡,批量任务,支持热词控制
8
@刘悦的技术博客
刘悦的技术博客认证作者
75
252H
更新时间2026-02-27
支持自启动
Qwen3-ASR-1.7B,语音转文字字幕,视频转字幕,支持50系显卡,批量任务,支持热词控制
Qwen3-ASR-1.7B,语音转文字字幕,视频转字幕,支持50系显卡,批量任务,支持热词控制
0/小时
InfiniteTalk其他数字人
life学员
life学员
4
@life
35
200H
更新时间2026-02-28
life学员专用数字人镜像
life学员专用数字人镜像
0/小时
ComfyUIWan视频生成
Comfy漫画上色DasiWa视频支持自由拉取C站模型更新等
Comfy漫画上色DasiWa视频支持自由拉取C站模型更新等
7
@梦影Erislia
64
267H
更新时间2026-02-27
Comfy漫画上色DasiWa视频支持自由拉取C站模型更新等
Comfy漫画上色DasiWa视频支持自由拉取C站模型更新等
0/小时
视频生成
超快视频替换背景Video-BGR
超快视频替换背景Video-BGR
16
@与AI同行
与AI同行认证作者
50
40H
更新时间2026-03-31
支持自启动
超快视频替换背景Video-BGR
超快视频替换背景Video-BGR
0/小时
AI音乐AI应用SVC
SVC-Fusion_api
SVC-Fusion_api
2
@aiguoliuguo
aiguoliuguo认证作者
126
366H
更新时间2026-03-04
支持自启动
SVC Fusion-api服务端
SVC Fusion-api服务端
0/小时
数字人视频超分
HeyGem数字人最新Onnx优化版,多人同时驱动,多人指定面部驱动,接口API调用,支持50系,面部超分,推理速度1比1,唱歌数字人,批量任务
HeyGem数字人最新Onnx优化版,多人同时驱动,多人指定面部驱动,接口API调用,支持50系,面部超分,推理速度1比1,唱歌数字人,批量任务
33
@刘悦的技术博客
刘悦的技术博客认证作者
533
1641H
更新时间2026-03-09
支持自启动
HeyGem数字人最新Onnx优化版,多人同时驱动,多人指定面部驱动,接口API调用,支持50系,面部超分,推理速度1比1,唱歌数字人,批量任务
HeyGem数字人最新Onnx优化版,多人同时驱动,多人指定面部驱动,接口API调用,支持50系,面部超分,推理速度1比1,唱歌数字人,批量任务
0/小时
AI应用
DocCaptioner 打标器
DocCaptioner 打标器
14
@Doc_workBox
Doc_workBox认证作者
127
216H
更新时间2026-02-26
支持自启动
Doc的打标器,支持 Qwen3vl及 API 调用
Doc的打标器,支持 Qwen3vl及 API 调用
0.1/小时
语音合成语音识别
 Ming-omni-tts-0.5B,接口API调用,支持超长文本,情感控制,中英混读,支持50系显卡
Ming-omni-tts-0.5B,接口API调用,支持超长文本,情感控制,中英混读,支持50系显卡
5
@刘悦的技术博客
刘悦的技术博客认证作者
38
326H
更新时间2026-02-25
支持自启动
Ming-omni-tts-0.5B,接口API调用,支持超长文本,情感控制,中英混读,支持50系显卡
Ming-omni-tts-0.5B,接口API调用,支持超长文本,情感控制,中英混读,支持50系显卡
0/小时
语音识别
FireRedASR2S语音识别转文字语音转文本音频转文本模型ai系统 二次构建开发 by科哥
FireRedASR2S语音识别转文字语音转文本音频转文本模型ai系统 二次构建开发 by科哥
2
@鸡你太美
鸡你太美认证作者
21
10H
更新时间2026-04-27
支持自启动
FireRedASR2S语音识别转文字语音转文本音频转文本模型ai系统 二次构建开发 by科哥
FireRedASR2S语音识别转文字语音转文本音频转文本模型ai系统 二次构建开发 by科哥
0/小时
ComfyUI视频生成Wan
终极角色动画合集镜像Wan 2.2、SCAIL、SteadyDancer、OneToAll 和VACE Phantom
终极角色动画合集镜像Wan 2.2、SCAIL、SteadyDancer、OneToAll 和VACE Phantom
15
@AI-KSK
AI-KSK认证作者
43
32H
更新时间2026-02-26
Wan 2.2、SCAIL、SteadyDancer、OneToAll 和VACE_Skyreels_V3_R2V的“五合一”整合镜像
Wan 2.2、SCAIL、SteadyDancer、OneToAll 和VACE_Skyreels_V3_R2V的“五合一”整合镜像
0/小时
目标检测
羊羊小栈-YOLO目标检测大模型分析系统
羊羊小栈-YOLO目标检测大模型分析系统
1
@
15
126H
更新时间2026-02-25
支持自启动
YOLO模型训练
YOLO模型训练
0/小时
语音合成
AudioX 统一音频生成平台通过一段提示词一段视频推理一段配音音效 webui汉化构建by科哥
AudioX 统一音频生成平台通过一段提示词一段视频推理一段配音音效 webui汉化构建by科哥
2
@鸡你太美
鸡你太美认证作者
26
56H
更新时间2026-04-27
支持自启动
AudioX 统一音频生成平台通过一段提示词一段视频推理一段配音音效 webui汉化构建by科哥
AudioX 统一音频生成平台通过一段提示词一段视频推理一段配音音效 webui汉化构建by科哥
0/小时
文本模型行业模型推理框架
HunYuan-MT-7B-abliterated,40种多国语言无限制双向翻译,长文本翻译,字幕翻译,双语字幕,腾讯开源,不文明用语翻译
HunYuan-MT-7B-abliterated,40种多国语言无限制双向翻译,长文本翻译,字幕翻译,双语字幕,腾讯开源,不文明用语翻译
2
@刘悦的技术博客
刘悦的技术博客认证作者
12
6H
更新时间2026-02-25
支持自启动
HunYuan-MT-7B-abliterated,40种多国语言无限制双向翻译,长文本翻译,字幕翻译,双语字幕,腾讯开源,不文明用语翻译
HunYuan-MT-7B-abliterated,40种多国语言无限制双向翻译,长文本翻译,字幕翻译,双语字幕,腾讯开源,不文明用语翻译
0/小时
ComfyUIQwen-Image图片编辑
FireRed-ImageEdit,图像编辑,多图编辑,支持50系,自定义分辨率,自动提示词,批量任务队列,基于Comfyui
FireRed-ImageEdit,图像编辑,多图编辑,支持50系,自定义分辨率,自动提示词,批量任务队列,基于Comfyui
26
@刘悦的技术博客
刘悦的技术博客认证作者
262
478H
更新时间2026-02-25
支持自启动
FireRed-ImageEdit,图像编辑,多图编辑,支持50系,自定义分辨率,自动提示词,批量任务队列,基于Comfyui
FireRed-ImageEdit,图像编辑,多图编辑,支持50系,自定义分辨率,自动提示词,批量任务队列,基于Comfyui
0/小时
图片生成AI应用
BitDance-14B高速自回归生图模型,自启动WebUI版测试镜像
BitDance-14B高速自回归生图模型,自启动WebUI版测试镜像
0
@AI-KSK
AI-KSK认证作者
24
32H
更新时间2026-02-25
支持自启动
BitDance-14B自启动 WebUI 测试镜像:开箱即用、中文可用、512/1024 双分辨率支持,面向高效验证与稳定出图。
BitDance-14B自启动 WebUI 测试镜像:开箱即用、中文可用、512/1024 双分辨率支持,面向高效验证与稳定出图。
0/小时
AI音乐语音识别
SoulX-Singer歌曲翻唱 带官方Midi编辑器
SoulX-Singer歌曲翻唱 带官方Midi编辑器
5
@鹄仙
鹄仙认证作者
51
38H
更新时间2026-03-20
SoulX-Singer歌曲翻唱 带官方Midi编辑器完成精细翻唱编辑
SoulX-Singer歌曲翻唱 带官方Midi编辑器完成精细翻唱编辑
0/小时
语音合成Qwen3-TTS
Qwen3-TTS-AllinOne
Qwen3-TTS-AllinOne
37
@刘悦的技术博客
刘悦的技术博客认证作者
435
1581H
更新时间2026-02-27
支持自启动
Qwen3-TTS-AllinOne,多音字控制,英文数字发音纠正,批量任务,音色保存,接口API调用,支持超长文本,语速调节,文字转语音,TTS
Qwen3-TTS-AllinOne,多音字控制,英文数字发音纠正,批量任务,音色保存,接口API调用,支持超长文本,语速调节,文字转语音,TTS
0/小时
图片生成视频生成
Penguin-Magic一个图片视频API在线生成的无限画布的批量生成工作流开源项目 构建by科哥
Penguin-Magic一个图片视频API在线生成的无限画布的批量生成工作流开源项目 构建by科哥
1
@鸡你太美
鸡你太美认证作者
6
13H
更新时间2026-04-27
支持自启动
Penguin-Magic一个图片视频API在线生成的无限画布的批量生成工作流开源项目 构建by科哥 版权属于原作者
Penguin-Magic一个图片视频API在线生成的无限画布的批量生成工作流开源项目 构建by科哥 版权属于原作者
0/小时
数字人
LiveTalking_GPT-SOVITS-V2_Ollama_洛曦AI数字人
LiveTalking_GPT-SOVITS-V2_Ollama_洛曦AI数字人
26
@Ikaros
68
666H
更新时间2026-02-24
LiveTalking + GPT-SOVITS V2 + Ollama + FunASR 洛曦AI定制版,实时语音对话数字人 + 直播版数字人
LiveTalking + GPT-SOVITS V2 + Ollama + FunASR 洛曦AI定制版,实时语音对话数字人 + 直播版数字人
0/小时
视频超分
最快AI视频高清修复FlashVSR-支持批量生成
最快AI视频高清修复FlashVSR-支持批量生成
123
@与AI同行
与AI同行认证作者
2247
9187H
更新时间2026-03-31
支持自启动
最快AI视频高清修复FlashVSR
最快AI视频高清修复FlashVSR
0/小时
语音合成语音分离AI音乐
SoulX-Singer
SoulX-Singer
14
@刘悦的技术博客
刘悦的技术博客认证作者
90
70H
更新时间2026-02-27
支持自启动
SoulX-Singer,零样本变声器,AI歌曲翻唱,歌词修改,改歌词,语音内容修改
SoulX-Singer,零样本变声器,AI歌曲翻唱,歌词修改,改歌词,语音内容修改
0/小时
ComfyUIWanQwen-Image
ComfyUI云端整合包2602
ComfyUI云端整合包2602
20
@鹄仙
鹄仙认证作者
219
1130H
更新时间2026-02-13
全面升级到torch2.10+cu130
全面升级到torch2.10+cu130
0/小时
音乐语音分离语音识别
AI音乐制作项目ACE-Step-1.5官方包
AI音乐制作项目ACE-Step-1.5官方包
9
@鹄仙
鹄仙认证作者
81
577H
更新时间2026-02-25
专业级别的AI音乐制作项目
专业级别的AI音乐制作项目
0/小时
AI音乐
ACE-Step-1.5,AI歌曲生成,男女对唱,纯音乐生成
ACE-Step-1.5,AI歌曲生成,男女对唱,纯音乐生成
11
@刘悦的技术博客
刘悦的技术博客认证作者
54
122H
更新时间2026-02-25
支持自启动
ACE-Step-1.5,AI歌曲生成,男女对唱,纯音乐生成
ACE-Step-1.5,AI歌曲生成,男女对唱,纯音乐生成
0/小时
3D生成
UltraShape-1.0
UltraShape-1.0
1
@苍耳阿猫
苍耳阿猫认证作者
21
35H
更新时间2026-02-25
UltraShape-1.0
UltraShape-1.0
0/小时
AI应用视频生成视频编辑
LingBot-World
LingBot-World
0
@敢敢のwings
敢敢のwings认证作者
16
67H
更新时间2026-02-25
蚂蚁集团旗下具身智能公司灵波科技(Robbyant)正式开源了其世界模型 LingBot-World。这一消息发布后迅速登顶全球社交媒体热榜,引发了人工智能领域的广泛关注
蚂蚁集团旗下具身智能公司灵波科技(Robbyant)正式开源了其世界模型 LingBot-World。这一消息发布后迅速登顶全球社交媒体热榜,引发了人工智能领域的广泛关注
0/小时
视频生成
最强AI生成数字人,InfiniteTalk官方版 v260209
最强AI生成数字人,InfiniteTalk官方版 v260209
23
@与AI同行
与AI同行认证作者
428
2645H
更新时间2026-03-31
支持自启动
最强AI生成数字人,InfiniteTalk官方版 v260209,支持图片数字人,支持超长视频、批量队列生成!
最强AI生成数字人,InfiniteTalk官方版 v260209,支持图片数字人,支持超长视频、批量队列生成!
0/小时
ComfyUIIndexTTSWan
comfyui工作站
comfyui工作站
13
@AI绘视玩家
133
859H
更新时间2026-02-10
支持自启动
集成图片生成|视频生成|数字人|声音编辑|音乐生成!配套Comfyui批量管理生成软件到(B站)【AI绘视玩家】处获取~
集成图片生成|视频生成|数字人|声音编辑|音乐生成!配套Comfyui批量管理生成软件到(B站)【AI绘视玩家】处获取~
0/小时
ComfyUIWan数字人
Comfyui2月最新整合包,含最新klein、Z-image全系、WAN全系、LTX2.0等
Comfyui2月最新整合包,含最新klein、Z-image全系、WAN全系、LTX2.0等
63
@老许爱吃肉丶
337
1486H
更新时间2026-02-25
支持自启动
自用!Comfyui2月最新整合包,含最新klein、Z-image全系、WAN全系、LTX2.0等
自用!Comfyui2月最新整合包,含最新klein、Z-image全系、WAN全系、LTX2.0等
0/小时
语音合成AI音乐
ACE-Step-1.5官方原版,修复吞歌词问题,音乐重构,音乐重绘,AI歌曲生成,男女对唱,纯音乐生成,相关竞品:DiffRhythm/yuE/HeartMuLa
ACE-Step-1.5官方原版,修复吞歌词问题,音乐重构,音乐重绘,AI歌曲生成,男女对唱,纯音乐生成,相关竞品:DiffRhythm/yuE/HeartMuLa
6
@刘悦的技术博客
刘悦的技术博客认证作者
39
27H
更新时间2026-02-25
支持自启动
ACE-Step-1.5官方原版,修复吞歌词问题,音乐重构,音乐重绘,AI歌曲生成,男女对唱,纯音乐生成,相关竞品:DiffRhythm/yuE/HeartMuLa
ACE-Step-1.5官方原版,修复吞歌词问题,音乐重构,音乐重绘,AI歌曲生成,男女对唱,纯音乐生成,相关竞品:DiffRhythm/yuE/HeartMuLa
0/小时
ComfyUI视频生成数字人
LTX2-Rapid-Merges视频生成
LTX2-Rapid-Merges视频生成
46
@AI-KSK
AI-KSK认证作者
251
407H
更新时间2026-02-25
包含了文生、图生、首尾帧、对口型 4 大类工作流,提供SFW/NSFW的完整体验
包含了文生、图生、首尾帧、对口型 4 大类工作流,提供SFW/NSFW的完整体验
0/小时
其他
ROX Quant 3.0 - 量化投研系统可无卡模式运行 投资有风险交易须谨慎
ROX Quant 3.0 - 量化投研系统可无卡模式运行 投资有风险交易须谨慎
4
@鸡你太美
鸡你太美认证作者
11
33H
更新时间2026-04-27
支持自启动
ROX Quant 3.0 - 量化投研系统可无卡模式运行 投资有风险交易须谨慎
ROX Quant 3.0 - 量化投研系统可无卡模式运行 投资有风险交易须谨慎
0/小时
语音合成语音克隆
【Qwen3TTS】声音克隆 音色定制 长文本推理优化镜像
【Qwen3TTS】声音克隆 音色定制 长文本推理优化镜像
16
@两只鸽子
197
336H
更新时间2026-02-25
支持自启动
Qwen3TTS推理镜像
Qwen3TTS推理镜像
0/小时
InfiniteTalk数字人
InfiniteTalk数字人最新官方更新,上下文循环,一致性和速度优化,4步采样,高清放大,批量任务队列,基于comfyui,工作流
InfiniteTalk数字人最新官方更新,上下文循环,一致性和速度优化,4步采样,高清放大,批量任务队列,基于comfyui,工作流
42
@刘悦的技术博客
刘悦的技术博客认证作者
557
801H
更新时间2026-02-06
支持自启动
InfiniteTalk数字人最新官方更新,上下文循环,一致性和速度优化,4步采样,高清放大,批量任务队列,基于comfyui,工作流
InfiniteTalk数字人最新官方更新,上下文循环,一致性和速度优化,4步采样,高清放大,批量任务队列,基于comfyui,工作流
0/小时
ComfyUI
ComfyUI-建筑效果图
ComfyUI-建筑效果图
2
@
10
168H
更新时间2026-02-06
支持自启动
用于建筑效果图的生成与编辑
用于建筑效果图的生成与编辑
0/小时
语音合成AI音乐
K哥配音工作室(indextts2音色克隆+qwen3-tts音色生成+HeartMuLay音乐生成)
K哥配音工作室(indextts2音色克隆+qwen3-tts音色生成+HeartMuLay音乐生成)
16
@K哥讲AI
288
629H
更新时间2026-02-05
支持自启动
多功能配音镜像,融合 indextts2.qwen3-tts音色克隆 HeartMuLa音乐生成,支持多角色配音、文本创音色、一键克隆、音乐一键生成,还有 AI 角色分配.基础音色库及多语言.方言配音
多功能配音镜像,融合 indextts2.qwen3-tts音色克隆 HeartMuLa音乐生成,支持多角色配音、文本创音色、一键克隆、音乐一键生成,还有 AI 角色分配.基础音色库及多语言.方言配音
0/小时
ComfyUILTX
ComfyUI云端整合包LTX-2特别版
ComfyUI云端整合包LTX-2特别版
19
@鹄仙
鹄仙认证作者
55
200H
更新时间2026-02-12
支持LTX-2 scail wan2.2系列
支持LTX-2 scail wan2.2系列
0/小时
图片生成Z-Image
red-Z-Image-Base,15步采样,自定义分辨率,文生图,图生图,自动提示词,批量任务
red-Z-Image-Base,15步采样,自定义分辨率,文生图,图生图,自动提示词,批量任务
18
@刘悦的技术博客
刘悦的技术博客认证作者
200
104H
更新时间2026-02-04
支持自启动
red-Z-Image-Base,15步采样,自定义分辨率,文生图,图生图,自动提示词,批量任务
red-Z-Image-Base,15步采样,自定义分辨率,文生图,图生图,自动提示词,批量任务
0/小时
Qwen语音识别
Qwen-ASR
Qwen-ASR
0
@有黑眼圈的小竹熊
19
61H
更新时间2026-02-04
Qwen3-ASR 系列包括 Qwen3-ASR-1.7B 和 Qwen3-ASR-0.6B,支持 52 种语言和方言的语言识别与语音识别(ASR)。
Qwen3-ASR 系列包括 Qwen3-ASR-1.7B 和 Qwen3-ASR-0.6B,支持 52 种语言和方言的语言识别与语音识别(ASR)。
0.3/小时
ComfyUILTX
LTX-2-RapID-GGUF-图生视频-无限时长
LTX-2-RapID-GGUF-图生视频-无限时长
17
@刘悦的技术博客
刘悦的技术博客认证作者
123
214H
更新时间2026-02-04
支持自启动
LTX-2-RapID-GGUF-图生视频-无限时长
LTX-2-RapID-GGUF-图生视频-无限时长
0/小时
ComfyUILTX
LTX-2-RapID-GGUF-图片数字人-无限时长
LTX-2-RapID-GGUF-图片数字人-无限时长
9
@刘悦的技术博客
刘悦的技术博客认证作者
42
52H
更新时间2026-02-05
支持自启动
LTX-2-RapID-GGUF-图片数字人-无限时长
LTX-2-RapID-GGUF-图片数字人-无限时长
0/小时
推理框架Qwen
nano-vllm
nano-vllm
0
@kq123jk6n9
7
35H
更新时间2026-02-03
从0到1,理解vllm的核心内容。包含注释讲解和使用实例,使用教程。帮助大家学习vllm
从0到1,理解vllm的核心内容。包含注释讲解和使用实例,使用教程。帮助大家学习vllm
0.99/小时
ComfyUILTX
LTX2-视频生成最新整个大包(202602)
LTX2-视频生成最新整个大包(202602)
12
@NiuGee
NiuGee认证作者
96
126H
更新时间2026-02-04
支持自启动
震惊!LTX-2开源视频模型,人人都能当导演?牛哥一键整合免费AI创作神器!
震惊!LTX-2开源视频模型,人人都能当导演?牛哥一键整合免费AI创作神器!
0/小时
其他
Sora2API:一个将sora账号转为API服务接口的免费开源系统
Sora2API:一个将sora账号转为API服务接口的免费开源系统
2
@鸡你太美
鸡你太美认证作者
10
26H
更新时间2026-04-27
支持自启动
Sora2API:一个将sora账号转为API服务接口的免费开源系统
Sora2API:一个将sora账号转为API服务接口的免费开源系统
0/小时
WanQwen-Image数字人
数字人-语音克隆-wan2.2视频换人换装-Qwen-Image-Edit2509整合包
数字人-语音克隆-wan2.2视频换人换装-Qwen-Image-Edit2509整合包
83
@老徐Ai研习社
老徐Ai研习社认证作者
819
2564H
更新时间2026-02-02
支持自启动
数字人-语音克隆-wan2.2视频换人换装-Qwen-Image-Edit2511整合包
数字人-语音克隆-wan2.2视频换人换装-Qwen-Image-Edit2511整合包
0/小时
OCR识别
LightOn-OCR-1B,图片和PDF文字提取,图文混排,实时生成MarkDown文档,MarkDown文档下载,支持PDF全量解析
LightOn-OCR-1B,图片和PDF文字提取,图文混排,实时生成MarkDown文档,MarkDown文档下载,支持PDF全量解析
1
@刘悦的技术博客
刘悦的技术博客认证作者
14
0H
更新时间2026-02-02
支持自启动
LightOn-OCR-1B,图片和PDF文字提取,图文混排,实时生成MarkDown文档,MarkDown文档下载,支持PDF全量解析
LightOn-OCR-1B,图片和PDF文字提取,图文混排,实时生成MarkDown文档,MarkDown文档下载,支持PDF全量解析
0/小时
FluxWanComfyUI
Bob同学的comfyui云端镜像系列
Bob同学的comfyui云端镜像系列
361
@Bob同学
Bob同学认证作者
5893
19071H
更新时间2026-02-01
支持自启动
此版本内置 (Wan2.2\Flux\Kontext)系列的全部基础模型及工作流
此版本内置 (Wan2.2\Flux\Kontext)系列的全部基础模型及工作流
0/小时
图片生成Z-ImageQwen-Image
最全图片编辑模型大全-qwen2511多角度工作流-flux2-klein-9b全图片编辑模型-z-image-base图片生成模型
最全图片编辑模型大全-qwen2511多角度工作流-flux2-klein-9b全图片编辑模型-z-image-base图片生成模型
22
@匹夫
匹夫认证作者
294
1097H
更新时间2026-02-04
最全图片编辑模型大全-qwen2511多角度工作流-flux2-klein-9b全图片编辑模型-z-image-base图片生成模型
最全图片编辑模型大全-qwen2511多角度工作流-flux2-klein-9b全图片编辑模型-z-image-base图片生成模型
0/小时
Lora训练Z-Image
Z-Image-Base的Lora训练同时支持FluxKlein-AI-TOOLKIT
Z-Image-Base的Lora训练同时支持FluxKlein-AI-TOOLKIT
9
@梦影Erislia
132
1193H
更新时间2026-02-02
Z-Image-Base的Lora训练同时支持FluxKlein-AI-TOOLKIT
Z-Image-Base的Lora训练同时支持FluxKlein-AI-TOOLKIT
0/小时
Lora训练LTXWan
ai-toolkit全能Lora模型训练器
ai-toolkit全能Lora模型训练器
15
@老徐Ai研习社
老徐Ai研习社认证作者
263
2018H
更新时间2026-02-01
支持自启动
支持主流模型lora训练
支持主流模型lora训练
0/小时
图片生成Lora训练
AI图片ZImage模型训练,一键启动WebUI、无需配置
AI图片ZImage模型训练,一键启动WebUI、无需配置
48
@与AI同行
与AI同行认证作者
428
1758H
更新时间2026-03-31
支持自启动
AI图片ZImage模型训练,一键启动WebUI、无需配置
AI图片ZImage模型训练,一键启动WebUI、无需配置
0/小时
图片生成Z-Image
Nunchaku-ZImage极速出图
Nunchaku-ZImage极速出图
4
@Tanjie7
25
4H
更新时间2026-01-30
ZImage Nunchaku版本,已经配置好nunchaku环境,可以直接启动使用comfyui+nunchaku zimage出图
ZImage Nunchaku版本,已经配置好nunchaku环境,可以直接启动使用comfyui+nunchaku zimage出图
0/小时
ComfyUIWan视频生成
2026最新ComfyUI整合包_图片·视频·声音
2026最新ComfyUI整合包_图片·视频·声音
20
@老徐Ai研习社
老徐Ai研习社认证作者
233
3939H
更新时间2026-01-30
支持自启动
2026最新ComfyUI整合包_图片·视频·声音
2026最新ComfyUI整合包_图片·视频·声音
0/小时
图片生成Z-Image
Z-Image-Base,35步采样,文生图,图生图,自动提示词,批量任务
Z-Image-Base,35步采样,文生图,图生图,自动提示词,批量任务
14
@刘悦的技术博客
刘悦的技术博客认证作者
151
175H
更新时间2026-01-29
支持自启动
Z-Image-Base,35步采样,文生图,图生图,自动提示词,批量任务
Z-Image-Base,35步采样,文生图,图生图,自动提示词,批量任务
0/小时
ComfyUI
Comfyui 一张照片制作一个lora训练数据集
Comfyui 一张照片制作一个lora训练数据集
23
@Prompt娄
163
820H
更新时间2026-01-29
支持自启动
一张照片制作一个角色一致性lora训练数据集
一张照片制作一个角色一致性lora训练数据集
0/小时
Z-Image图片生成
Z-Image
Z-Image
19
@十字鱼
十字鱼认证作者
130
902H
更新时间2026-01-30
支持自启动
Z-Image是一个拥有6B参数的强大且高效的图像生成模型。
Z-Image是一个拥有6B参数的强大且高效的图像生成模型。
0/小时
语音克隆
超级AI语音Qwen3-TTS合集,超强音色克隆、音色设计、情绪控制!
超级AI语音Qwen3-TTS合集,超强音色克隆、音色设计、情绪控制!
47
@与AI同行
与AI同行认证作者
479
1128H
更新时间2026-03-31
支持自启动
超强AI语音生成,Qwen3-TTS整合包合集!超强音色克隆、音色设计、情绪控制,支持音色保存、多音字、超长文本生成。支持批量上传多个文件生成!
超强AI语音生成,Qwen3-TTS整合包合集!超强音色克隆、音色设计、情绪控制,支持音色保存、多音字、超长文本生成。支持批量上传多个文件生成!
0/小时
图片生成Z-Image
Z-Image系列,Base+Tubro反推生图放大一体化
Z-Image系列,Base+Tubro反推生图放大一体化
8
@社恐的知识树
社恐的知识树认证作者
47
189H
更新时间2026-01-28
支持自启动
阿里开源的Z-Image系列模型
阿里开源的Z-Image系列模型
0/小时
DeepSeekOCR识别
DeepSeek-OCR-2
DeepSeek-OCR-2
1
@敢敢のwings
敢敢のwings认证作者
74
3048H
更新时间2026-01-29
DeepSeek-OCR 2 是 DeepSeek 团队开源的新一代 OCR 模型,该模型能够像人类一样带着逻辑去阅读文档。
DeepSeek-OCR 2 是 DeepSeek 团队开源的新一代 OCR 模型,该模型能够像人类一样带着逻辑去阅读文档。
0/小时
ComfyUI
ComfyUI学习版,内置多种基础模型-MumuOpenK
ComfyUI学习版,内置多种基础模型-MumuOpenK
25
@MumuOpenK
506
9951H
更新时间2026-01-29
支持自启动
内置多种基础模型,快速开启comfyui体验
内置多种基础模型,快速开启comfyui体验
0/小时
数字人语音合成语音克隆
AI音乐、声音克隆:顶级数字人长视频套件V2
AI音乐、声音克隆:顶级数字人长视频套件V2
5
@AI-KSK
AI-KSK认证作者
29
34H
更新时间2026-02-11
镜像打通HeartMuLa音乐、Qwen3-TTS音色克隆、InfiniteTalk/LongCat长对话数字人与LTX2视频:写歌配音→照片开口→长时稳成片。
镜像打通HeartMuLa音乐、Qwen3-TTS音色克隆、InfiniteTalk/LongCat长对话数字人与LTX2视频:写歌配音→照片开口→长时稳成片。
0/小时
语音合成Qwen3-TTS
Qwen3-TTS语音模型, | 声音克隆 | 语音定制 | 语音预设 |
Qwen3-TTS语音模型, | 声音克隆 | 语音定制 | 语音预设 |
10
@社恐的知识树
社恐的知识树认证作者
114
84H
更新时间2026-01-27
阿里千问开源的最新语音类模型,显存占用小,生成速度快,支持10种主流语言。
阿里千问开源的最新语音类模型,显存占用小,生成速度快,支持10种主流语言。
0/小时
AI音乐
HeartMuLa-HL,支持中文提示词,无须标签式歌词,更自然的AI歌曲生成,开源版Suno
HeartMuLa-HL,支持中文提示词,无须标签式歌词,更自然的AI歌曲生成,开源版Suno
3
@刘悦的技术博客
刘悦的技术博客认证作者
40
28H
更新时间2026-01-26
支持自启动
HeartMuLa-HL,支持中文提示词,无须标签式歌词,更自然的AI歌曲生成,开源版Suno
HeartMuLa-HL,支持中文提示词,无须标签式歌词,更自然的AI歌曲生成,开源版Suno
0/小时
AI音乐Qwen3-TTS
HeartMula& Qwen3TTS 歌曲生成与语音设计
HeartMula& Qwen3TTS 歌曲生成与语音设计
0
@鹄仙
鹄仙认证作者
11
2H
更新时间2026-01-29
基于HeartMula和Qwen3TTS的歌曲生成与语音设计
基于HeartMula和Qwen3TTS的歌曲生成与语音设计
0/小时
FluxLora训练
Flux.Klein模型Lora训练AI-Toolkit
Flux.Klein模型Lora训练AI-Toolkit
12
@梦影Erislia
115
816H
更新时间2026-01-26
Flux.Klein模型Lora训练AI-Toolkit
Flux.Klein模型Lora训练AI-Toolkit
0/小时
语音合成Qwen3-TTS
Qwen3-TTS-0.6B,推理速度1比0.5,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
Qwen3-TTS-0.6B,推理速度1比0.5,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
5
@刘悦的技术博客
刘悦的技术博客认证作者
42
25H
更新时间2026-01-26
支持自启动
Qwen3-TTS-0.6B,推理速度1比0.5,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
Qwen3-TTS-0.6B,推理速度1比0.5,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
0/小时
语音合成Qwen3-TTS
Qwen3-TTS-语音克隆工作流合集
Qwen3-TTS-语音克隆工作流合集
5
@匹夫
匹夫认证作者
60
80H
更新时间2026-01-26
Qwen3-TTS-语音克隆工作流合集
Qwen3-TTS-语音克隆工作流合集
0/小时
语音合成Qwen3-TTS
Qwen3-TTS捏声音自定义声音tts语音克隆语音克隆声音flash_attn加速版Comfyui工作流版 构建by科哥
Qwen3-TTS捏声音自定义声音tts语音克隆语音克隆声音flash_attn加速版Comfyui工作流版 构建by科哥
13
@鸡你太美
鸡你太美认证作者
145
291H
更新时间2026-04-27
支持自启动
Qwen3-TTS捏声音自定义声音tts语音克隆语音克隆声音flash_attn加速版Comfyui工作流版 构建by科哥
Qwen3-TTS捏声音自定义声音tts语音克隆语音克隆声音flash_attn加速版Comfyui工作流版 构建by科哥
0/小时
语音合成Qwen3-TTS
Qwen3-TTS-1.7B,Flash-Attn加速,音色保存,接口API调用,支持超长文本,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
Qwen3-TTS-1.7B,Flash-Attn加速,音色保存,接口API调用,支持超长文本,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
8
@刘悦的技术博客
刘悦的技术博客认证作者
111
172H
更新时间2026-01-26
支持自启动
Qwen3-TTS-1.7B,Flash-Attn加速,音色保存,接口API调用,支持超长文本,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
Qwen3-TTS-1.7B,Flash-Attn加速,音色保存,接口API调用,支持超长文本,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
0/小时
OCR识别
LightOnOCR-2高效的1B参数视觉语言模型用于OCR识别pdf转文本jpg转文本图片转文本 二次开发构建by科哥
LightOnOCR-2高效的1B参数视觉语言模型用于OCR识别pdf转文本jpg转文本图片转文本 二次开发构建by科哥
1
@鸡你太美
鸡你太美认证作者
3
2H
更新时间2026-04-27
支持自启动
LightOnOCR-2高效的1B参数视觉语言模型用于OCR识别pdf转文本jpg转文本图片转文本 二次开发构建by科哥
LightOnOCR-2高效的1B参数视觉语言模型用于OCR识别pdf转文本jpg转文本图片转文本 二次开发构建by科哥
0/小时
Lora训练LTX
LTX2模型Lora训练AI-Toolkit
LTX2模型Lora训练AI-Toolkit
2
@梦影Erislia
17
127H
更新时间2026-01-24
LTX2模型Lora训练AI-Toolkit
LTX2模型Lora训练AI-Toolkit
0/小时
AI音乐
HeartMuLa,AI歌曲生成,开源版Suno
HeartMuLa,AI歌曲生成,开源版Suno
8
@刘悦的技术博客
刘悦的技术博客认证作者
14
9H
更新时间2026-01-23
支持自启动
HeartMuLa,AI歌曲生成,开源版Suno
HeartMuLa,AI歌曲生成,开源版Suno
0/小时
AI音乐
歌曲与音效生成
歌曲与音效生成
3
@老徐Ai研习社
老徐Ai研习社认证作者
19
6H
更新时间2026-01-22
支持自启动
HeartMula根据歌词生成音乐,根据画面生成音效
HeartMula根据歌词生成音乐,根据画面生成音效
0/小时
GLM文本模型
GLM-4.7-Flash
GLM-4.7-Flash
2
@苍耳阿猫
苍耳阿猫认证作者
34
168H
更新时间2026-01-22
GLM-4.7-Flash
GLM-4.7-Flash
0/小时
语音识别
微软开源VibeVoice ASR  TTS集合webui语音到文本 文本到语音模型 二次卡发构建by科哥
微软开源VibeVoice ASR TTS集合webui语音到文本 文本到语音模型 二次卡发构建by科哥
1
@鸡你太美
鸡你太美认证作者
14
1H
更新时间2026-04-27
支持自启动
微软开源VibeVoice ASR TTS集合webui语音到文本 文本到语音模型 二次卡发构建by科哥
微软开源VibeVoice ASR TTS集合webui语音到文本 文本到语音模型 二次卡发构建by科哥
0/小时
视频生成
超强视频替换人物MoCha
超强视频替换人物MoCha
64
@与AI同行
与AI同行认证作者
415
535H
更新时间2026-03-31
支持自启动
最新视频替换人物,MoCha-Preview 整合包,支持视频替换人物,卡通动漫效果更佳,支持添加批量任务, 支持高清修复
最新视频替换人物,MoCha-Preview 整合包,支持视频替换人物,卡通动漫效果更佳,支持添加批量任务, 支持高清修复
0/小时
GLM文本模型
智普开源GLM-4.7-Flash GGUF推理服务编程文本大模型速度很快 webui开发构建by科哥
智普开源GLM-4.7-Flash GGUF推理服务编程文本大模型速度很快 webui开发构建by科哥
2
@鸡你太美
鸡你太美认证作者
20
56H
更新时间2026-04-27
支持自启动
智普开源GLM-4.7-Flash GGUF推理服务编程文本大模型API+webui开发构建by科哥
智普开源GLM-4.7-Flash GGUF推理服务编程文本大模型API+webui开发构建by科哥
0/小时
LTXLora训练
AIToolkit Ltx-2 Lora Training,4090 24G / 48G / 5090 预设多挡位支持
AIToolkit Ltx-2 Lora Training,4090 24G / 48G / 5090 预设多挡位支持
5
@AI-KSK
AI-KSK认证作者
63
453H
更新时间2026-01-22
基于AI Toolkit,内置4090、48G及5090专属精调预设。告别复杂调参,只需加载对应JSON文件,即可解锁硬件最优性能,零门槛获得专家级训练方案。
基于AI Toolkit,内置4090、48G及5090专属精调预设。告别复杂调参,只需加载对应JSON文件,即可解锁硬件最优性能,零门槛获得专家级训练方案。
0/小时
语音合成
indextts2-IndexTTS2 最新 V23版本的全面升级情感控制更好 构建by科哥
indextts2-IndexTTS2 最新 V23版本的全面升级情感控制更好 构建by科哥
48
@鸡你太美
鸡你太美认证作者
1166
5227H
更新时间2026-04-27
支持自启动
V23版本的全面升级情感控制更好
V23版本的全面升级情感控制更好
0/小时
语音合成
NovaSR一个开源的音频超分辨率模型低音质转高清音质声音修复模型 webui开发构建by科哥
NovaSR一个开源的音频超分辨率模型低音质转高清音质声音修复模型 webui开发构建by科哥
0
@鸡你太美
鸡你太美认证作者
11
3H
更新时间2026-04-27
支持自启动
NovaSR一个开源的音频超分辨率模型低音质转高清音质声音修复模型 webui开发构建by科哥
NovaSR一个开源的音频超分辨率模型低音质转高清音质声音修复模型 webui开发构建by科哥
0/小时
行业模型
sinong南京农业大学开源面向通用农业领域的垂直8B32B全离线模型 webui开发构建by科哥
sinong南京农业大学开源面向通用农业领域的垂直8B32B全离线模型 webui开发构建by科哥
0
@鸡你太美
鸡你太美认证作者
0
0H
更新时间2026-04-27
支持自启动
sinong南京农业大学开源面向通用农业领域的垂直8B32B全离线模型 webui开发构建by科哥
sinong南京农业大学开源面向通用农业领域的垂直8B32B全离线模型 webui开发构建by科哥
0/小时
生物信息行业模型
谷歌最新开源MedGemma医学AI助手 问诊问病例查看CT拍片x光拍片病理答疑问 webui开发构建by科哥
谷歌最新开源MedGemma医学AI助手 问诊问病例查看CT拍片x光拍片病理答疑问 webui开发构建by科哥
0
@鸡你太美
鸡你太美认证作者
12
40H
更新时间2026-04-27
支持自启动
谷歌最新开源MedGemma医学AI助手 问诊问病例查看CT拍片x光拍片病理答疑问 webui开发构建by科哥
谷歌最新开源MedGemma医学AI助手 问诊问病例查看CT拍片x光拍片病理答疑问 webui开发构建by科哥
0/小时
图片生成GLM
GLM-Image
GLM-Image
1
@十字鱼
十字鱼认证作者
18
4H
更新时间2026-01-19
支持自启动
智谱开源图像生成和编辑模型
智谱开源图像生成和编辑模型
0/小时
视频超分
sora2视频二次高清工作流视频高清修复flashvsr工作流Comfyui工作流 构建by科哥
sora2视频二次高清工作流视频高清修复flashvsr工作流Comfyui工作流 构建by科哥
7
@鸡你太美
鸡你太美认证作者
71
48H
更新时间2026-04-27
支持自启动
sora2视频二次高清工作流视频高清修复flashvsr工作流Comfyui工作流 构建by科哥
sora2视频二次高清工作流视频高清修复flashvsr工作流Comfyui工作流 构建by科哥
0/小时
图片生成Qwen-image
超强AI图片编辑,QwenEdit-2511合集,单图/双图编辑, 超强人脸一致性,精准涂抹编辑、无色差/位移,一键生成24张姿势图、九宫格分镜
超强AI图片编辑,QwenEdit-2511合集,单图/双图编辑, 超强人脸一致性,精准涂抹编辑、无色差/位移,一键生成24张姿势图、九宫格分镜
86
@与AI同行
与AI同行认证作者
1031
2858H
更新时间2026-03-31
支持自启动
超强AI图片编辑,QwenEdit-2511合集,单图/双图编辑, 超强人脸一致性,精准涂抹编辑、无色差/位移,一键生成24张姿势图、九宫格分镜
超强AI图片编辑,QwenEdit-2511合集,单图/双图编辑, 超强人脸一致性,精准涂抹编辑、无色差/位移,一键生成24张姿势图、九宫格分镜
0/小时
FluxComfyUI图片生成
FLUX2-Klein-黑森林开源最强编辑模型,秒级生图,效果可控!
FLUX2-Klein-黑森林开源最强编辑模型,秒级生图,效果可控!
15
@社恐的知识树
社恐的知识树认证作者
135
276H
更新时间2026-01-19
黑森林团队开源的FLUX2-Klein多功能模型,生成速度快,编辑能力强!
黑森林团队开源的FLUX2-Klein多功能模型,生成速度快,编辑能力强!
0/小时
行业模型
谷歌最新翻译模型TranslateGemma支持全世界50多种语言的翻译文本多语言翻译 二次webui开发 构建by科哥
谷歌最新翻译模型TranslateGemma支持全世界50多种语言的翻译文本多语言翻译 二次webui开发 构建by科哥
0
@鸡你太美
鸡你太美认证作者
4
0H
更新时间2026-04-27
支持自启动
谷歌最新翻译模型TranslateGemma支持全世界50多种语言的翻译文本多语言翻译 二次webui开发 构建by科哥
谷歌最新翻译模型TranslateGemma支持全世界50多种语言的翻译文本多语言翻译 二次webui开发 构建by科哥
0/小时
图片生成AI电商
BananaMall一个 AI 驱动的电商详情页生成的ai工具结合谷歌nano banana谷歌香蕉模型 开发构建by科哥
BananaMall一个 AI 驱动的电商详情页生成的ai工具结合谷歌nano banana谷歌香蕉模型 开发构建by科哥
11
@鸡你太美
鸡你太美认证作者
52
84H
更新时间2026-04-27
支持自启动
BananaMall一个 AI 驱动的电商详情页生成的ai工具结合谷歌nano banana谷歌香蕉模型 开发构建by科哥
BananaMall一个 AI 驱动的电商详情页生成的ai工具结合谷歌nano banana谷歌香蕉模型 开发构建by科哥
0/小时
Z-Image图片生成
全能图片编辑王flux2_klein|Qwen_Image_Edit2511|Z-image-turbo
全能图片编辑王flux2_klein|Qwen_Image_Edit2511|Z-image-turbo
25
@老徐Ai研习社
老徐Ai研习社认证作者
206
1758H
更新时间2026-01-21
支持自启动
全能图片生成与编辑
全能图片生成与编辑
0/小时
目标检测
YOLO26
YOLO26
4
@苍耳阿猫
苍耳阿猫认证作者
37
951H
更新时间2026-01-16
YOLO26
YOLO26
0/小时
具身智能
Alpamayo
Alpamayo
1
@苍耳阿猫
苍耳阿猫认证作者
6
32H
更新时间2026-01-20
Alpamayo 1 是一个预训练推理模型,旨在加速自动驾驶(AV)领域的研发。
Alpamayo 1 是一个预训练推理模型,旨在加速自动驾驶(AV)领域的研发。
0/小时
音乐
NotaGen基于 LLM 范式的高音乐性古典符号化音乐生成模型 二次开发构建by科哥
NotaGen基于 LLM 范式的高音乐性古典符号化音乐生成模型 二次开发构建by科哥
1
@鸡你太美
鸡你太美认证作者
9
11H
更新时间2026-04-27
支持自启动
NotaGen基于 LLM 范式的高音乐性古典符号化音乐生成模型 二次开发构建by科哥
NotaGen基于 LLM 范式的高音乐性古典符号化音乐生成模型 二次开发构建by科哥
0/小时
Wan图片生成视频生成
闪电AI视频、图片生成镜像
闪电AI视频、图片生成镜像
10
@cola
55
55H
更新时间2026-01-16
支持自启动
基于lightx2v框架加速的视频、图片生成服务,快速生成视频图片,基于模型wan2.2、qwen-image、z-image
基于lightx2v框架加速的视频、图片生成服务,快速生成视频图片,基于模型wan2.2、qwen-image、z-image
0.1/小时
Wan视频生成ComfyUI
DaSiWa & Remix:Wan 2.2 双神N版
DaSiWa & Remix:Wan 2.2 双神N版
34
@AI-KSK
AI-KSK认证作者
325
881H
更新时间2026-01-16
本镜像高度集成 Wan 2.2 视频生成环境,预装社区领先四套核心工作流,融合 DaSiWa 高保真与 Remix 逻辑优化,提供一站式 T2V 文生视频与 I2V 图生视频解决方案。
本镜像高度集成 Wan 2.2 视频生成环境,预装社区领先四套核心工作流,融合 DaSiWa 高保真与 Remix 逻辑优化,提供一站式 T2V 文生视频与 I2V 图生视频解决方案。
0/小时
LTX视频生成
LTX-2 Audio-Video:开源首个 · 音画同步生成
LTX-2 Audio-Video:开源首个 · 音画同步生成
14
@AI-KSK
AI-KSK认证作者
133
326H
更新时间2026-01-21
双官方流程全覆盖:同时支持 ComfyUI 官方 LTX 工作流示例 + Lightricks 官方 ComfyUI-LTXVideo 自定义节点与全部示例工作流
双官方流程全覆盖:同时支持 ComfyUI 官方 LTX 工作流示例 + Lightricks 官方 ComfyUI-LTXVideo 自定义节点与全部示例工作流
0/小时
语音合成AI应用
voice pro给视频做多语言配音翻译克隆特定视频声音 直译视频声音本地化 汉化构建by科哥
voice pro给视频做多语言配音翻译克隆特定视频声音 直译视频声音本地化 汉化构建by科哥
6
@鸡你太美
鸡你太美认证作者
25
11H
更新时间2026-04-27
支持自启动
voice pro给视频做多语言配音翻译克隆特定视频声音 直译视频声音本地化 汉化构建by科哥
voice pro给视频做多语言配音翻译克隆特定视频声音 直译视频声音本地化 汉化构建by科哥
0/小时
LTXLora训练
LTX2官方训练器Lora训练
LTX2官方训练器Lora训练
1
@梦影Erislia
29
109H
更新时间2026-01-21
LTX2官方训练器的lora训练支持,内置模型t2v,小白可以一键运行,也可以根据官方文档进行进阶操作
LTX2官方训练器的lora训练支持,内置模型t2v,小白可以一键运行,也可以根据官方文档进行进阶操作
0/小时
LTX视频生成
ltx-2全能lora运镜comfyui工作流文生视频图生视频一键运行 构建by科哥
ltx-2全能lora运镜comfyui工作流文生视频图生视频一键运行 构建by科哥
6
@鸡你太美
鸡你太美认证作者
44
29H
更新时间2026-04-27
支持自启动
ltx-2全能lora运镜comfyui工作流文生视频图生视频一键运行 构建by科哥
ltx-2全能lora运镜comfyui工作流文生视频图生视频一键运行 构建by科哥
0/小时
Qwen-Image
Tongbi-支持Qwen-Image和Qwen-Image-Edit
Tongbi-支持Qwen-Image和Qwen-Image-Edit
45
@十字鱼
十字鱼认证作者
256
8123H
更新时间2026-02-02
支持自启动
阿里通义千问开源最强图像模型,强大的文字渲染能力,强大的图像编辑能力
阿里通义千问开源最强图像模型,强大的文字渲染能力,强大的图像编辑能力
0/小时
其他
nano banana谷歌香蕉在线绘画在线改图修改图片模型香蕉模型
nano banana谷歌香蕉在线绘画在线改图修改图片模型香蕉模型
3
@鸡你太美
鸡你太美认证作者
64
15H
更新时间2026-04-27
支持自启动
nano banana谷歌香蕉在线绘画在线改图修改图片模型香蕉模型
nano banana谷歌香蕉在线绘画在线改图修改图片模型香蕉模型
0/小时
语音合成
【音谷官方】indextts2-api
【音谷官方】indextts2-api
83
@音谷官方
2026
8103H
更新时间2026-04-27
支持自启动
【音谷官方】音谷对应的API
【音谷官方】音谷对应的API
0.2/小时
LTX视频生成
LTX-2 WebUI版
LTX-2 WebUI版
6
@鹄仙
鹄仙认证作者
43
40H
更新时间2026-01-10
基于wangp的LTX-2,WebUI版
基于wangp的LTX-2,WebUI版
0/小时
视频生成
开源版Veo3!LTX2-视频生成合集,文生视频、图生视频、视频人物配音+口型同步、直出1080P,高清细节放大、提示词增强、支持线条+深度+姿势控制!
开源版Veo3!LTX2-视频生成合集,文生视频、图生视频、视频人物配音+口型同步、直出1080P,高清细节放大、提示词增强、支持线条+深度+姿势控制!
55
@与AI同行
与AI同行认证作者
290
209H
更新时间2026-03-31
支持自启动
开源版Veo3!LTX2-视频生成合集,文生视频、图生视频、视频人物配音+口型同步、直出1080P,高清细节放大、提示词增强、支持线条+深度+姿势控制!
开源版Veo3!LTX2-视频生成合集,文生视频、图生视频、视频人物配音+口型同步、直出1080P,高清细节放大、提示词增强、支持线条+深度+姿势控制!
0/小时
LTXComfyUI数字人
 LTX-2:首个开源音画同步生成模型,提示词遵从比肩Sora,理解分镜脚本,一键AI成片!
LTX-2:首个开源音画同步生成模型,提示词遵从比肩Sora,理解分镜脚本,一键AI成片!
8
@社恐的知识树
社恐的知识树认证作者
40
45H
更新时间2026-01-22
LTX-2 是由 Lightricks 开源的 DiT 架构音频-视频基础模型,核心特点是:在同一个模型里同步生成视频与音频,超强提示词理解,支持多镜头脚本,关键词自动匹配视频风格,一键AI成片!
LTX-2 是由 Lightricks 开源的 DiT 架构音频-视频基础模型,核心特点是:在同一个模型里同步生成视频与音频,超强提示词理解,支持多镜头脚本,关键词自动匹配视频风格,一键AI成片!
0/小时
语音合成
Voice Sculptor捏声音基于LLaSA和CosyVoice2的指令化语音合成语音模型 二次开发构建by科哥
Voice Sculptor捏声音基于LLaSA和CosyVoice2的指令化语音合成语音模型 二次开发构建by科哥
4
@鸡你太美
鸡你太美认证作者
17
4H
更新时间2026-04-27
支持自启动
Voice Sculptor捏声音基于LLaSA和CosyVoice2的指令化语音合成语音模型 二次开发构建by科哥
Voice Sculptor捏声音基于LLaSA和CosyVoice2的指令化语音合成语音模型 二次开发构建by科哥
0/小时
Qwen-Image图片生成ComfyUI
LTX-2.0音画同步视频生成|Z-Image-Turbo&Qwen-Image-Edit1图片编辑
LTX-2.0音画同步视频生成|Z-Image-Turbo&Qwen-Image-Edit1图片编辑
12
@老徐Ai研习社
老徐Ai研习社认证作者
61
66H
更新时间2026-02-05
支持自启动
LTX-2.0音画同步视频生成
LTX-2.0音画同步视频生成
0/小时
ComfyUIWan
Comfy二次元跑图生视频DaSiWa和vace跳舞
Comfy二次元跑图生视频DaSiWa和vace跳舞
21
@梦影Erislia
158
313H
更新时间2026-01-22
Comfy二次元跑图生视频DaSiWa和vace跳舞
Comfy二次元跑图生视频DaSiWa和vace跳舞
0/小时
语音识别
SenseVoice多语言语音识别情感识别系统  二次开发构建by科哥
SenseVoice多语言语音识别情感识别系统 二次开发构建by科哥
2
@鸡你太美
鸡你太美认证作者
10
7H
更新时间2026-04-27
支持自启动
SenseVoice多语言语音识别情感识别系统 二次开发构建by科哥
SenseVoice多语言语音识别情感识别系统 二次开发构建by科哥
0/小时
语音识别
FunASR中文语音识别音频转文本声音转文本系统 二次webui开发构建by科哥
FunASR中文语音识别音频转文本声音转文本系统 二次webui开发构建by科哥
2
@鸡你太美
鸡你太美认证作者
21
7H
更新时间2026-04-27
支持自启动
音频声音识别系统
音频声音识别系统
0/小时
语音分离
SAM Audio一个Meta开源的音频分割模型声音分离音频音乐分离应用 二次开发构建by科哥
SAM Audio一个Meta开源的音频分割模型声音分离音频音乐分离应用 二次开发构建by科哥
2
@鸡你太美
鸡你太美认证作者
35
34H
更新时间2026-04-27
支持自启动
可从复杂的音频混合中分离出特定的声音
可从复杂的音频混合中分离出特定的声音
0/小时
图片编辑
UNet Universal Matting基于UNet模型抠图批量抠图 webUI一键抠图 构建by科哥
UNet Universal Matting基于UNet模型抠图批量抠图 webUI一键抠图 构建by科哥
0
@鸡你太美
鸡你太美认证作者
12
34H
更新时间2026-04-27
支持自启动
基于UNet模型抠图批量抠图 webUI一键抠图 构建by科哥
基于UNet模型抠图批量抠图 webUI一键抠图 构建by科哥
0/小时
ComfyUI
ComfyUI_最新26年01月-Niugee-牛哥整合包-V2
ComfyUI_最新26年01月-Niugee-牛哥整合包-V2
22
@NiuGee
NiuGee认证作者
245
533H
更新时间2026-01-08
整合26年最新版本ComfyUI,已下载好常用图像模型,修改端口到7860方便管理界面一键启动
整合26年最新版本ComfyUI,已下载好常用图像模型,修改端口到7860方便管理界面一键启动
0/小时
视频生成
最强AI生成长视频,Wan2.2-SVI2Pro整合包!一次性生成一分钟视频,一次性生成30s分镜视频!
最强AI生成长视频,Wan2.2-SVI2Pro整合包!一次性生成一分钟视频,一次性生成30s分镜视频!
51
@与AI同行
与AI同行认证作者
357
1504H
更新时间2026-03-31
支持自启动
最强AI生成长视频,Wan2.2-SVI2Pro整合包!一次性生成一分钟视频,一次性生成30s分镜视频!
最强AI生成长视频,Wan2.2-SVI2Pro整合包!一次性生成一分钟视频,一次性生成30s分镜视频!
0/小时
ComfyUI
ComfyUI云端整合包2601
ComfyUI云端整合包2601
7
@鹄仙
鹄仙认证作者
67
347H
更新时间2026-01-23
长视频系列升级 不仅仅是SVI2 pro 长视频、LongCat数字人
长视频系列升级 不仅仅是SVI2 pro 长视频、LongCat数字人
0/小时
Qwen-ImageLora训练图片生成
Qwen 2512的Lora训练,内置模型,一键训练AI-Toolkit
Qwen 2512的Lora训练,内置模型,一键训练AI-Toolkit
9
@梦影Erislia
115
605H
更新时间2026-01-23
Qwen 2512的Lora训练,内置模型,一键训练AI-Toolkit
Qwen 2512的Lora训练,内置模型,一键训练AI-Toolkit
0/小时
AI应用
banana-slides基于谷歌人工智能ai制作幻灯片ai制作ppt制作幻灯片 构建by科哥
banana-slides基于谷歌人工智能ai制作幻灯片ai制作ppt制作幻灯片 构建by科哥
3
@鸡你太美
鸡你太美认证作者
15
86H
更新时间2026-04-27
支持自启动
banana-slides基于谷歌人工智能ai制作幻灯片ai制作ppt制作幻灯片 构建by科哥
banana-slides基于谷歌人工智能ai制作幻灯片ai制作ppt制作幻灯片 构建by科哥
0/小时
Qwen-Image图片生成ComfyUI
Qwen-Image-2512模型_QwenVL3反推_SeedVR2放大多合一
Qwen-Image-2512模型_QwenVL3反推_SeedVR2放大多合一
6
@社恐的知识树
社恐的知识树认证作者
83
197H
更新时间2026-01-03
集成千问图像2512模型+QwenVL3图像视频反推API+最强放大SeedVR2多合一工作流,Comfyui-v0.7.0
集成千问图像2512模型+QwenVL3图像视频反推API+最强放大SeedVR2多合一工作流,Comfyui-v0.7.0
0/小时
AI电商
magic-tryon图片视频虚拟试装换装模特换衣 二次webui开发构建by科哥
magic-tryon图片视频虚拟试装换装模特换衣 二次webui开发构建by科哥
3
@鸡你太美
鸡你太美认证作者
47
4H
更新时间2026-04-27
支持自启动
magic-tryon图片视频虚拟试装换装模特换衣
magic-tryon图片视频虚拟试装换装模特换衣
0/小时
AI应用
图文创作神器一句话一张图片生成小红书图文 构建by科哥
图文创作神器一句话一张图片生成小红书图文 构建by科哥
1
@鸡你太美
鸡你太美认证作者
6
4H
更新时间2026-04-27
支持自启动
图文创作神器一句话一张图片生成小红书图文
图文创作神器一句话一张图片生成小红书图文
0/小时
Qwen-Image图片生成
阿里千问开源Qwen-Image-2512图像生成模型 二次开发构建by科哥
阿里千问开源Qwen-Image-2512图像生成模型 二次开发构建by科哥
3
@鸡你太美
鸡你太美认证作者
13
6H
更新时间2026-04-27
支持自启动
需要80gb显存运行该项目
需要80gb显存运行该项目
0/小时
物理模拟分子动力
gromacs_deepmd机器学习训练水分子力场
gromacs_deepmd机器学习训练水分子力场
0
@tty
14
350H
更新时间2026-01-26
内含deepmd机器学习力场训练水分子,gromacs调用运行例子
内含deepmd机器学习力场训练水分子,gromacs调用运行例子
0/小时
物理模拟分子动力
deepmd_lammps训练和运行镜像
deepmd_lammps训练和运行镜像
0
@tty
15
100H
更新时间2026-01-26
内含ch4简单例子,也可用来训练自己的模型,3080ti版本
内含ch4简单例子,也可用来训练自己的模型,3080ti版本
0/小时
混元
HY-Motion1.0腾讯混元开源的文本到3D动作生成模型 汉化构建by科哥
HY-Motion1.0腾讯混元开源的文本到3D动作生成模型 汉化构建by科哥
2
@鸡你太美
鸡你太美认证作者
13
22H
更新时间2026-04-27
HY-Motion1.0腾讯混元开源的文本到3D动作生成模型 汉化构建by科哥
HY-Motion1.0腾讯混元开源的文本到3D动作生成模型 汉化构建by科哥
0/小时
Wan视频编辑
wan2.1-scail动作迁移
wan2.1-scail动作迁移
24
@匹夫
匹夫认证作者
213
355H
更新时间2026-01-26
wan2.1-scail动作迁移
wan2.1-scail动作迁移
0/小时
Qwen-Image图片生成
Qwen‑Image‑Edit‑2511-LoRA训练 x AI Toolkit
Qwen‑Image‑Edit‑2511-LoRA训练 x AI Toolkit
6
@AI-KSK
AI-KSK认证作者
117
872H
更新时间2026-01-01
这是一个集成了 Qwen-Image-Edit-2511模型与 AI Toolkit 训练框架的预配置环境,旨在支持用户高效微调出具备精准图像编辑、风格迁移及多主体一致性能力的定制化 LoRA 模型。
这是一个集成了 Qwen-Image-Edit-2511模型与 AI Toolkit 训练框架的预配置环境,旨在支持用户高效微调出具备精准图像编辑、风格迁移及多主体一致性能力的定制化 LoRA 模型。
0/小时
语音合成
 ChatterBox多语言语音合成语言克隆声音克隆 webui二次开发构建by科哥
ChatterBox多语言语音合成语言克隆声音克隆 webui二次开发构建by科哥
4
@鸡你太美
鸡你太美认证作者
30
11H
更新时间2026-04-27
支持自启动
支持23个国家的语言声音克隆
支持23个国家的语言声音克隆
0/小时
数字人
LatentSync 1.6 纯净版
LatentSync 1.6 纯净版
3
@knzskl
31
23H
更新时间2026-01-26
字节跳动、北京交通大学联合推出的端到端唇形同步框架。Latent Sync利用稳定扩散和TREPA的力量,为动态和逼真的视频生成提供精确的高分辨率唇形同步。
字节跳动、北京交通大学联合推出的端到端唇形同步框架。Latent Sync利用稳定扩散和TREPA的力量,为动态和逼真的视频生成提供精确的高分辨率唇形同步。
0/小时
SDLora训练
SDXL及系列衍生模型训练,内置WD打标编辑,任意C站模型导入,小白也能轻松上手,AI-Toolkit
SDXL及系列衍生模型训练,内置WD打标编辑,任意C站模型导入,小白也能轻松上手,AI-Toolkit
66
@梦影Erislia
1053
7144H
更新时间2025-12-30
SDXL及系列衍生模型训练,内置WD打标编辑,任意C站模型导入,小白也能轻松上手,AI-Toolkit
SDXL及系列衍生模型训练,内置WD打标编辑,任意C站模型导入,小白也能轻松上手,AI-Toolkit
0/小时
视频生成图片生成ComfyUI
启梦光影高质量出图二合一
启梦光影高质量出图二合一
1
@麦子AI
34
102H
更新时间2026-01-28
支持自启动
高质量文生图、图生视频。只适配40系显卡
高质量文生图、图生视频。只适配40系显卡
0.15/小时
Wan视频编辑
StoryMem基于wan2.2逐镜脚本生成高连贯电影级1分钟多镜头叙事视频 二次开发构建by科哥
StoryMem基于wan2.2逐镜脚本生成高连贯电影级1分钟多镜头叙事视频 二次开发构建by科哥
10
@鸡你太美
鸡你太美认证作者
38
19H
更新时间2026-04-27
支持自启动
StoryMem基于wan2.2逐镜脚本生成高连贯电影级1分钟多镜头叙事视频 二次开发构建by科哥
StoryMem基于wan2.2逐镜脚本生成高连贯电影级1分钟多镜头叙事视频 二次开发构建by科哥
0/小时
ComfyUI
ComfyUI学习版_torch_2.8.0
ComfyUI学习版_torch_2.8.0
6
@智绘Store
智绘Store认证作者
48
120H
更新时间2026-03-17
支持自启动
此版本镜像,5090、4090、3090、3080Ti等系列显卡可用,P40显卡不可用
此版本镜像,5090、4090、3090、3080Ti等系列显卡可用,P40显卡不可用
0/小时
ComfyUI
ComfyUI学习版镜像_torch-2.7.1
ComfyUI学习版镜像_torch-2.7.1
10
@智绘Store
智绘Store认证作者
28
100H
更新时间2026-03-17
支持自启动
ComfyUI学习版镜像_torch-2.7.1,高性价比镜像,可开P40显卡,5090显卡勿用,会报错
ComfyUI学习版镜像_torch-2.7.1,高性价比镜像,可开P40显卡,5090显卡勿用,会报错
0/小时
Qwen-Image
qwen-image工作流合集edit2511-z-image-turbo
qwen-image工作流合集edit2511-z-image-turbo
8
@匹夫
匹夫认证作者
82
153H
更新时间2026-01-27
qwen-image工作流合集
qwen-image工作流合集
0/小时
语音合成
VoxCPM1.5面壁智能开源的端到端语音合成模型附训练lora训练器 构建by科哥
VoxCPM1.5面壁智能开源的端到端语音合成模型附训练lora训练器 构建by科哥
1
@鸡你太美
鸡你太美认证作者
24
23H
更新时间2026-04-27
支持自启动
语音合成模型+训练lora训练器
语音合成模型+训练lora训练器
0/小时
Qwen-ImageLora训练图片生成
Qwen-2511和Z图像的Lora训练AI-TOOLKIT
Qwen-2511和Z图像的Lora训练AI-TOOLKIT
7
@梦影Erislia
55
324H
更新时间2026-01-27
Qwen-2511和Z图像的Lora训练AI-TOOLKIT
Qwen-2511和Z图像的Lora训练AI-TOOLKIT
0/小时
Wan视频生成
Egox任意视频一键转第一人称视角视频基于wan2.1模型 webui二次开发构建by科哥
Egox任意视频一键转第一人称视角视频基于wan2.1模型 webui二次开发构建by科哥
3
@鸡你太美
鸡你太美认证作者
9
8H
更新时间2026-04-27
支持自启动
将任意视频一键转第一人称视角视频
将任意视频一键转第一人称视角视频
0/小时
视频生成图片生成ComfyUI
启梦光影VIP快速出图二合一
启梦光影VIP快速出图二合一
2
@麦子AI
10
155H
更新时间2026-01-27
支持自启动
2s出图,超级快。注意!本镜像需要部署在50系列显卡上。
2s出图,超级快。注意!本镜像需要部署在50系列显卡上。
0.15/小时
数字人
One-to-All-Animation单图片转换动画视频数字人视频动作模仿器 构建by科哥
One-to-All-Animation单图片转换动画视频数字人视频动作模仿器 构建by科哥
1
@鸡你太美
鸡你太美认证作者
9
5H
更新时间2026-04-27
支持自启动
单图片转换动画视频数字人视频动作模仿器
单图片转换动画视频数字人视频动作模仿器
0/小时
数字人
personaLive实时数字人系统
personaLive实时数字人系统
10
@有趣的80后程序员
有趣的80后程序员认证作者
81
205H
更新时间2025-12-27
支持自启动
实时数字人系统,直播室直接生成分身,低延迟
实时数字人系统,直播室直接生成分身,低延迟
0/小时
Qwen-Image图片生成
Qwen-Image-Edit-2511阿里通义推出的全能图像编辑模型 webui二次修改构建by科哥
Qwen-Image-Edit-2511阿里通义推出的全能图像编辑模型 webui二次修改构建by科哥
4
@鸡你太美
鸡你太美认证作者
74
1109H
更新时间2026-04-27
支持自启动
图片编辑模型 一致性更加好 中文支持更好
图片编辑模型 一致性更加好 中文支持更好
0/小时
语音克隆语音合成
超强AI音色克隆,VoxCPM-V1.5,支持超长文本生成、批量生成,支持音色保存、多音字修改、语速调节,速度超快!
超强AI音色克隆,VoxCPM-V1.5,支持超长文本生成、批量生成,支持音色保存、多音字修改、语速调节,速度超快!
24
@与AI同行
与AI同行认证作者
1120
681H
更新时间2026-03-31
支持自启动
超强AI音色克隆,VoxCPM-V1.5,支持超长文本生成、批量生成,支持音色保存、多音字修改、语速调节,速度超快!
超强AI音色克隆,VoxCPM-V1.5,支持超长文本生成、批量生成,支持音色保存、多音字修改、语速调节,速度超快!
0/小时
ComfyUIWanQwen-Image
2025.12全新模型ComfyUI整合包
2025.12全新模型ComfyUI整合包
17
@老徐Ai研习社
老徐Ai研习社认证作者
121
466H
更新时间2025-12-26
支持自启动
ComfyUI2025.12整合包
ComfyUI2025.12整合包
0/小时
ComfyUI
ComfyUI云端整合包2512
ComfyUI云端整合包2512
14
@鹄仙
鹄仙认证作者
67
1429H
更新时间2026-01-27
ComfyUI云端整合包2512 支持Z-Image 混元1.5,新增到63个插件,带文件管理系统
ComfyUI云端整合包2512 支持Z-Image 混元1.5,新增到63个插件,带文件管理系统
0/小时
Qwen-Image视频编辑
千问2511与动作迁移三剑客
千问2511与动作迁移三剑客
3
@鹄仙
鹄仙认证作者
17
33H
更新时间2025-12-27
一个基于Wan2GP的图像编辑与动作迁移视频生成的WebUI项目
一个基于Wan2GP的图像编辑与动作迁移视频生成的WebUI项目
0/小时
Wan视频生成ComfyUI
TurboDiffusion 100–200×加速ComfyUI-Wan图到视频生成
TurboDiffusion 100–200×加速ComfyUI-Wan图到视频生成
14
@AI-KSK
AI-KSK认证作者
136
347H
更新时间2025-12-25
这是一个超快的AI视频生成工具,1分钟就能把图片变成短视频,速度是普通AI的200倍。
这是一个超快的AI视频生成工具,1分钟就能把图片变成短视频,速度是普通AI的200倍。
0/小时
语音合成
VoxCPM1.5雨落版整合包
VoxCPM1.5雨落版整合包
6
@雨落实战
雨落实战认证作者
81
192H
更新时间2025-12-24
支持自启动
VoxCPM1.5的雨落版整合包
VoxCPM1.5的雨落版整合包
0/小时
AI应用图片生成
PromptFill专为AI绘画设计的开源结构化提示词生成工具 构建by科哥
PromptFill专为AI绘画设计的开源结构化提示词生成工具 构建by科哥
2
@鸡你太美
鸡你太美认证作者
7
0H
更新时间2026-04-27
支持自启动
专为AI绘画设计的开源结构化提示词生成工具
专为AI绘画设计的开源结构化提示词生成工具
0/小时
LongCat数字人
最强长视频数字人:LongCat-Avatar尝鲜版,其他热门生图、视频也都备好了!
最强长视频数字人:LongCat-Avatar尝鲜版,其他热门生图、视频也都备好了!
15
@老许爱吃肉丶
65
208H
更新时间2026-01-27
支持自启动
最强长视频数字人:LongCat-Avatar尝鲜版,其他热门生图、视频也都备好了!
最强长视频数字人:LongCat-Avatar尝鲜版,其他热门生图、视频也都备好了!
0.2/小时
LongCat数字人
SOTA级音频驱动数字人-LongCat-Video-Avatar
SOTA级音频驱动数字人-LongCat-Video-Avatar
12
@AI-KSK
AI-KSK认证作者
59
61H
更新时间2026-01-27
实现身份永续、动作自然的数字人生成
实现身份永续、动作自然的数字人生成
0/小时
视频生成数字人
AI数字人LongCatAvatar,超强口型+表情+姿势效果,支持长视频!
AI数字人LongCatAvatar,超强口型+表情+姿势效果,支持长视频!
54
@与AI同行
与AI同行认证作者
354
358H
更新时间2026-03-31
支持自启动
AI数字人LongCatAvatar,超强口型+表情+姿势效果,支持长视频!
AI数字人LongCatAvatar,超强口型+表情+姿势效果,支持长视频!
0/小时
3D生成
SHARP–苹果开源的3D场景生成AI模型图片转3d模型 二次开发构建by科哥
SHARP–苹果开源的3D场景生成AI模型图片转3d模型 二次开发构建by科哥
2
@鸡你太美
鸡你太美认证作者
26
540H
更新时间2026-04-27
支持自启动
SHARP–苹果开源的3D场景生成AI模型图片转3d模型
SHARP–苹果开源的3D场景生成AI模型图片转3d模型
0/小时
GLM语音识别
GLM-ASR智谱开源的语音识别、语音转文本模型  二次开发构建By科哥
GLM-ASR智谱开源的语音识别、语音转文本模型 二次开发构建By科哥
0
@鸡你太美
鸡你太美认证作者
7
1H
更新时间2026-04-27
支持自启动
智谱开源的语音识别语音转文本声音转文本模型
智谱开源的语音识别语音转文本声音转文本模型
0/小时
分子动力生物信息
Rosetta
Rosetta
2
@苍耳阿猫
苍耳阿猫认证作者
2
1H
更新时间2025-12-23
Rosetta
Rosetta
0/小时
AI应用视频生成
Pixelle-Video|一句话生成短视频
Pixelle-Video|一句话生成短视频
8
@鸡你太美
鸡你太美认证作者
28
14H
更新时间2026-04-27
支持自启动
零门槛,零剪辑经验,让视频创作成为一句话的事
零门槛,零剪辑经验,让视频创作成为一句话的事
0/小时
其他
ai小说ai在线写作系统ai智能写作系统 构建by科哥
ai小说ai在线写作系统ai智能写作系统 构建by科哥
7
@鸡你太美
鸡你太美认证作者
19
44H
更新时间2026-04-27
支持自启动
ai小说ai在线写作系统ai智能写作系统
ai小说ai在线写作系统ai智能写作系统
0/小时
Lora训练
ai-toolkit炼丹炉,支持多种常见模型训练,内置多种模型
ai-toolkit炼丹炉,支持多种常见模型训练,内置多种模型
4
@MumuOpenK
67
465H
更新时间2026-01-29
支持自启动
ai-toolkit炼丹炉(汉化版)
ai-toolkit炼丹炉(汉化版)
0.1/小时
语音合成GLM
智谱开源的AI文本转语音模型支持声音克隆GLM-TTS 语音合成系统 二次开发构建by科哥
智谱开源的AI文本转语音模型支持声音克隆GLM-TTS 语音合成系统 二次开发构建by科哥
0
@鸡你太美
鸡你太美认证作者
33
24H
更新时间2026-04-27
支持自启动
智谱开源的AI文本转语音模型支持声音克隆GLM-TTS 语音合成系统 二次开发构建by科哥
智谱开源的AI文本转语音模型支持声音克隆GLM-TTS 语音合成系统 二次开发构建by科哥
0/小时
ComfyUIQwen-Image图片生成
Twinflow双流加速千问生图1秒1张
Twinflow双流加速千问生图1秒1张
5
@smthem
20
14H
更新时间2025-12-20
支持自启动
最快千问生图方法,顶配1秒1张
最快千问生图方法,顶配1秒1张
0/小时
AI应用
next-ai-draw-io
next-ai-draw-io
0
@苍耳阿猫
苍耳阿猫认证作者
0
0H
更新时间2025-12-19
next-ai-draw-io
next-ai-draw-io
0/小时
3D生成ComfyUI
Trellis2代一键图片生成3D模型
Trellis2代一键图片生成3D模型
9
@smthem
151
298H
更新时间2025-12-19
支持自启动
一键图片生成3D模型,输出glb和obj格式,带贴图和法线,自动脱底
一键图片生成3D模型,输出glb和obj格式,带贴图和法线,自动脱底
0/小时
Wan视频生成ComfyUI
TurboDiffusion-ultra-fast-wan
TurboDiffusion-ultra-fast-wan
6
@有趣的80后程序员
有趣的80后程序员认证作者
68
107H
更新时间2025-12-18
让阿里wan模型的视频生成速度提升200倍
让阿里wan模型的视频生成速度提升200倍
0/小时
语音合成
cosyvoce3阿里最新开源声音克隆应用普通话粤语英语日语方言更加精准情感丰富 二次开发构建By科哥
cosyvoce3阿里最新开源声音克隆应用普通话粤语英语日语方言更加精准情感丰富 二次开发构建By科哥
6
@鸡你太美
鸡你太美认证作者
62
61H
更新时间2026-04-27
支持自启动
cosyvoce3阿里最新开源声音克隆应用普通话粤语英语日语方言更加精准情感丰富 二次开发构建By科哥
cosyvoce3阿里最新开源声音克隆应用普通话粤语英语日语方言更加精准情感丰富 二次开发构建By科哥
0/小时
分子动力
cp2k
cp2k
1
@苍耳阿猫
苍耳阿猫认证作者
6
14H
更新时间2025-12-18
cp2k-v2025.2
cp2k-v2025.2
0/小时
语音合成
CosyVoice3,多音字控制,音色保存,接口API调用,流式接口,音频降噪
CosyVoice3,多音字控制,音色保存,接口API调用,流式接口,音频降噪
37
@刘悦的技术博客
刘悦的技术博客认证作者
393
4881H
更新时间2026-01-28
支持自启动
CosyVoice3,多音字控制,音色保存,接口API调用,流式接口,音频降噪
CosyVoice3,多音字控制,音色保存,接口API调用,流式接口,音频降噪
0/小时
ComfyUIAI电商
电商换装到视频-全流程
电商换装到视频-全流程
19
@积木comfyui
150
143H
更新时间2026-01-28
支持自启动
换装-换模特-换姿势-换背景-打光-放大-模特图生视频-全流程
换装-换模特-换姿势-换背景-打光-放大-模特图生视频-全流程
0/小时
文本模型
Nemotron3
Nemotron3
0
@敢敢のwings
敢敢のwings认证作者
0
0H
更新时间2025-12-18
Nemotron 3系列是NVIDIA推出的开放模型家族,包含开放权重、训练数据和训练配方,旨在为构建专业化AI智能体提供领先的效率和准确性。
Nemotron 3系列是NVIDIA推出的开放模型家族,包含开放权重、训练数据和训练配方,旨在为构建专业化AI智能体提供领先的效率和准确性。
0/小时
分子动力
DeePMD-kit
DeePMD-kit
0
@苍耳阿猫
苍耳阿猫认证作者
4
4H
更新时间2025-12-16
DeePMD-kit-v3.1.2
DeePMD-kit-v3.1.2
0/小时
分子动力
LAMMPS
LAMMPS
1
@苍耳阿猫
苍耳阿猫认证作者
30
248H
更新时间2025-12-16
lammps
lammps
0/小时
Wan视频生成数字人
LiveAvatar
LiveAvatar
9
@十字鱼
十字鱼认证作者
24
20H
更新时间2026-01-28
支持自启动
流式实时音频驱动头像生成,无限长度
流式实时音频驱动头像生成,无限长度
0/小时
AI应用
AI命理预测系统ai算命系统ai大模型算命系统 二次开发构建by科哥
AI命理预测系统ai算命系统ai大模型算命系统 二次开发构建by科哥
1
@鸡你太美
鸡你太美认证作者
17
39H
更新时间2026-04-27
使用最新的ai大模型结合中国传统命理系统开发 可以无卡模式运行这个项目
使用最新的ai大模型结合中国传统命理系统开发 可以无卡模式运行这个项目
0/小时
OCR识别
PaddleOCR-VL
PaddleOCR-VL
22
@十字鱼
十字鱼认证作者
136
469H
更新时间2026-01-28
支持自启动
支持 109 种语言 擅长识别文本、表格、公式和图表
支持 109 种语言 擅长识别文本、表格、公式和图表
0/小时
语音合成GLM
GLM-TTS
GLM-TTS
7
@十字鱼
十字鱼认证作者
40
1201H
更新时间2026-01-28
支持自启动
可控且富有情感表达的零样本TTS
可控且富有情感表达的零样本TTS
0/小时
数字人
知鱼-焕焕镜像
知鱼-焕焕镜像
1
@
9
140H
更新时间2026-01-28
支持自启动
数字人视频生成/Digital Human Video Generation
数字人视频生成/Digital Human Video Generation
0/小时
GLMAI应用
Open-AutoGLM
Open-AutoGLM
0
@敢敢のwings
敢敢のwings认证作者
1
1H
更新时间2025-12-13
支持自启动
Open-AutoGLM是由智谱AI在2024年10月推出的开源手机操作智能体框架
Open-AutoGLM是由智谱AI在2024年10月推出的开源手机操作智能体框架
0/小时
GLMAI应用
AutoGLM-Phone-9B
AutoGLM-Phone-9B
0
@Ikaros
10
20H
更新时间2025-12-12
支持自启动
AutoGLM-Phone-9B一键启动镜像
AutoGLM-Phone-9B一键启动镜像
0/小时
Wan视频生成
Wan2.2-14B加速版TTP图片放大ttp加速插画图片放大图片高清图片细节放大 科哥构建
Wan2.2-14B加速版TTP图片放大ttp加速插画图片放大图片高清图片细节放大 科哥构建
5
@鸡你太美
鸡你太美认证作者
36
81H
更新时间2026-04-27
支持自启动
专注图片细节放大工作流
专注图片细节放大工作流
0/小时
LongCat图片生成图片编辑
LongCat-Image
LongCat-Image
4
@十字鱼
十字鱼认证作者
23
6H
更新时间2025-12-09
支持自启动
美团龙猫开源图像模型,包含LongCat-Image文生图和LongCat-Image-Edit图像编辑
美团龙猫开源图像模型,包含LongCat-Image文生图和LongCat-Image-Edit图像编辑
0/小时
Z-ImageLora训练
z-image-turbo lora炼丹炉ai-toolkit lora模型训练器
z-image-turbo lora炼丹炉ai-toolkit lora模型训练器
47
@老徐Ai研习社
老徐Ai研习社认证作者
640
5789H
更新时间2026-01-22
支持自启动
z-image-turbo lora炼丹炉ai-toolkit lora模型训练器
z-image-turbo lora炼丹炉ai-toolkit lora模型训练器
0/小时
数字人
Heygem数字人视频生成系统批量版webui版 二次开发构建by科哥
Heygem数字人视频生成系统批量版webui版 二次开发构建by科哥
17
@鸡你太美
鸡你太美认证作者
259
942H
更新时间2026-04-27
支持自启动
一键批量生成 一键打包下载视频
一键批量生成 一键打包下载视频
0/小时
OCR识别
PaddleOCR在线webui文字文稿识别多种识别pdf文字识别 二次开发构建by科哥
PaddleOCR在线webui文字文稿识别多种识别pdf文字识别 二次开发构建by科哥
1
@鸡你太美
鸡你太美认证作者
25
38H
更新时间2026-04-27
支持自启动
PaddleOCR在线webui文字文稿识别多种识别pdf文字识别 二次开发构建by科哥
PaddleOCR在线webui文字文稿识别多种识别pdf文字识别 二次开发构建by科哥
0/小时
LongCat图片生成图片编辑
LongCat:双语超强图像生成与编辑,引领写实与精准创作新标准。
LongCat:双语超强图像生成与编辑,引领写实与精准创作新标准。
3
@AI-KSK
AI-KSK认证作者
6
0H
更新时间2025-12-08
LongCat 是美团开源的双语图像生成与编辑模型,具备高效写实表现、强中文渲染与精准一致性编辑能力,在开源领域表现领先。
LongCat 是美团开源的双语图像生成与编辑模型,具备高效写实表现、强中文渲染与精准一致性编辑能力,在开源领域表现领先。
0/小时
语音合成
VoxCPM
VoxCPM
5
@十字鱼
十字鱼认证作者
40
49H
更新时间2025-12-08
支持自启动
面壁智能开源语音克隆 全新1.5版本
面壁智能开源语音克隆 全新1.5版本
0/小时
语音合成
VoxCPM 1.5B
VoxCPM 1.5B
3
@鹄仙
鹄仙认证作者
68
123H
更新时间2025-12-07
全新VoxCPM1.5B,增强长音频输出稳定性
全新VoxCPM1.5B,增强长音频输出稳定性
0/小时
语音合成
VibeVoice语音合成系统二次webui开发构建by科哥
VibeVoice语音合成系统二次webui开发构建by科哥
0
@鸡你太美
鸡你太美认证作者
9
0H
更新时间2026-04-27
支持自启动
基于微软 VibeVoice 的实时语音合成
基于微软 VibeVoice 的实时语音合成
0/小时
Qwen-Image图片编辑Lora训练
Qwen-Edit 2509的Lora训练AI-toolkit
Qwen-Edit 2509的Lora训练AI-toolkit
3
@梦影Erislia
37
233H
更新时间2026-01-29
Qwen-Edit 2509,qwen-edit和z-image的Lora训练DiffusionPipe
Qwen-Edit 2509,qwen-edit和z-image的Lora训练DiffusionPipe
0/小时
数字人
Imtalker
Imtalker
2
@有趣的80后程序员
有趣的80后程序员认证作者
29
28H
更新时间2026-01-29
支持自启动
语音驱动数字人、支持生成超长语音
语音驱动数字人、支持生成超长语音
0/小时
视频生成
最新视频动作迁移,SteadyDancer,南京大学&腾讯开源!
最新视频动作迁移,SteadyDancer,南京大学&腾讯开源!
66
@与AI同行
与AI同行认证作者
542
741H
更新时间2026-03-31
支持自启动
最新视频动作迁移,SteadyDancer整合包!南京大学&腾讯开源,支持视频动作迁移,支持长视频、批量队列生成、高清放大
最新视频动作迁移,SteadyDancer整合包!南京大学&腾讯开源,支持视频动作迁移,支持长视频、批量队列生成、高清放大
0/小时
目标检测图像分割
SAM3 常见使用案例大全
SAM3 常见使用案例大全
0
@敢敢のwings
敢敢のwings认证作者
18
19H
更新时间2026-01-29
SAM 3提出的PCS任务从根本上突破了这一限制,模型需要检测、分割并追踪输入图像或视频中所有符合该概念的实例。
SAM 3提出的PCS任务从根本上突破了这一限制,模型需要检测、分割并追踪输入图像或视频中所有符合该概念的实例。
0/小时
数字人
Fay数字人-3.1.1
Fay数字人-3.1.1
3
@郭泽斌
郭泽斌认证作者
238
685H
更新时间2025-12-05
Fay数字人3.1.1最小可运行版。fay是一个帮助数字人(2.5d、3d、移动、pc、网页)或大语言模型(openai兼容、deepseek)连通业务系统的mcp框架。
Fay数字人3.1.1最小可运行版。fay是一个帮助数字人(2.5d、3d、移动、pc、网页)或大语言模型(openai兼容、deepseek)连通业务系统的mcp框架。
0/小时
ComfyUI视频生成图片生成
娱乐AI,唱歌跳舞,一应俱全
娱乐AI,唱歌跳舞,一应俱全
8
@老猫本猫
92
194H
更新时间2026-01-29
支持自启动
娱乐AI,唱歌跳舞,一应俱全
娱乐AI,唱歌跳舞,一应俱全
0/小时
ComfyUI图片编辑AI电商
人物,商品,背景,随心所欲替换。
人物,商品,背景,随心所欲替换。
35
@老猫本猫
360
418H
更新时间2026-01-29
支持自启动
人物,商品,背景,随心所欲替换。
人物,商品,背景,随心所欲替换。
0/小时
视频编辑
长视频SteadyDancer动作迁移
长视频SteadyDancer动作迁移
56
@ifelse
356
507H
更新时间2025-12-05
支持自启动
去闪长视频SteadyDancer动作迁移
去闪长视频SteadyDancer动作迁移
0/小时
图片生成
Ovis-Image阿里开源文本生图像大模型在线webui体验版 构建二次开发by科哥
Ovis-Image阿里开源文本生图像大模型在线webui体验版 构建二次开发by科哥
1
@鸡你太美
鸡你太美认证作者
8
1H
更新时间2026-04-27
支持自启动
Ovis-Image阿里开源文本生图像大模型在线webui体验版
Ovis-Image阿里开源文本生图像大模型在线webui体验版
0/小时
视频生成
UltraVideo生成高质量超高清1k到4K视频 webUI二次开发构建By科哥
UltraVideo生成高质量超高清1k到4K视频 webUI二次开发构建By科哥
3
@鸡你太美
鸡你太美认证作者
24
15H
更新时间2026-04-27
基于wan2.1UltraVideo生成高质量超高清1k到4K视频
基于wan2.1UltraVideo生成高质量超高清1k到4K视频
0/小时
推理框架
vLLM-Omni
vLLM-Omni
1
@敢敢のwings
敢敢のwings认证作者
6
11H
更新时间2026-01-29
vLLM项目团队推出了vLLM-Omni框架,这是一个专门为全模态模型设计的高性能推理系统,旨在将vLLM在文本推理领域积累的性能优势,扩展到包含图像、音频、视频在内的完整多模态生态。
vLLM项目团队推出了vLLM-Omni框架,这是一个专门为全模态模型设计的高性能推理系统,旨在将vLLM在文本推理领域积累的性能优势,扩展到包含图像、音频、视频在内的完整多模态生态。
0/小时
图片生成
超强AI图片ZImage-支持批量生成、SeedVR2高清放大
超强AI图片ZImage-支持批量生成、SeedVR2高清放大
98
@与AI同行
与AI同行认证作者
1077
2725H
更新时间2026-03-31
支持自启动
阿里ZImageTurbo图片生成整合包,图片真实感、细节全面提升,支持批量生成、SeedVR2高清放大,支持NSFW, 最低6G显存可用!
阿里ZImageTurbo图片生成整合包,图片真实感、细节全面提升,支持批量生成、SeedVR2高清放大,支持NSFW, 最低6G显存可用!
0/小时
其他
MetaGR
MetaGR
0
@Anaconda
2
72H
更新时间2026-01-29
Meta的生成式推荐论文开源仓库的实现。
Meta的生成式推荐论文开源仓库的实现。
0/小时
Z-ImageLora训练
Z-Image-Turbo LoRA训练-AI Toolkit-极致风格化
Z-Image-Turbo LoRA训练-AI Toolkit-极致风格化
8
@AI-KSK
AI-KSK认证作者
184
2283H
更新时间2025-12-04
支持 Z-Image-Turbo LoRA 快速训练的 AI Toolkit 镜像
支持 Z-Image-Turbo LoRA 快速训练的 AI Toolkit 镜像
0/小时
IndexTTS语音合成
IndexTTS2整合包雨落版
IndexTTS2整合包雨落版
154
@雨落实战
雨落实战认证作者
2421
11371H
更新时间2025-12-03
支持自启动
IndexTTS2.0整合包雨落版本,欢迎使用
IndexTTS2.0整合包雨落版本,欢迎使用
0/小时
视频编辑
SteadyDancer-FP8量化,视频动作迁移,支持5090新卡,支持A800计算卡,基于Comfyui,workflow,工作流,批量任务
SteadyDancer-FP8量化,视频动作迁移,支持5090新卡,支持A800计算卡,基于Comfyui,workflow,工作流,批量任务
20
@刘悦的技术博客
刘悦的技术博客认证作者
133
124H
更新时间2026-01-29
支持自启动
SteadyDancer-FP8量化,视频动作迁移,支持5090新卡,支持A800计算卡,基于Comfyui,workflow,工作流,批量任务
SteadyDancer-FP8量化,视频动作迁移,支持5090新卡,支持A800计算卡,基于Comfyui,workflow,工作流,批量任务
0/小时
Z-ImageLora训练
Z-image Lora训练,小白也能轻松上手,AI-toolkit
Z-image Lora训练,小白也能轻松上手,AI-toolkit
33
@梦影Erislia
388
3946H
更新时间2026-01-29
Z-image Lora训练,小白也能轻松上手,AI-toolkit
Z-image Lora训练,小白也能轻松上手,AI-toolkit
0/小时
图片生成
AI艺术二维码生成器在线生成个性二维码 二次开发构建by科哥
AI艺术二维码生成器在线生成个性二维码 二次开发构建by科哥
1
@鸡你太美
鸡你太美认证作者
0
0H
更新时间2026-04-27
支持自启动
AI艺术二维码生成器在线生成个性二维码
AI艺术二维码生成器在线生成个性二维码
0/小时
Z-Image图片生成
Z-Image-Turbo-GGUF,局部重绘,文生图,图生图,Qwen3-vl自动提示词,支持5090新卡,支持A800,批量任务队列
Z-Image-Turbo-GGUF,局部重绘,文生图,图生图,Qwen3-vl自动提示词,支持5090新卡,支持A800,批量任务队列
18
@刘悦的技术博客
刘悦的技术博客认证作者
226
171H
更新时间2026-01-29
支持自启动
Z-Image-Turbo-GGUF,局部重绘,文生图,图生图,Qwen3-vl自动提示词,支持5090新卡,支持A800,批量任务队列
Z-Image-Turbo-GGUF,局部重绘,文生图,图生图,Qwen3-vl自动提示词,支持5090新卡,支持A800,批量任务队列
0/小时
Qwen-Image
Qwen-Image的Lora训练DiffusionPipe
Qwen-Image的Lora训练DiffusionPipe
1
@梦影Erislia
26
81H
更新时间2026-01-29
使用diffusion pipe进行qwen image的lora训练,小白也可简单上手,上传image即可开始训练
使用diffusion pipe进行qwen image的lora训练,小白也可简单上手,上传image即可开始训练
0/小时
数字人
HeyGem数字人最新多人面部驱动数字人,支持5090新卡,支持A800计算卡,修复黑框问题,GFP面部超分,修复超长视频上下游阻塞问题
HeyGem数字人最新多人面部驱动数字人,支持5090新卡,支持A800计算卡,修复黑框问题,GFP面部超分,修复超长视频上下游阻塞问题
39
@刘悦的技术博客
刘悦的技术博客认证作者
439
4172H
更新时间2026-01-29
支持自启动
HeyGem数字人最新多人面部驱动数字人,支持5090新卡,支持A800计算卡,修复黑框问题,GFP面部超分,修复超长视频上下游阻塞问题
HeyGem数字人最新多人面部驱动数字人,支持5090新卡,支持A800计算卡,修复黑框问题,GFP面部超分,修复超长视频上下游阻塞问题
0/小时
Z-Image图片生成
阿里通义开源Z-Image文生图片无限制wenbui中文特别版 构建by科哥
阿里通义开源Z-Image文生图片无限制wenbui中文特别版 构建by科哥
9
@鸡你太美
鸡你太美认证作者
97
695H
更新时间2026-04-27
支持自启动
文生图片无限制wenbui中文特别版
文生图片无限制wenbui中文特别版
0/小时
Wan视频生成
ComyUI批量z-image出图 SeedVR2 TTP放大 4K  Wan2.2图生视频
ComyUI批量z-image出图 SeedVR2 TTP放大 4K Wan2.2图生视频
6
@ifelse
126
720H
更新时间2026-01-29
支持自启动
ComyUI批量z-image出图 SeedVR2 TTP放大 4K Wan2.2图生视频
ComyUI批量z-image出图 SeedVR2 TTP放大 4K Wan2.2图生视频
0/小时
Z-ImageLora训练
aitookit_z-image_lora_train镜像
aitookit_z-image_lora_train镜像
23
@有趣的80后程序员
有趣的80后程序员认证作者
266
1629H
更新时间2026-01-29
aitookit_z-image_lora_train镜像
aitookit_z-image_lora_train镜像
0/小时
数字人
echomimic_v3阿里蚂蚁团队开源图片加声音生成说话数字人视频基于Comfyui加速和二次高清输出 构建By科哥
echomimic_v3阿里蚂蚁团队开源图片加声音生成说话数字人视频基于Comfyui加速和二次高清输出 构建By科哥
3
@鸡你太美
鸡你太美认证作者
42
546H
更新时间2026-04-27
echomimic_v3阿里蚂蚁团队开源图片加声音生成说话数字人视频基于Comfyui加速和二次高清输出 构建By科哥
echomimic_v3阿里蚂蚁团队开源图片加声音生成说话数字人视频基于Comfyui加速和二次高清输出 构建By科哥
0/小时
Z-Image图片生成
Z-Image-Turbo 最真实的生图模型
Z-Image-Turbo 最真实的生图模型
33
@匹夫
匹夫认证作者
261
729H
更新时间2026-01-30
Z-Image-Turbo 最真实的生图模型
Z-Image-Turbo 最真实的生图模型
0/小时
数据分析AI应用
Crawl4AI:基于AI的网络爬虫和数据抓取工具
Crawl4AI:基于AI的网络爬虫和数据抓取工具
6
@AI画师大阳
AI画师大阳认证作者
20
27H
更新时间2026-01-30
支持自启动
Crawl4AI:基于AI的网络爬虫和数据抓取工具
Crawl4AI:基于AI的网络爬虫和数据抓取工具
0/小时
Flux图片生成图片编辑
FLUX.2 [dev]
FLUX.2 [dev]
7
@十字鱼
十字鱼认证作者
76
85H
更新时间2025-11-28
支持自启动
FLUX.2 [dev] 是一个拥有32B参数的流匹配Transformer模型,能够生成和编辑图像。
FLUX.2 [dev] 是一个拥有32B参数的流匹配Transformer模型,能够生成和编辑图像。
0/小时
FluxComfyUI图片生成
flux.2工作流合集-加图片放大工作流
flux.2工作流合集-加图片放大工作流
28
@匹夫
匹夫认证作者
230
981H
更新时间2026-01-30
flux.2工作流合集-及图片高清放大工作流
flux.2工作流合集-及图片高清放大工作流
0/小时
Z-Image图片生成
Z-Image-Turbo · 8步极速 · 无限制生成
Z-Image-Turbo · 8步极速 · 无限制生成
10
@AI-KSK
AI-KSK认证作者
175
448H
更新时间2025-11-27
Z-Image-Turbo 是一款仅用 8 步即可生成旗舰级图像的高效扩散模型,具备快速生成、双语文本渲染、强指令理解与创意编辑能力,是当前开源图像模型中兼具速度与质量的优秀代表。
Z-Image-Turbo 是一款仅用 8 步即可生成旗舰级图像的高效扩散模型,具备快速生成、双语文本渲染、强指令理解与创意编辑能力,是当前开源图像模型中兼具速度与质量的优秀代表。
0/小时
FluxComfyUI图片生成
flux2最新发布f8优化极速版3090显卡可玩含sora2工作流 构建by科哥
flux2最新发布f8优化极速版3090显卡可玩含sora2工作流 构建by科哥
4
@鸡你太美
鸡你太美认证作者
32
12H
更新时间2026-04-27
支持自启动
flux2最新发布f8优化极速版3090显卡可玩含sora2工作流 构建by科哥
flux2最新发布f8优化极速版3090显卡可玩含sora2工作流 构建by科哥
0/小时
ComfyUI
ComfyUI基础镜像纯净版0.3.50
ComfyUI基础镜像纯净版0.3.50
8
@龙没耳
龙没耳认证作者
50
308H
更新时间2026-01-30
支持自启动
ComfyUI基础镜像纯净版0.3.50
ComfyUI基础镜像纯净版0.3.50
0/小时
AI应用
PDFMathTranslate-next基于 AI 完整保留排版的 PDF 文档全文双语翻译
PDFMathTranslate-next基于 AI 完整保留排版的 PDF 文档全文双语翻译
6
@AI画师大阳
AI画师大阳认证作者
73
1704H
更新时间2026-01-30
支持自启动
基于 AI 完整保留排版的 PDF 文档全文双语翻译
基于 AI 完整保留排版的 PDF 文档全文双语翻译
0/小时
FluxComfyUI图片生成
FLUX.2:下一代视觉生成引擎
FLUX.2:下一代视觉生成引擎
5
@AI-KSK
AI-KSK认证作者
57
99H
更新时间2026-01-30
Flux.2 是 2025 年最全面、最专业、最强大的统一视觉生成模型之一。
Flux.2 是 2025 年最全面、最专业、最强大的统一视觉生成模型之一。
0/小时
ComfyUI图片编辑Qwen-Image
aha的ComfyUI镜像——姿态编辑
aha的ComfyUI镜像——姿态编辑
7
@叫我aha就好
94
254H
更新时间2026-01-30
SDPose_OOD+Pose_editor+qwen image edit 2509,姿态估计与编辑,随心所欲修改姿态
SDPose_OOD+Pose_editor+qwen image edit 2509,姿态估计与编辑,随心所欲修改姿态
0/小时
混元视频生成
HunyuanVideo 1.5开源视频生成模型-ComfyUI实现
HunyuanVideo 1.5开源视频生成模型-ComfyUI实现
9
@AI-KSK
AI-KSK认证作者
78
128H
更新时间2026-01-30
该镜像集成了刚刚开源的 HunyuanVideo 1.5 模型
该镜像集成了刚刚开源的 HunyuanVideo 1.5 模型
0/小时
ComfyUI
ComfyUI整合镜像
ComfyUI整合镜像
7
@鹄仙
鹄仙认证作者
67
294H
更新时间2026-01-30
一个Comfy UI的整合包,自用版,带插件和部分模型
一个Comfy UI的整合包,自用版,带插件和部分模型
0/小时
DeepSeekOCR识别
Deepseek orc webui在线图片识别文字pdf文件转文字 七种识别文字 构建by科哥
Deepseek orc webui在线图片识别文字pdf文件转文字 七种识别文字 构建by科哥
3
@鸡你太美
鸡你太美认证作者
40
477H
更新时间2026-04-27
Deepseek orc webui在线图片识别文字pdf文件转文字
Deepseek orc webui在线图片识别文字pdf文件转文字
0/小时
混元3D生成
ComfyUI-SAM3-Hunyuan3D-Part-SAM3DBody工作流集合 构建By科哥
ComfyUI-SAM3-Hunyuan3D-Part-SAM3DBody工作流集合 构建By科哥
1
@鸡你太美
鸡你太美认证作者
18
22H
更新时间2026-04-27
支持自启动
sam3是谷歌开源的一个项目图像拆分,3D渲染等
sam3是谷歌开源的一个项目图像拆分,3D渲染等
0/小时
混元视频生成
HunyuanVideo-1.5
HunyuanVideo-1.5
6
@十字鱼
十字鱼认证作者
30
53H
更新时间2025-11-24
支持自启动
一个领先的超轻量级视频生成模型
一个领先的超轻量级视频生成模型
0/小时
IndexTTS语音合成
AI听书 IndexTTS vllm加速版
AI听书 IndexTTS vllm加速版
10
@CyberWon
87
75H
更新时间2026-01-23
低成本高质量快速生成有声书。
低成本高质量快速生成有声书。
0.01/小时
ComfyUIQwen-Image图片生成
一张图生成多角度工作流-万物融合工作流升级版
一张图生成多角度工作流-万物融合工作流升级版
18
@匹夫
匹夫认证作者
135
329H
更新时间2026-01-30
一张图生成多角度工作流-万物融合工作流升级版
一张图生成多角度工作流-万物融合工作流升级版
0/小时
视频生成
超强AI图生视频RemixV2-支持批量生成、首尾帧视频、高清放大
超强AI图生视频RemixV2-支持批量生成、首尾帧视频、高清放大
83
@与AI同行
与AI同行认证作者
1124
5836H
更新时间2026-03-31
支持自启动
AI生成视频,Wan2.2-RemixV2整合包,支持图生视频、首尾帧视频,支持批量单图视频、批量首尾帧,支持高清放大、加载Lora、NSFW,最低8G显存可用
AI生成视频,Wan2.2-RemixV2整合包,支持图生视频、首尾帧视频,支持批量单图视频、批量首尾帧,支持高清放大、加载Lora、NSFW,最低8G显存可用
0/小时
语音合成
错金流TTS地表炸天TTS工具,一百多款自然人声,极速复刻
错金流TTS地表炸天TTS工具,一百多款自然人声,极速复刻
4
@独立工作者
51
186H
更新时间2026-02-02
地表炸天TTS工具,一百多款自然人声,极速复刻
地表炸天TTS工具,一百多款自然人声,极速复刻
0/小时
视频超分
FlashVSR 视频高清放大工具
FlashVSR 视频高清放大工具
19
@AI画师大阳
AI画师大阳认证作者
438
890H
更新时间2026-01-30
支持自启动
FlashVSR 视频高清放大工具
FlashVSR 视频高清放大工具
0/小时
语音合成
XKPLUS2
XKPLUS2
0
@REDCOPY
4
0H
更新时间2025-11-24
支持自启动
加速优化版
加速优化版
0.76/小时
语音合成
XKPLUS1
XKPLUS1
1
@REDCOPY
4
22H
更新时间2025-11-24
支持自启动
30系显卡优化版
30系显卡优化版
0.46/小时
语音合成
云端88888888
云端88888888
0
@REDCOPY
2
22H
更新时间2025-11-17
支持自启动
3080Ti专用
3080Ti专用
0.46/小时
语音合成
语音88888888
语音88888888
0
@REDCOPY
3
10H
更新时间2025-11-17
支持自启动
3080Ti专用
3080Ti专用
0.76/小时
AI应用
video-subtitle-extractor视频字幕提取器 全智能加速优化版 构建by科哥
video-subtitle-extractor视频字幕提取器 全智能加速优化版 构建by科哥
0
@鸡你太美
鸡你太美认证作者
12
19H
更新时间2026-04-27
一键提取视频字幕 加速优化
一键提取视频字幕 加速优化
0/小时
语音合成语音识别
Step-Audio-EditX
Step-Audio-EditX
3
@十字鱼
十字鱼认证作者
29
21H
更新时间2025-11-14
支持自启动
一个强大的 3B 参数、基于 LLM 的强化学习音频编辑模型,擅长编辑情感、说话风格和副语言,并具有稳健的零样本文本转语音功能
一个强大的 3B 参数、基于 LLM 的强化学习音频编辑模型,擅长编辑情感、说话风格和副语言,并具有稳健的零样本文本转语音功能
0/小时
语音合成
VibeVoice:富有表现力的长篇多人对话语音合成工具
VibeVoice:富有表现力的长篇多人对话语音合成工具
13
@AI画师大阳
AI画师大阳认证作者
144
670H
更新时间2026-01-30
支持自启动
富有表现力的长篇多人对话语音合成工具
富有表现力的长篇多人对话语音合成工具
0/小时
语音合成语音克隆
IndexTTS2 B站开源超强语音克隆
IndexTTS2 B站开源超强语音克隆
368
@十字鱼
十字鱼认证作者
2565
11033H
更新时间2026-03-16
支持自启动
B站开源超强语音克隆,在情感表达和时长控制方面取得突破的自回归零样本文本合成系统
B站开源超强语音克隆,在情感表达和时长控制方面取得突破的自回归零样本文本合成系统
0/小时
Wan视频编辑ComfyUI
Remix-Wan2.2一体化多功能创作镜像
Remix-Wan2.2一体化多功能创作镜像
33
@AI-KSK
AI-KSK认证作者
227
3263H
更新时间2026-01-30
一体化整合Remix-Wan 2.2 文生视频、图生视频、首尾帧生成与 Qwen3 自动提示词的多功能创作镜像
一体化整合Remix-Wan 2.2 文生视频、图生视频、首尾帧生成与 Qwen3 自动提示词的多功能创作镜像
0/小时
视频生成
AI视频消除万物-支持消除人物、物体、水印、字幕等
AI视频消除万物-支持消除人物、物体、水印、字幕等
79
@与AI同行
与AI同行认证作者
964
1732H
更新时间2026-03-31
支持自启动
AI视频消除万物整合包,支持消除人物、物体、水印、字幕等,支持较长视频、添加队列任务,打开即用,一键运行!
AI视频消除万物整合包,支持消除人物、物体、水印、字幕等,支持较长视频、添加队列任务,打开即用,一键运行!
0/小时
图片编辑图片生成ComfyUI
ChromoEdit-GGUF模型,,图片修改,图像修改,图生视频,支持5090新卡,comfyui,工作流,workflow
ChromoEdit-GGUF模型,,图片修改,图像修改,图生视频,支持5090新卡,comfyui,工作流,workflow
8
@刘悦的技术博客
刘悦的技术博客认证作者
66
23H
更新时间2026-01-30
支持自启动
ChromoEdit-GGUF模型,,图片修改,图像修改,图生视频,支持5090新卡,comfyui,工作流,workflow
ChromoEdit-GGUF模型,,图片修改,图像修改,图生视频,支持5090新卡,comfyui,工作流,workflow
0/小时
InfiniteTalk数字人
InfiniteTalk数字人视频制作软件,图片转视频,视频人物配音
InfiniteTalk数字人视频制作软件,图片转视频,视频人物配音
38
@AI画师大阳
AI画师大阳认证作者
565
851H
更新时间2026-02-02
支持自启动
InfiniteTalk 是一个无限长度的对话视频生成模型,支持音频驱动的视频到视频和图像到视频的生成
InfiniteTalk 是一个无限长度的对话视频生成模型,支持音频驱动的视频到视频和图像到视频的生成
0/小时
ComfyUI
Diffusion_pipe_in_ComfyUI天冬
Diffusion_pipe_in_ComfyUI天冬
3
@天冬
17
77H
更新时间2025-11-11
支持自启动
为 ComfyUI 提供了完整的 Diffusion 模型训练和微调功能。这个项目允许用户在 ComfyUI 的图形界面中配置和启动各种先进 AI 模型的训练,支持 LoRA 和全量微调
为 ComfyUI 提供了完整的 Diffusion 模型训练和微调功能。这个项目允许用户在 ComfyUI 的图形界面中配置和启动各种先进 AI 模型的训练,支持 LoRA 和全量微调
0/小时
语音合成语音识别
Step-Audio-EditX
Step-Audio-EditX
3
@鹄仙
鹄仙认证作者
20
44H
更新时间2025-11-24
一个音频编辑项目,“情绪编辑”“风格编辑”“语气编辑”和“降噪变速”
一个音频编辑项目,“情绪编辑”“风格编辑”“语气编辑”和“降噪变速”
0/小时
其他
猫哥的商业化AI,SORA2
猫哥的商业化AI,SORA2
20
@老猫本猫
849
2956H
更新时间2026-01-30
支持自启动
SORA2文生视频,图生视频
SORA2文生视频,图生视频
0/小时
AI应用
AI-Trader港大开源的AI自动交易竞赛框架 汉化构建By科哥
AI-Trader港大开源的AI自动交易竞赛框架 汉化构建By科哥
1
@鸡你太美
鸡你太美认证作者
9
6H
更新时间2026-04-27
股市有风险 投资请谨慎!
股市有风险 投资请谨慎!
0/小时
Qwen-Image图片生成
Qwen-Image-Edit-2509多图编辑及人物一致性生成
Qwen-Image-Edit-2509多图编辑及人物一致性生成
3
@AI画师大阳
AI画师大阳认证作者
156
182H
更新时间2026-01-30
支持自启动
Qwen-Image-Edit-2509精准多图内容编辑及人物一致性图片生成
Qwen-Image-Edit-2509精准多图内容编辑及人物一致性图片生成
0/小时
视频生成
超强Sora2视频去水印
超强Sora2视频去水印
52
@与AI同行
与AI同行认证作者
293
541H
更新时间2026-03-31
支持自启动
超强Sora2视频去水印
超强Sora2视频去水印
0/小时
InfiniteTalkWan数字人
SDPOSE 超复杂骨骼识别系统 X Lynx + InfiniteTalk + VACE + Wan 无限时长视频转绘体系
SDPOSE 超复杂骨骼识别系统 X Lynx + InfiniteTalk + VACE + Wan 无限时长视频转绘体系
5
@AI-KSK
AI-KSK认证作者
38
64H
更新时间2026-01-30
以 SDPOSE 为核心,融合 Lynx、InfiniteTalk、VACE 与Wan ,构建出一个可无限时长、骨骼级精度的人体视频转绘与智能生成体系
以 SDPOSE 为核心,融合 Lynx、InfiniteTalk、VACE 与Wan ,构建出一个可无限时长、骨骼级精度的人体视频转绘与智能生成体系
0/小时
视频超分
ComfyUI_FlashVSR 实时视频超分,支持1分钟以上视频超分
ComfyUI_FlashVSR 实时视频超分,支持1分钟以上视频超分
9
@smthem
152
137H
更新时间2025-11-27
支持自启动
实时视频超分项目,显存如果够大,所有视频超分到4K
实时视频超分项目,显存如果够大,所有视频超分到4K
0/小时
QwenVL视觉理解
Qwen3-vl-abliterated视觉模型,视频理解,多图理解,批量任务,反推提示词
Qwen3-vl-abliterated视觉模型,视频理解,多图理解,批量任务,反推提示词
34
@刘悦的技术博客
刘悦的技术博客认证作者
154
1122H
更新时间2026-01-30
支持自启动
Qwen3-vl-abliterated视觉模型,视频理解,多图理解,批量任务,反推提示词
Qwen3-vl-abliterated视觉模型,视频理解,多图理解,批量任务,反推提示词
0/小时
Wan视频编辑
animate完美一致性人物迁移
animate完美一致性人物迁移
34
@
216
302H
更新时间2026-01-30
支持自启动
无惧镜头切换人物迁移
无惧镜头切换人物迁移
0/小时
视频编辑ComfyUI
4步骤完成风格转绘vlog
4步骤完成风格转绘vlog
3
@鹄仙
鹄仙认证作者
13
85H
更新时间2026-01-09
支持自启动
4步骤完成风格转绘vlog
4步骤完成风格转绘vlog
0/小时
WanLora训练
Wan2.2-Lora训练diffusionpipe
Wan2.2-Lora训练diffusionpipe
10
@梦影Erislia
91
504H
更新时间2026-01-30
Wan2.2Lora训练diffusionpipe
Wan2.2Lora训练diffusionpipe
0/小时
图片编辑图片生成
ChronoEdit
ChronoEdit
3
@十字鱼
十字鱼认证作者
11
6H
更新时间2025-11-04
支持自启动
面向图像编辑和世界模拟的时序推理
面向图像编辑和世界模拟的时序推理
0/小时
Wan视频编辑
wan2.2视频编辑人物替换背景替换
wan2.2视频编辑人物替换背景替换
79
@老徐Ai研习社
老徐Ai研习社认证作者
921
1828H
更新时间2025-11-24
支持自启动
视频编辑人物替换背景替换局部修改
视频编辑人物替换背景替换局部修改
0/小时
语音合成
SoulX-Podcast:能说方言、带情绪的真实感长播客生成工具 构建by科哥
SoulX-Podcast:能说方言、带情绪的真实感长播客生成工具 构建by科哥
6
@鸡你太美
鸡你太美认证作者
74
135H
更新时间2026-04-27
支持自启动
SoulX-Podcast:能说方言、带情绪的真实感长播客生成工具
SoulX-Podcast:能说方言、带情绪的真实感长播客生成工具
0/小时
Wan视频编辑
Wan2.2-Animate-14B动作模仿及视频人物替换
Wan2.2-Animate-14B动作模仿及视频人物替换
57
@AI画师大阳
AI画师大阳认证作者
530
596H
更新时间2026-01-30
支持自启动
Wan2.2-Animate-14B一张图片模仿视频人物动作及替换视频中人物
Wan2.2-Animate-14B一张图片模仿视频人物动作及替换视频中人物
0/小时
语音合成
SoulX-Podcast-1.7B语音合成,接口API调用,多人播客合成,方言合成,语速调节,支持笑声咳嗽指令,支持5090新卡,音色保存
SoulX-Podcast-1.7B语音合成,接口API调用,多人播客合成,方言合成,语速调节,支持笑声咳嗽指令,支持5090新卡,音色保存
9
@刘悦的技术博客
刘悦的技术博客认证作者
86
124H
更新时间2025-11-14
支持自启动
SoulX-Podcast-1.7B语音合成,接口API调用,多人播客合成,方言合成,语速调节,支持笑声咳嗽指令,支持5090新卡,音色保存
SoulX-Podcast-1.7B语音合成,接口API调用,多人播客合成,方言合成,语速调节,支持笑声咳嗽指令,支持5090新卡,音色保存
0/小时
图片生成
最强AI图片编辑-QwenImageEdit加速版-支持换装、换姿势、批量生成、高清放大
最强AI图片编辑-QwenImageEdit加速版-支持换装、换姿势、批量生成、高清放大
37
@与AI同行
与AI同行认证作者
343
882H
更新时间2026-03-31
支持自启动
最强AI图片编辑-QwenImageEdit-支持换装、换姿势、批量生成、SeedVR2高清放大
最强AI图片编辑-QwenImageEdit-支持换装、换姿势、批量生成、SeedVR2高清放大
0/小时
视频编辑
facefusion3.4.1图片视频换脸神器 汉化版构建by科哥
facefusion3.4.1图片视频换脸神器 汉化版构建by科哥
23
@鸡你太美
鸡你太美认证作者
152
209H
更新时间2026-04-27
facefusion3.4官方原版
facefusion3.4官方原版
0/小时
Flux图片生成
DYPE超大分辨率1600万像素图像生成,ComfyUI插件实现
DYPE超大分辨率1600万像素图像生成,ComfyUI插件实现
1
@smthem
14
42H
更新时间2025-11-02
支持自启动
消费级显卡开始生成4096*4096的超大尺寸图片
消费级显卡开始生成4096*4096的超大尺寸图片
0/小时
Wan视频编辑ComfyUI
wan2.2视频瞳孔转场
wan2.2视频瞳孔转场
5
@skyrimprey
7
169H
更新时间2026-01-30
挂载wan2.2瞳孔转场lora,实现专业的视频转场效果
挂载wan2.2瞳孔转场lora,实现专业的视频转场效果
0/小时
图片编辑AI工具
最强照片上色DDColor-牛哥定制版
最强照片上色DDColor-牛哥定制版
5
@NiuGee
NiuGee认证作者
21
138H
更新时间2026-01-30
支持自启动
🎨 DDColor 牛哥镜像版 - 黑白图像智能上色 牛哥针对DDColor黑白图像上色模型制作的一手镜像,这应该是目前效果最好的黑白照片智能上色解决方案之一。
🎨 DDColor 牛哥镜像版 - 黑白图像智能上色 牛哥针对DDColor黑白图像上色模型制作的一手镜像,这应该是目前效果最好的黑白照片智能上色解决方案之一。
0/小时
IndexTTS语音合成
IndexTTS2/GPT-SoVITS+Srt-AI-Voice-Assistant多角色字幕长文本一键配音镜像
IndexTTS2/GPT-SoVITS+Srt-AI-Voice-Assistant多角色字幕长文本一键配音镜像
37
@数列解析几何一生之敌
数列解析几何一生之敌认证作者
328
2377H
更新时间2026-02-02
支持自启动
Srt-AI-Voice-Assistant配音辅助工具搭配IndexTTS2/GSV的镜像
Srt-AI-Voice-Assistant配音辅助工具搭配IndexTTS2/GSV的镜像
0/小时
视频生成
超强AI生成视频-SmoothMix-V2合集-效果超强
超强AI生成视频-SmoothMix-V2合集-效果超强
43
@与AI同行
与AI同行认证作者
438
1685H
更新时间2026-03-31
支持自启动
SmoothMix-V2合集-效果超强,支持文生视频、图生视频、首尾帧、批量首尾帧视频,支持NSFW、高清修复!
SmoothMix-V2合集-效果超强,支持文生视频、图生视频、首尾帧、批量首尾帧视频,支持NSFW、高清修复!
0/小时
LongCat视频生成
美团LongCat-ComfyUI|文生视频·图生视频·视频延续|长视频生成
美团LongCat-ComfyUI|文生视频·图生视频·视频延续|长视频生成
11
@AI-KSK
AI-KSK认证作者
102
344H
更新时间2026-01-30
这是一个集成了美团LongCat模型与ComfyUI的镜像,提供文生视频、图生视频和视频延续三大功能,核心优势在于能生成长时间且质量稳定的视频。
这是一个集成了美团LongCat模型与ComfyUI的镜像,提供文生视频、图生视频和视频延续三大功能,核心优势在于能生成长时间且质量稳定的视频。
0/小时
视频生成
超强AI生成视频-Lightx2v-I2V-超强动态、分镜效果
超强AI生成视频-Lightx2v-I2V-超强动态、分镜效果
18
@与AI同行
与AI同行认证作者
195
530H
更新时间2026-03-31
支持自启动
超强AI生成视频-Lightx2v-I2V-超强动态、分镜效果。支持图生视频,首尾帧、批量首尾帧视频、批量生成、高清修复
超强AI生成视频-Lightx2v-I2V-超强动态、分镜效果。支持图生视频,首尾帧、批量首尾帧视频、批量生成、高清修复
0/小时
LongCat视频生成
美团Longcat-video视频模型
美团Longcat-video视频模型
5
@社恐的知识树
社恐的知识树认证作者
19
103H
更新时间2025-10-29
支持自启动
美团开源的长视频生成模型-Longcat,ComfyUI抢先体验版,后续优化后继续更新!
美团开源的长视频生成模型-Longcat,ComfyUI抢先体验版,后续优化后继续更新!
0/小时
数字人
LatentSync抖音出品高质量对口型软件
LatentSync抖音出品高质量对口型软件
58
@AI画师大阳
AI画师大阳认证作者
876
7501H
更新时间2026-01-30
支持自启动
高质量对口型工具
高质量对口型工具
0/小时
视频超分
FlashVSR_Ultra_Fast,图片视频超清放大,支持批量任务,支持5090新卡
FlashVSR_Ultra_Fast,图片视频超清放大,支持批量任务,支持5090新卡
40
@刘悦的技术博客
刘悦的技术博客认证作者
844
3655H
更新时间2026-01-30
支持自启动
FlashVSR_Ultra_Fast,图片视频超清放大,支持批量任务,支持5090新卡
FlashVSR_Ultra_Fast,图片视频超清放大,支持批量任务,支持5090新卡
0/小时
视频编辑ComfyUI
一键视频转绘Ditto
一键视频转绘Ditto
6
@鹄仙
鹄仙认证作者
57
67H
更新时间2026-02-02
把视频整体转会成其他风格
把视频整体转会成其他风格
0/小时
ComfyUI
积木comfyui
积木comfyui
9
@积木comfyui
43
62H
更新时间2026-02-02
支持自启动
简单易懂,用核心原理展示工作流
简单易懂,用核心原理展示工作流
0/小时
视频生成
Video-As-Prompt
Video-As-Prompt
2
@十字鱼
十字鱼认证作者
1
1H
更新时间2025-10-28
支持自启动
统一语义控制的视频生成
统一语义控制的视频生成
0/小时
Qwen-ImageComfyUIWan
Pony V7 × Qwen AIO × Smooth 2.0无限制生产|图像 / 编辑 / 视频 一体化
Pony V7 × Qwen AIO × Smooth 2.0无限制生产|图像 / 编辑 / 视频 一体化
13
@AI-KSK
AI-KSK认证作者
253
1271H
更新时间2026-02-02
这是一个整合图像生成、图像编辑和视频生产的 AI 创作工具。
这是一个整合图像生成、图像编辑和视频生产的 AI 创作工具。
0/小时
数字人
LiveTalking-V1.5
LiveTalking-V1.5
5
@有黑眼圈的小竹熊
227
2650H
更新时间2026-02-02
实时数字人解决方案
实时数字人解决方案
0.3/小时
ComfyUIWan视频生成
Comfyui_Ditto
Comfyui_Ditto
4
@skyrimprey
12
17H
更新时间2026-02-02
Ditto:基于指令的视频编辑框架,可以用于视频内元素的风格转换 本镜像为https://github.com/EzioBy/Ditto的Comfyui实现
Ditto:基于指令的视频编辑框架,可以用于视频内元素的风格转换 本镜像为https://github.com/EzioBy/Ditto的Comfyui实现
0/小时
AI应用
MinerU:高质量PDF转Markdown/JSON
MinerU:高质量PDF转Markdown/JSON
10
@AI画师大阳
AI画师大阳认证作者
216
844H
更新时间2026-02-02
支持自启动
快速高效的将PDF文档转为Markdown/JSON文件
快速高效的将PDF文档转为Markdown/JSON文件
0/小时
视频生成
超强AI视频风格重绘-Ditto-支持长视频、批量生成
超强AI视频风格重绘-Ditto-支持长视频、批量生成
15
@与AI同行
与AI同行认证作者
85
132H
更新时间2026-03-31
支持自启动
超强AI视频重绘Ditto-支持长视频、批量生成,支持视频风格转换、动漫转真人视频,超级方便!
超强AI视频重绘Ditto-支持长视频、批量生成,支持视频风格转换、动漫转真人视频,超级方便!
0/小时
3D生成
微软TRELLIS图片/文本转3D模型资产
微软TRELLIS图片/文本转3D模型资产
3
@AI画师大阳
AI画师大阳认证作者
102
253H
更新时间2026-02-02
支持自启动
高质量图片/文本转3D网格模型
高质量图片/文本转3D网格模型
0/小时
DeepSeekOCR识别
DeepSeek-OCR
DeepSeek-OCR
16
@十字鱼
十字鱼认证作者
59
685H
更新时间2025-10-24
上下文光学压缩
上下文光学压缩
0/小时
Qwen-ImageComfyUI
Qwen-image-Nunchaku智能扩图,AI绘图,关键词扩图,图像填充,图像延展,支持5090新卡
Qwen-image-Nunchaku智能扩图,AI绘图,关键词扩图,图像填充,图像延展,支持5090新卡
5
@刘悦的技术博客
刘悦的技术博客认证作者
55
45H
更新时间2026-02-02
支持自启动
Qwen-image-Nunchaku智能扩图,AI绘图,关键词扩图,图像填充,图像延展,支持5090新卡
Qwen-image-Nunchaku智能扩图,AI绘图,关键词扩图,图像填充,图像延展,支持5090新卡
0/小时
InfiniteTalk数字人
ComfyUI_infiniteTalk数字人工作流
ComfyUI_infiniteTalk数字人工作流
73
@好奇漫步
1339
20865H
更新时间2026-02-02
本镜像包含ComfyUI许多工作流,目前优先测试部署完毕infiniteTalk数字人工作流、Wan2.2生视频工作流、HoMo数字人工作流等,后续会继续部署完善更多的工作流。
本镜像包含ComfyUI许多工作流,目前优先测试部署完毕infiniteTalk数字人工作流、Wan2.2生视频工作流、HoMo数字人工作流等,后续会继续部署完善更多的工作流。
0/小时
WanQwen-Image视频生成
Qwen-image以及WAN视频系列,打开即用!
Qwen-image以及WAN视频系列,打开即用!
10
@老许爱吃肉丶
172
2244H
更新时间2026-02-02
支持自启动