登录
镜像社区
我的收藏

优云智算镜像社区 - 海量AI模型一键部署

快捷筛选

官方镜像免费镜像支持自启动

AIGC热门

数字人视频超分OCR识别AI漫剧AI音乐AI电商AI应用

图像/视频生成

ComfyUIWanZ-ImageQwen-ImageLTXInfiniteTalkLongCatFlux混元Lora训练SD3D生成图片生成图片编辑视频生成视频编辑

语音/TTS生成

IndexTTSQwen3-TTSCosyVoiceSVC语音合成语音分离语音识别

LLM

DeepSeekQwenGLM推理框架行业模型文本模型ChatBot

计算机视觉

VL视觉理解目标检测图像分割三维重建具身智能

科学计算

分子动力生物信息物理模拟数据分析

其他

其他
默认排序
AI应用
RecommendCount
OpenClaw / ClawdBot
OpenClaw / ClawdBot
10
@优云智算
138
1740H
更新时间2026-02-12
支持自启动
ClawdBot模型,支持飞书、Telegram接入,支持优云智算模型API
ClawdBot模型,支持飞书、Telegram接入,支持优云智算模型API
0/小时
图片生成模型训练
RecommendCount
AI图片ZImage模型训练,一键启动WebUI、无需配置
AI图片ZImage模型训练,一键启动WebUI、无需配置
23
@与AI同行
与AI同行认证作者
217
888H
更新时间2026-02-11
支持自启动
AI图片ZImage模型训练,一键启动WebUI、无需配置
AI图片ZImage模型训练,一键启动WebUI、无需配置
0/小时
数字人
RecommendCount
LiveTalking
LiveTalking
69
@lipku
lipku认证作者
3257
48362H
更新时间2026-02-04
LiveTalking镜像提供实时交互数字人解决方案,支持ERNerf、MuseTalk、Wav2Lip,实现单张人脸照片驱动的超低延迟(<100ms)唇形同步、表情及头部运动控制。
LiveTalking镜像提供实时交互数字人解决方案,支持ERNerf、MuseTalk、Wav2Lip,实现单张人脸照片驱动的超低延迟(<100ms)唇形同步、表情及头部运动控制。
0/小时
语音WebUI
RecommendCount
RVC
RVC
66
@aiguoliuguo
aiguoliuguo认证作者
6650
21543H
更新时间2026-02-11
AI翻唱+语音变声器:RVC语音转换训练推理用WebUI,3分钟极速训练新模型
AI翻唱+语音变声器:RVC语音转换训练推理用WebUI,3分钟极速训练新模型
0/小时
LoraQwen-imageWan
RecommendCount
AiToolKit汉化版
AiToolKit汉化版
43
@Doc_workBox
Doc_workBox认证作者
694
6681H
更新时间2026-02-11
支持自启动
Aitoolkit汉化版,自适应UI方便手机端查看训练进度
Aitoolkit汉化版,自适应UI方便手机端查看训练进度
0/小时
图片生成视频生成
Toonflow一款AI短剧创作工具将小说自动转化为剧本生成 AI 图片和视频的平台 构建by科哥
Toonflow一款AI短剧创作工具将小说自动转化为剧本生成 AI 图片和视频的平台 构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
0
0H
更新时间2026-02-16
支持自启动
Toonflow一款AI短剧创作工具将小说自动转化为剧本生成 AI 图片和视频的平台 构建by科哥
Toonflow一款AI短剧创作工具将小说自动转化为剧本生成 AI 图片和视频的平台 构建by科哥
0/小时
语音合成Qwen3-TTS
Qwen3-TTS-AllinOne,多音字控制,英文数字发音纠正,批量任务,音色保存,接口API调用,支持超长文本,语速调节,文字转语音,TTS
Qwen3-TTS-AllinOne,多音字控制,英文数字发音纠正,批量任务,音色保存,接口API调用,支持超长文本,语速调节,文字转语音,TTS
15
@刘悦的技术博客
刘悦的技术博客认证作者
106
146H
更新时间2026-02-16
支持自启动
Qwen3-TTS-AllinOne,多音字控制,英文数字发音纠正,批量任务,音色保存,接口API调用,支持超长文本,语速调节,文字转语音,TTS
Qwen3-TTS-AllinOne,多音字控制,英文数字发音纠正,批量任务,音色保存,接口API调用,支持超长文本,语速调节,文字转语音,TTS
0/小时
ComfyUIWan视频超分
视频批量补帧、超分放大与细节修复,ComfyUI视频增强镜像,Seedance2.0黄金搭档
视频批量补帧、超分放大与细节修复,ComfyUI视频增强镜像,Seedance2.0黄金搭档
1
@AI-KSK
AI-KSK认证作者
0
0H
更新时间2026-02-15
集成 FlashVSR / GIMM / LTX-2 / SeedVR2 的 ComfyUI 视频增强镜像,一键批量补帧、放大、细节修复。
集成 FlashVSR / GIMM / LTX-2 / SeedVR2 的 ComfyUI 视频增强镜像,一键批量补帧、放大、细节修复。
0/小时
图片生成视频生成
Penguin-Magic一个图片视频API在线生成的无限画布的批量生成工作流开源项目 构建by科哥
Penguin-Magic一个图片视频API在线生成的无限画布的批量生成工作流开源项目 构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
0
0H
更新时间2026-02-15
支持自启动
Penguin-Magic一个图片视频API在线生成的无限画布的批量生成工作流开源项目 构建by科哥 版权属于原作者
Penguin-Magic一个图片视频API在线生成的无限画布的批量生成工作流开源项目 构建by科哥 版权属于原作者
0/小时
FluxComfyUI图片生成
Flux.2-Klein-9B-GGUF,局部重绘,文生图,图像编辑,多图编辑,自动提示词,批量任务
Flux.2-Klein-9B-GGUF,局部重绘,文生图,图像编辑,多图编辑,自动提示词,批量任务
21
@刘悦的技术博客
刘悦的技术博客认证作者
195
358H
更新时间2026-02-15
支持自启动
Flux.2-Klein-9B-GGUF,局部重绘,文生图,图像编辑,多图编辑,自动提示词,批量任务,支持最新50系和计算卡
Flux.2-Klein-9B-GGUF,局部重绘,文生图,图像编辑,多图编辑,自动提示词,批量任务,支持最新50系和计算卡
0/小时
视频超分
最快AI视频高清修复FlashVSR-支持批量生成
最快AI视频高清修复FlashVSR-支持批量生成
58
@与AI同行
与AI同行认证作者
1491
6671H
更新时间2026-02-15
支持自启动
最快AI视频高清修复FlashVSR
最快AI视频高清修复FlashVSR
0/小时
语音合成语音分离SVC
SoulX-Singer,零样本变声器,AI歌曲翻唱,歌词修改,改歌词,语音内容修改
SoulX-Singer,零样本变声器,AI歌曲翻唱,歌词修改,改歌词,语音内容修改
2
@刘悦的技术博客
刘悦的技术博客认证作者
15
21H
更新时间2026-02-14
支持自启动
SoulX-Singer,零样本变声器,AI歌曲翻唱,歌词修改,改歌词,语音内容修改
SoulX-Singer,零样本变声器,AI歌曲翻唱,歌词修改,改歌词,语音内容修改
0/小时
ComfyUIWanQwen-Image
ComfyUI云端整合包2602
ComfyUI云端整合包2602
0
@鹄仙
鹄仙认证作者
21
41H
更新时间2026-02-13
全面升级到torch2.10+cu130
全面升级到torch2.10+cu130
0/小时
音乐语音分离语音识别
AI音乐制作项目ACE-Step-1.5官方包
AI音乐制作项目ACE-Step-1.5官方包
3
@鹄仙
鹄仙认证作者
25
49H
更新时间2026-02-11
专业级别的AI音乐制作项目
专业级别的AI音乐制作项目
0/小时
AI音乐
ACE-Step-1.5,AI歌曲生成,男女对唱,纯音乐生成
ACE-Step-1.5,AI歌曲生成,男女对唱,纯音乐生成
4
@刘悦的技术博客
刘悦的技术博客认证作者
20
30H
更新时间2026-02-11
支持自启动
ACE-Step-1.5,AI歌曲生成,男女对唱,纯音乐生成
ACE-Step-1.5,AI歌曲生成,男女对唱,纯音乐生成
0/小时
3D生成
UltraShape-1.0
UltraShape-1.0
0
@苍耳阿猫
苍耳阿猫认证作者
10
17H
更新时间2026-02-11
UltraShape-1.0
UltraShape-1.0
0/小时
AI应用视频生成视频编辑
LingBot-World
LingBot-World
0
@敢敢のwings
敢敢のwings认证作者
2
6H
更新时间2026-02-10
蚂蚁集团旗下具身智能公司灵波科技(Robbyant)正式开源了其世界模型 LingBot-World。这一消息发布后迅速登顶全球社交媒体热榜,引发了人工智能领域的广泛关注
蚂蚁集团旗下具身智能公司灵波科技(Robbyant)正式开源了其世界模型 LingBot-World。这一消息发布后迅速登顶全球社交媒体热榜,引发了人工智能领域的广泛关注
0/小时
视频生成
最强AI生成数字人,InfiniteTalk官方版 v260209
最强AI生成数字人,InfiniteTalk官方版 v260209
3
@与AI同行
与AI同行认证作者
67
128H
更新时间2026-02-10
支持自启动
最强AI生成数字人,InfiniteTalk官方版 v260209,支持图片数字人,支持超长视频、批量队列生成!
最强AI生成数字人,InfiniteTalk官方版 v260209,支持图片数字人,支持超长视频、批量队列生成!
0/小时
其他
那颗星星自制香蕉pro和sora2工作流
那颗星星自制香蕉pro和sora2工作流
21
@那颗星星
184
1809H
更新时间2026-02-10
支持自启动
内含我所有自制的comfyui节点和工作流,轻松使用nanobananapro和Sora2
内含我所有自制的comfyui节点和工作流,轻松使用nanobananapro和Sora2
0/小时
ComfyUIIndexTTSWan
comfyui工作站
comfyui工作站
0
@AI绘视玩家
30
37H
更新时间2026-02-10
支持自启动
集成图片生成|视频生成|数字人|声音编辑|音乐生成!配套Comfyui批量管理生成软件到(B站)【AI绘视玩家】处获取~
集成图片生成|视频生成|数字人|声音编辑|音乐生成!配套Comfyui批量管理生成软件到(B站)【AI绘视玩家】处获取~
0/小时
ComfyUIZ-Image
Comfyui2月最新整合包,含最新klein、Z-image全系、WAN全系、LTX2.0等
Comfyui2月最新整合包,含最新klein、Z-image全系、WAN全系、LTX2.0等
15
@老许爱吃肉丶
92
299H
更新时间2026-02-08
支持自启动
自用!Comfyui2月最新整合包,含最新klein、Z-image全系、WAN全系、LTX2.0等
自用!Comfyui2月最新整合包,含最新klein、Z-image全系、WAN全系、LTX2.0等
0/小时
语音合成Qwen3-TTSAI电商
Qwen3TTS/IndexTTS2/VoxCPM1.5】N合一AI语音整合TTS ALL in ONE,电商直播带货必备零样本实时推理,人声超逼真自然,语气语调接近真实
Qwen3TTS/IndexTTS2/VoxCPM1.5】N合一AI语音整合TTS ALL in ONE,电商直播带货必备零样本实时推理,人声超逼真自然,语气语调接近真实
10
@淼淼爸的ai笔记
113
303H
更新时间2026-02-07
支持自启动
本镜像专为AI语音直播项目打造,也可以直接在线推理webui使用,集成IndexTTS-2/VoxCPM1.5/Qwen3TTS, 支持API调用,直播带货,在线克隆,语气语调自然,音色还原度高
本镜像专为AI语音直播项目打造,也可以直接在线推理webui使用,集成IndexTTS-2/VoxCPM1.5/Qwen3TTS, 支持API调用,直播带货,在线克隆,语气语调自然,音色还原度高
0/小时
语音合成AI音乐
ACE-Step-1.5官方原版,修复吞歌词问题,音乐重构,音乐重绘,AI歌曲生成,男女对唱,纯音乐生成,相关竞品:DiffRhythm/yuE/HeartMuLa
ACE-Step-1.5官方原版,修复吞歌词问题,音乐重构,音乐重绘,AI歌曲生成,男女对唱,纯音乐生成,相关竞品:DiffRhythm/yuE/HeartMuLa
1
@刘悦的技术博客
刘悦的技术博客认证作者
13
5H
更新时间2026-02-09
支持自启动
ACE-Step-1.5官方原版,修复吞歌词问题,音乐重构,音乐重绘,AI歌曲生成,男女对唱,纯音乐生成,相关竞品:DiffRhythm/yuE/HeartMuLa
ACE-Step-1.5官方原版,修复吞歌词问题,音乐重构,音乐重绘,AI歌曲生成,男女对唱,纯音乐生成,相关竞品:DiffRhythm/yuE/HeartMuLa
0/小时
ComfyUI视频生成数字人
LTX2-Rapid-Merges视频生成
LTX2-Rapid-Merges视频生成
9
@AI-KSK
AI-KSK认证作者
73
118H
更新时间2026-02-08
包含了文生、图生、首尾帧、对口型 4 大类工作流,提供SFW/NSFW的完整体验
包含了文生、图生、首尾帧、对口型 4 大类工作流,提供SFW/NSFW的完整体验
0/小时
其他
ROX Quant 3.0 - 量化投研系统可无卡模式运行 投资有风险交易须谨慎
ROX Quant 3.0 - 量化投研系统可无卡模式运行 投资有风险交易须谨慎
1
@科哥AIGC
科哥AIGC认证作者
4
4H
更新时间2026-02-07
支持自启动
ROX Quant 3.0 - 量化投研系统可无卡模式运行 投资有风险交易须谨慎
ROX Quant 3.0 - 量化投研系统可无卡模式运行 投资有风险交易须谨慎
0/小时
语音合成语音克隆
【Qwen3TTS】声音克隆 音色定制 长文本推理优化镜像
【Qwen3TTS】声音克隆 音色定制 长文本推理优化镜像
3
@两只鸽子
34
44H
更新时间2026-02-07
支持自启动
Qwen3TTS推理镜像
Qwen3TTS推理镜像
0/小时
InfiniteTalk数字人
InfiniteTalk数字人最新官方更新,上下文循环,一致性和速度优化,4步采样,高清放大,批量任务队列,基于comfyui,工作流
InfiniteTalk数字人最新官方更新,上下文循环,一致性和速度优化,4步采样,高清放大,批量任务队列,基于comfyui,工作流
14
@刘悦的技术博客
刘悦的技术博客认证作者
142
179H
更新时间2026-02-06
支持自启动
InfiniteTalk数字人最新官方更新,上下文循环,一致性和速度优化,4步采样,高清放大,批量任务队列,基于comfyui,工作流
InfiniteTalk数字人最新官方更新,上下文循环,一致性和速度优化,4步采样,高清放大,批量任务队列,基于comfyui,工作流
0/小时
AI漫剧
AutoAnimation短剧漫剧自动化工具
AutoAnimation短剧漫剧自动化工具
19
@IAI666
250
996H
更新时间2026-02-06
支持自启动
AutoAnimation短剧漫剧自动化工具及配套ComfyUI包含ZImage、flux2-kelin、qwenedit2511、wan2.2、qwen-tts、index-tts
AutoAnimation短剧漫剧自动化工具及配套ComfyUI包含ZImage、flux2-kelin、qwenedit2511、wan2.2、qwen-tts、index-tts
0.15/小时
ComfyUI
ComfyUI-建筑效果图
ComfyUI-建筑效果图
0
@
5
102H
更新时间2026-02-06
支持自启动
用于建筑效果图的生成与编辑
用于建筑效果图的生成与编辑
0/小时
其他
sora2文生视频、图生视频工作流
sora2文生视频、图生视频工作流
32
@科哥AIGC
科哥AIGC认证作者
263
1463H
更新时间2026-02-06
支持自启动
sora2,veo3,grok文生视频图生视频谷歌香蕉出图工作流comfyui支持无卡省钱模式哦
sora2,veo3,grok文生视频图生视频谷歌香蕉出图工作流comfyui支持无卡省钱模式哦
0/小时
语音合成AI音乐
K哥配音工作室(indextts2音色克隆+qwen3-tts音色生成+HeartMuLay音乐生成)
K哥配音工作室(indextts2音色克隆+qwen3-tts音色生成+HeartMuLay音乐生成)
3
@K哥讲AI
59
66H
更新时间2026-02-05
支持自启动
多功能配音镜像,融合 indextts2.qwen3-tts音色克隆 HeartMuLa音乐生成,支持多角色配音、文本创音色、一键克隆、音乐一键生成,还有 AI 角色分配.基础音色库及多语言.方言配音
多功能配音镜像,融合 indextts2.qwen3-tts音色克隆 HeartMuLa音乐生成,支持多角色配音、文本创音色、一键克隆、音乐一键生成,还有 AI 角色分配.基础音色库及多语言.方言配音
0/小时
ComfyUILTX
ComfyUI云端整合包LTX-2特别版
ComfyUI云端整合包LTX-2特别版
15
@鹄仙
鹄仙认证作者
28
22H
更新时间2026-02-12
支持LTX-2 scail wan2.2系列
支持LTX-2 scail wan2.2系列
0/小时
图片生成Z-Image
red-Z-Image-Base,15步采样,自定义分辨率,文生图,图生图,自动提示词,批量任务
red-Z-Image-Base,15步采样,自定义分辨率,文生图,图生图,自动提示词,批量任务
11
@刘悦的技术博客
刘悦的技术博客认证作者
55
24H
更新时间2026-02-04
支持自启动
red-Z-Image-Base,15步采样,自定义分辨率,文生图,图生图,自动提示词,批量任务
red-Z-Image-Base,15步采样,自定义分辨率,文生图,图生图,自动提示词,批量任务
0/小时
Qwen语音识别
Qwen-ASR
Qwen-ASR
0
@有黑眼圈的小竹熊
7
3H
更新时间2026-02-04
Qwen3-ASR 系列包括 Qwen3-ASR-1.7B 和 Qwen3-ASR-0.6B,支持 52 种语言和方言的语言识别与语音识别(ASR)。
Qwen3-ASR 系列包括 Qwen3-ASR-1.7B 和 Qwen3-ASR-0.6B,支持 52 种语言和方言的语言识别与语音识别(ASR)。
0.3/小时
ComfyUILTX
LTX-2-RapID-GGUF-图生视频-无限时长
LTX-2-RapID-GGUF-图生视频-无限时长
9
@刘悦的技术博客
刘悦的技术博客认证作者
54
43H
更新时间2026-02-04
支持自启动
LTX-2-RapID-GGUF-图生视频-无限时长
LTX-2-RapID-GGUF-图生视频-无限时长
0/小时
ComfyUILTX
LTX-2-RapID-GGUF-图片数字人-无限时长
LTX-2-RapID-GGUF-图片数字人-无限时长
4
@刘悦的技术博客
刘悦的技术博客认证作者
18
26H
更新时间2026-02-05
支持自启动
LTX-2-RapID-GGUF-图片数字人-无限时长
LTX-2-RapID-GGUF-图片数字人-无限时长
0/小时
推理框架Qwen
nano-vllm
nano-vllm
0
@kq123jk6n9
1
1H
更新时间2026-02-03
从0到1,理解vllm的核心内容。包含注释讲解和使用实例,使用教程。帮助大家学习vllm
从0到1,理解vllm的核心内容。包含注释讲解和使用实例,使用教程。帮助大家学习vllm
0.99/小时
ComfyUILTX
LTX2-视频生成最新整个大包(202602)
LTX2-视频生成最新整个大包(202602)
3
@NiuGee
NiuGee认证作者
21
26H
更新时间2026-02-04
支持自启动
震惊!LTX-2开源视频模型,人人都能当导演?牛哥一键整合免费AI创作神器!
震惊!LTX-2开源视频模型,人人都能当导演?牛哥一键整合免费AI创作神器!
0/小时
其他
Sora2API:一个将sora账号转为API服务接口的免费开源系统
Sora2API:一个将sora账号转为API服务接口的免费开源系统
2
@科哥AIGC
科哥AIGC认证作者
9
26H
更新时间2026-02-04
支持自启动
Sora2API:一个将sora账号转为API服务接口的免费开源系统
Sora2API:一个将sora账号转为API服务接口的免费开源系统
0/小时
数字人
最强AI数字人InfiniteTalk-图片和视频数字人
最强AI数字人InfiniteTalk-图片和视频数字人
360
@与AI同行
与AI同行认证作者
7307
28987H
更新时间2026-02-11
支持自启动
支持图片数字人、视频数字人、双人数字人,支持说话+唱歌对口型、长视频、完整歌曲生成、批量生成、高清放大!
支持图片数字人、视频数字人、双人数字人,支持说话+唱歌对口型、长视频、完整歌曲生成、批量生成、高清放大!
0/小时
WanQwen-Image数字人
数字人-语音克隆-wan2.2视频换人换装-Qwen-Image-Edit2509整合包
数字人-语音克隆-wan2.2视频换人换装-Qwen-Image-Edit2509整合包
44
@老徐Ai研习社
老徐Ai研习社认证作者
535
1863H
更新时间2026-02-02
支持自启动
数字人-语音克隆-wan2.2视频换人换装-Qwen-Image-Edit2511整合包
数字人-语音克隆-wan2.2视频换人换装-Qwen-Image-Edit2511整合包
0/小时
OCR识别
LightOn-OCR-1B,图片和PDF文字提取,图文混排,实时生成MarkDown文档,MarkDown文档下载,支持PDF全量解析
LightOn-OCR-1B,图片和PDF文字提取,图文混排,实时生成MarkDown文档,MarkDown文档下载,支持PDF全量解析
1
@刘悦的技术博客
刘悦的技术博客认证作者
6
0H
更新时间2026-02-02
支持自启动
LightOn-OCR-1B,图片和PDF文字提取,图文混排,实时生成MarkDown文档,MarkDown文档下载,支持PDF全量解析
LightOn-OCR-1B,图片和PDF文字提取,图文混排,实时生成MarkDown文档,MarkDown文档下载,支持PDF全量解析
0/小时
FluxWanComfyUI
Bob同学的comfyui云端镜像系列
Bob同学的comfyui云端镜像系列
107
@Bob同学
Bob同学认证作者
2051
6112H
更新时间2026-02-01
支持自启动
此版本内置 (Wan2.2\Flux\Kontext)系列的全部基础模型及工作流
此版本内置 (Wan2.2\Flux\Kontext)系列的全部基础模型及工作流
0/小时
图片生成Z-ImageQwen-Image
最全图片编辑模型大全-qwen2511多角度工作流-flux2-klein-9b全图片编辑模型-z-image-base图片生成模型
最全图片编辑模型大全-qwen2511多角度工作流-flux2-klein-9b全图片编辑模型-z-image-base图片生成模型
8
@匹夫
匹夫认证作者
73
114H
更新时间2026-02-04
最全图片编辑模型大全-qwen2511多角度工作流-flux2-klein-9b全图片编辑模型-z-image-base图片生成模型
最全图片编辑模型大全-qwen2511多角度工作流-flux2-klein-9b全图片编辑模型-z-image-base图片生成模型
0/小时
Lora训练Z-Image
Z-Image-Base的Lora训练同时支持FluxKlein-AI-TOOLKIT
Z-Image-Base的Lora训练同时支持FluxKlein-AI-TOOLKIT
3
@梦影Erislia
50
561H
更新时间2026-02-02
Z-Image-Base的Lora训练同时支持FluxKlein-AI-TOOLKIT
Z-Image-Base的Lora训练同时支持FluxKlein-AI-TOOLKIT
0/小时
Lora训练LTXWan
ai-toolkit全能Lora模型训练器
ai-toolkit全能Lora模型训练器
7
@老徐Ai研习社
老徐Ai研习社认证作者
87
577H
更新时间2026-02-01
支持自启动
支持主流模型lora训练
支持主流模型lora训练
0/小时
图片生成Z-Image
Nunchaku-ZImage极速出图
Nunchaku-ZImage极速出图
3
@Tanjie7
9
2H
更新时间2026-01-30
ZImage Nunchaku版本,已经配置好nunchaku环境,可以直接启动使用comfyui+nunchaku zimage出图
ZImage Nunchaku版本,已经配置好nunchaku环境,可以直接启动使用comfyui+nunchaku zimage出图
0/小时
ComfyUIWan视频生成
2026最新ComfyUI整合包_图片·视频·声音
2026最新ComfyUI整合包_图片·视频·声音
7
@老徐Ai研习社
老徐Ai研习社认证作者
63
473H
更新时间2026-01-30
支持自启动
2026最新ComfyUI整合包_图片·视频·声音
2026最新ComfyUI整合包_图片·视频·声音
0/小时
图片生成Z-Image
Z-Image-Base,35步采样,文生图,图生图,自动提示词,批量任务
Z-Image-Base,35步采样,文生图,图生图,自动提示词,批量任务
6
@刘悦的技术博客
刘悦的技术博客认证作者
63
74H
更新时间2026-01-29
支持自启动
Z-Image-Base,35步采样,文生图,图生图,自动提示词,批量任务
Z-Image-Base,35步采样,文生图,图生图,自动提示词,批量任务
0/小时
ComfyUI
Comfyui 一张照片制作一个lora训练数据集
Comfyui 一张照片制作一个lora训练数据集
6
@Prompt娄
36
149H
更新时间2026-01-29
支持自启动
一张照片制作一个角色一致性lora训练数据集
一张照片制作一个角色一致性lora训练数据集
0/小时
Z-Image图片生成
Z-Image
Z-Image
15
@十字鱼
十字鱼认证作者
101
647H
更新时间2026-01-30
支持自启动
Z-Image是一个拥有6B参数的强大且高效的图像生成模型。
Z-Image是一个拥有6B参数的强大且高效的图像生成模型。
0/小时
语音合成Qwen3-TTS
超级AI语音Qwen3-TTS合集,超强音色克隆、音色设计、情绪控制!
超级AI语音Qwen3-TTS合集,超强音色克隆、音色设计、情绪控制!
11
@与AI同行
与AI同行认证作者
64
51H
更新时间2026-01-28
支持自启动
超强AI语音生成,Qwen3-TTS整合包合集!超强音色克隆、音色设计、情绪控制,支持音色保存、多音字、超长文本生成。支持批量上传多个文件生成!
超强AI语音生成,Qwen3-TTS整合包合集!超强音色克隆、音色设计、情绪控制,支持音色保存、多音字、超长文本生成。支持批量上传多个文件生成!
0/小时
图片生成Z-Image
Z-Image系列,Base+Tubro反推生图放大一体化
Z-Image系列,Base+Tubro反推生图放大一体化
3
@社恐的知识树
社恐的知识树认证作者
20
38H
更新时间2026-01-28
支持自启动
阿里开源的Z-Image系列模型
阿里开源的Z-Image系列模型
0/小时
DeepSeekOCR识别
DeepSeek-OCR-2
DeepSeek-OCR-2
1
@敢敢のwings
敢敢のwings认证作者
17
14H
更新时间2026-01-29
DeepSeek-OCR 2 是 DeepSeek 团队开源的新一代 OCR 模型,该模型能够像人类一样带着逻辑去阅读文档。
DeepSeek-OCR 2 是 DeepSeek 团队开源的新一代 OCR 模型,该模型能够像人类一样带着逻辑去阅读文档。
0/小时
ComfyUI
ComfyUI学习版,内置多种基础模型-MumuOpenK
ComfyUI学习版,内置多种基础模型-MumuOpenK
9
@MumuOpenK
218
2722H
更新时间2026-01-29
支持自启动
内置多种基础模型,快速开启comfyui体验
内置多种基础模型,快速开启comfyui体验
0/小时
AI漫剧
Huobao-Drama-v1.0.4
Huobao-Drama-v1.0.4
4
@huobao-ai
huobao-ai认证作者
127
489H
更新时间2026-01-29
支持自启动
Huobao Drama 是一个基于 AI 的短剧自动化生产平台,实现从剧本生成、角色设计、分镜制作到视频合成的全流程自动化
Huobao Drama 是一个基于 AI 的短剧自动化生产平台,实现从剧本生成、角色设计、分镜制作到视频合成的全流程自动化
0/小时
数字人语音合成语音克隆
AI音乐、声音克隆:顶级数字人长视频套件V2
AI音乐、声音克隆:顶级数字人长视频套件V2
1
@AI-KSK
AI-KSK认证作者
12
26H
更新时间2026-02-11
镜像打通HeartMuLa音乐、Qwen3-TTS音色克隆、InfiniteTalk/LongCat长对话数字人与LTX2视频:写歌配音→照片开口→长时稳成片。
镜像打通HeartMuLa音乐、Qwen3-TTS音色克隆、InfiniteTalk/LongCat长对话数字人与LTX2视频:写歌配音→照片开口→长时稳成片。
0/小时
语音合成Qwen3-TTS
Qwen3-TTS语音模型, | 声音克隆 | 语音定制 | 语音预设 |
Qwen3-TTS语音模型, | 声音克隆 | 语音定制 | 语音预设 |
6
@社恐的知识树
社恐的知识树认证作者
43
31H
更新时间2026-01-27
阿里千问开源的最新语音类模型,显存占用小,生成速度快,支持10种主流语言。
阿里千问开源的最新语音类模型,显存占用小,生成速度快,支持10种主流语言。
0/小时
AI音乐
HeartMuLa-HL,支持中文提示词,无须标签式歌词,更自然的AI歌曲生成,开源版Suno
HeartMuLa-HL,支持中文提示词,无须标签式歌词,更自然的AI歌曲生成,开源版Suno
3
@刘悦的技术博客
刘悦的技术博客认证作者
23
25H
更新时间2026-01-26
支持自启动
HeartMuLa-HL,支持中文提示词,无须标签式歌词,更自然的AI歌曲生成,开源版Suno
HeartMuLa-HL,支持中文提示词,无须标签式歌词,更自然的AI歌曲生成,开源版Suno
0/小时
AI音乐Qwen3-TTS
HeartMula& Qwen3TTS 歌曲生成与语音设计
HeartMula& Qwen3TTS 歌曲生成与语音设计
0
@鹄仙
鹄仙认证作者
7
2H
更新时间2026-01-29
基于HeartMula和Qwen3TTS的歌曲生成与语音设计
基于HeartMula和Qwen3TTS的歌曲生成与语音设计
0/小时
FluxLora训练
Flux.Klein模型Lora训练AI-Toolkit
Flux.Klein模型Lora训练AI-Toolkit
2
@梦影Erislia
29
204H
更新时间2026-01-26
Flux.Klein模型Lora训练AI-Toolkit
Flux.Klein模型Lora训练AI-Toolkit
0/小时
语音合成Qwen3-TTS
Qwen3-TTS-0.6B,推理速度1比0.5,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
Qwen3-TTS-0.6B,推理速度1比0.5,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
4
@刘悦的技术博客
刘悦的技术博客认证作者
22
20H
更新时间2026-01-26
支持自启动
Qwen3-TTS-0.6B,推理速度1比0.5,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
Qwen3-TTS-0.6B,推理速度1比0.5,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
0/小时
语音合成Qwen3-TTS
Qwen3-TTS-语音克隆工作流合集
Qwen3-TTS-语音克隆工作流合集
4
@匹夫
匹夫认证作者
28
45H
更新时间2026-01-26
Qwen3-TTS-语音克隆工作流合集
Qwen3-TTS-语音克隆工作流合集
0/小时
语音合成Qwen3-TTS
Qwen3-TTS捏声音自定义声音tts语音克隆语音克隆声音flash_attn加速版Comfyui工作流版 构建by科哥
Qwen3-TTS捏声音自定义声音tts语音克隆语音克隆声音flash_attn加速版Comfyui工作流版 构建by科哥
7
@科哥AIGC
科哥AIGC认证作者
54
174H
更新时间2026-01-26
支持自启动
Qwen3-TTS捏声音自定义声音tts语音克隆语音克隆声音flash_attn加速版Comfyui工作流版 构建by科哥
Qwen3-TTS捏声音自定义声音tts语音克隆语音克隆声音flash_attn加速版Comfyui工作流版 构建by科哥
0/小时
语音合成Qwen3-TTS
Qwen3-TTS-1.7B,Flash-Attn加速,音色保存,接口API调用,支持超长文本,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
Qwen3-TTS-1.7B,Flash-Attn加速,音色保存,接口API调用,支持超长文本,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
5
@刘悦的技术博客
刘悦的技术博客认证作者
49
64H
更新时间2026-01-26
支持自启动
Qwen3-TTS-1.7B,Flash-Attn加速,音色保存,接口API调用,支持超长文本,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
Qwen3-TTS-1.7B,Flash-Attn加速,音色保存,接口API调用,支持超长文本,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS
0/小时
OCR识别
LightOnOCR-2高效的1B参数视觉语言模型用于OCR识别pdf转文本jpg转文本图片转文本 二次开发构建by科哥
LightOnOCR-2高效的1B参数视觉语言模型用于OCR识别pdf转文本jpg转文本图片转文本 二次开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
0
0H
更新时间2026-01-26
支持自启动
LightOnOCR-2高效的1B参数视觉语言模型用于OCR识别pdf转文本jpg转文本图片转文本 二次开发构建by科哥
LightOnOCR-2高效的1B参数视觉语言模型用于OCR识别pdf转文本jpg转文本图片转文本 二次开发构建by科哥
0/小时
Lora训练LTX
LTX2模型Lora训练AI-Toolkit
LTX2模型Lora训练AI-Toolkit
0
@梦影Erislia
6
57H
更新时间2026-01-24
LTX2模型Lora训练AI-Toolkit
LTX2模型Lora训练AI-Toolkit
0/小时
数字人
LiveTalking_GPT-SOVITS-V2_Ollama_洛曦AI数字人
LiveTalking_GPT-SOVITS-V2_Ollama_洛曦AI数字人
22
@Ikaros
30
59H
更新时间2026-01-23
LiveTalking + GPT-SOVITS V2 + Ollama + FunASR 洛曦AI定制版,实时语音对话数字人 + 直播版数字人
LiveTalking + GPT-SOVITS V2 + Ollama + FunASR 洛曦AI定制版,实时语音对话数字人 + 直播版数字人
0/小时
AI音乐
HeartMuLa,AI歌曲生成,开源版Suno
HeartMuLa,AI歌曲生成,开源版Suno
6
@刘悦的技术博客
刘悦的技术博客认证作者
11
8H
更新时间2026-01-23
支持自启动
HeartMuLa,AI歌曲生成,开源版Suno
HeartMuLa,AI歌曲生成,开源版Suno
0/小时
AI音乐
歌曲与音效生成
歌曲与音效生成
2
@老徐Ai研习社
老徐Ai研习社认证作者
13
5H
更新时间2026-01-22
支持自启动
HeartMula根据歌词生成音乐,根据画面生成音效
HeartMula根据歌词生成音乐,根据画面生成音效
0/小时
GLM文本模型
GLM-4.7-Flash
GLM-4.7-Flash
1
@苍耳阿猫
苍耳阿猫认证作者
9
7H
更新时间2026-01-22
GLM-4.7-Flash
GLM-4.7-Flash
0/小时
语音识别
微软开源VibeVoice ASR  TTS集合webui语音到文本 文本到语音模型 二次卡发构建by科哥
微软开源VibeVoice ASR TTS集合webui语音到文本 文本到语音模型 二次卡发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
5
0H
更新时间2026-01-22
支持自启动
微软开源VibeVoice ASR TTS集合webui语音到文本 文本到语音模型 二次卡发构建by科哥
微软开源VibeVoice ASR TTS集合webui语音到文本 文本到语音模型 二次卡发构建by科哥
0/小时
视频生成视频编辑
超强视频替换人物MoCha
超强视频替换人物MoCha
38
@与AI同行
与AI同行认证作者
269
366H
更新时间2026-01-30
支持自启动
最新视频替换人物,MoCha-Preview 整合包,支持视频替换人物,卡通动漫效果更佳,支持添加批量任务, 支持高清修复
最新视频替换人物,MoCha-Preview 整合包,支持视频替换人物,卡通动漫效果更佳,支持添加批量任务, 支持高清修复
0/小时
GLM文本模型
智普开源GLM-4.7-Flash GGUF推理服务编程文本大模型速度很快 webui开发构建by科哥
智普开源GLM-4.7-Flash GGUF推理服务编程文本大模型速度很快 webui开发构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
7
8H
更新时间2026-01-22
支持自启动
智普开源GLM-4.7-Flash GGUF推理服务编程文本大模型API+webui开发构建by科哥
智普开源GLM-4.7-Flash GGUF推理服务编程文本大模型API+webui开发构建by科哥
0/小时
LTXLora训练
AIToolkit Ltx-2 Lora Training,4090 24G / 48G / 5090 预设多挡位支持
AIToolkit Ltx-2 Lora Training,4090 24G / 48G / 5090 预设多挡位支持
1
@AI-KSK
AI-KSK认证作者
14
106H
更新时间2026-01-22
基于AI Toolkit,内置4090、48G及5090专属精调预设。告别复杂调参,只需加载对应JSON文件,即可解锁硬件最优性能,零门槛获得专家级训练方案。
基于AI Toolkit,内置4090、48G及5090专属精调预设。告别复杂调参,只需加载对应JSON文件,即可解锁硬件最优性能,零门槛获得专家级训练方案。
0/小时
语音合成
indextts2-IndexTTS2 最新 V23版本的全面升级情感控制更好 构建by科哥
indextts2-IndexTTS2 最新 V23版本的全面升级情感控制更好 构建by科哥
32
@科哥AIGC
科哥AIGC认证作者
581
1556H
更新时间2026-01-28
支持自启动
V23版本的全面升级情感控制更好
V23版本的全面升级情感控制更好
0/小时
语音合成
NovaSR一个开源的音频超分辨率模型低音质转高清音质声音修复模型 webui开发构建by科哥
NovaSR一个开源的音频超分辨率模型低音质转高清音质声音修复模型 webui开发构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
5
2H
更新时间2026-01-21
支持自启动
NovaSR一个开源的音频超分辨率模型低音质转高清音质声音修复模型 webui开发构建by科哥
NovaSR一个开源的音频超分辨率模型低音质转高清音质声音修复模型 webui开发构建by科哥
0/小时
行业模型
sinong南京农业大学开源面向通用农业领域的垂直8B32B全离线模型 webui开发构建by科哥
sinong南京农业大学开源面向通用农业领域的垂直8B32B全离线模型 webui开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
0
0H
更新时间2026-01-26
支持自启动
sinong南京农业大学开源面向通用农业领域的垂直8B32B全离线模型 webui开发构建by科哥
sinong南京农业大学开源面向通用农业领域的垂直8B32B全离线模型 webui开发构建by科哥
0/小时
生物信息行业模型
谷歌最新开源MedGemma医学AI助手 问诊问病例查看CT拍片x光拍片病理答疑问 webui开发构建by科哥
谷歌最新开源MedGemma医学AI助手 问诊问病例查看CT拍片x光拍片病理答疑问 webui开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
5
32H
更新时间2026-01-19
支持自启动
谷歌最新开源MedGemma医学AI助手 问诊问病例查看CT拍片x光拍片病理答疑问 webui开发构建by科哥
谷歌最新开源MedGemma医学AI助手 问诊问病例查看CT拍片x光拍片病理答疑问 webui开发构建by科哥
0/小时
图片生成GLM
GLM-Image
GLM-Image
1
@十字鱼
十字鱼认证作者
14
3H
更新时间2026-01-19
支持自启动
智谱开源图像生成和编辑模型
智谱开源图像生成和编辑模型
0/小时
视频超分
sora2视频二次高清工作流视频高清修复flashvsr工作流Comfyui工作流 构建by科哥
sora2视频二次高清工作流视频高清修复flashvsr工作流Comfyui工作流 构建by科哥
6
@科哥AIGC
科哥AIGC认证作者
40
19H
更新时间2026-01-19
支持自启动
sora2视频二次高清工作流视频高清修复flashvsr工作流Comfyui工作流 构建by科哥
sora2视频二次高清工作流视频高清修复flashvsr工作流Comfyui工作流 构建by科哥
0/小时
Qwen-Image图片编辑
超强AI图片编辑,QwenEdit-2511合集,单图/双图编辑, 超强人脸一致性,精准涂抹编辑、无色差/位移,一键生成24张姿势图、九宫格分镜
超强AI图片编辑,QwenEdit-2511合集,单图/双图编辑, 超强人脸一致性,精准涂抹编辑、无色差/位移,一键生成24张姿势图、九宫格分镜
46
@与AI同行
与AI同行认证作者
475
1209H
更新时间2026-01-26
支持自启动
超强AI图片编辑,QwenEdit-2511合集,单图/双图编辑, 超强人脸一致性,精准涂抹编辑、无色差/位移,一键生成24张姿势图、九宫格分镜
超强AI图片编辑,QwenEdit-2511合集,单图/双图编辑, 超强人脸一致性,精准涂抹编辑、无色差/位移,一键生成24张姿势图、九宫格分镜
0/小时
FluxComfyUI图片生成
FLUX2-Klein-黑森林开源最强编辑模型,秒级生图,效果可控!
FLUX2-Klein-黑森林开源最强编辑模型,秒级生图,效果可控!
6
@社恐的知识树
社恐的知识树认证作者
61
88H
更新时间2026-01-19
黑森林团队开源的FLUX2-Klein多功能模型,生成速度快,编辑能力强!
黑森林团队开源的FLUX2-Klein多功能模型,生成速度快,编辑能力强!
0/小时
行业模型
谷歌最新翻译模型TranslateGemma支持全世界50多种语言的翻译文本多语言翻译 二次webui开发 构建by科哥
谷歌最新翻译模型TranslateGemma支持全世界50多种语言的翻译文本多语言翻译 二次webui开发 构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
1
0H
更新时间2026-01-16
支持自启动
谷歌最新翻译模型TranslateGemma支持全世界50多种语言的翻译文本多语言翻译 二次webui开发 构建by科哥
谷歌最新翻译模型TranslateGemma支持全世界50多种语言的翻译文本多语言翻译 二次webui开发 构建by科哥
0/小时
图片生成AI电商
BananaMall一个 AI 驱动的电商详情页生成的ai工具结合谷歌nano banana谷歌香蕉模型 开发构建by科哥
BananaMall一个 AI 驱动的电商详情页生成的ai工具结合谷歌nano banana谷歌香蕉模型 开发构建by科哥
5
@科哥AIGC
科哥AIGC认证作者
17
42H
更新时间2026-01-16
支持自启动
BananaMall一个 AI 驱动的电商详情页生成的ai工具结合谷歌nano banana谷歌香蕉模型 开发构建by科哥
BananaMall一个 AI 驱动的电商详情页生成的ai工具结合谷歌nano banana谷歌香蕉模型 开发构建by科哥
0/小时
Z-Image图片生成
全能图片编辑王flux2_klein|Qwen_Image_Edit2511|Z-image-turbo
全能图片编辑王flux2_klein|Qwen_Image_Edit2511|Z-image-turbo
7
@老徐Ai研习社
老徐Ai研习社认证作者
90
331H
更新时间2026-01-21
支持自启动
全能图片生成与编辑
全能图片生成与编辑
0/小时
目标检测
YOLO26
YOLO26
2
@苍耳阿猫
苍耳阿猫认证作者
8
97H
更新时间2026-01-16
YOLO26
YOLO26
0/小时
具身智能
Alpamayo
Alpamayo
1
@苍耳阿猫
苍耳阿猫认证作者
5
5H
更新时间2026-01-20
Alpamayo 1 是一个预训练推理模型,旨在加速自动驾驶(AV)领域的研发。
Alpamayo 1 是一个预训练推理模型,旨在加速自动驾驶(AV)领域的研发。
0/小时
AI音乐
NotaGen基于 LLM 范式的高音乐性古典符号化音乐生成模型 二次开发构建by科哥
NotaGen基于 LLM 范式的高音乐性古典符号化音乐生成模型 二次开发构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
8
11H
更新时间2026-01-22
支持自启动
NotaGen基于 LLM 范式的高音乐性古典符号化音乐生成模型 二次开发构建by科哥
NotaGen基于 LLM 范式的高音乐性古典符号化音乐生成模型 二次开发构建by科哥
0/小时
Wan图片生成视频生成
闪电AI视频、图片生成镜像
闪电AI视频、图片生成镜像
6
@cola
34
45H
更新时间2026-01-16
支持自启动
基于lightx2v框架加速的视频、图片生成服务,快速生成视频图片,基于模型wan2.2、qwen-image、z-image
基于lightx2v框架加速的视频、图片生成服务,快速生成视频图片,基于模型wan2.2、qwen-image、z-image
0.1/小时
Wan视频生成ComfyUI
DaSiWa & Remix:Wan 2.2 双神N版
DaSiWa & Remix:Wan 2.2 双神N版
21
@AI-KSK
AI-KSK认证作者
175
304H
更新时间2026-01-16
本镜像高度集成 Wan 2.2 视频生成环境,预装社区领先四套核心工作流,融合 DaSiWa 高保真与 Remix 逻辑优化,提供一站式 T2V 文生视频与 I2V 图生视频解决方案。
本镜像高度集成 Wan 2.2 视频生成环境,预装社区领先四套核心工作流,融合 DaSiWa 高保真与 Remix 逻辑优化,提供一站式 T2V 文生视频与 I2V 图生视频解决方案。
0/小时
LTX视频生成
LTX-2 Audio-Video:开源首个 · 音画同步生成
LTX-2 Audio-Video:开源首个 · 音画同步生成
11
@AI-KSK
AI-KSK认证作者
113
302H
更新时间2026-01-21
双官方流程全覆盖:同时支持 ComfyUI 官方 LTX 工作流示例 + Lightricks 官方 ComfyUI-LTXVideo 自定义节点与全部示例工作流
双官方流程全覆盖:同时支持 ComfyUI 官方 LTX 工作流示例 + Lightricks 官方 ComfyUI-LTXVideo 自定义节点与全部示例工作流
0/小时
语音合成AI应用
voice pro给视频做多语言配音翻译克隆特定视频声音 直译视频声音本地化 汉化构建by科哥
voice pro给视频做多语言配音翻译克隆特定视频声音 直译视频声音本地化 汉化构建by科哥
4
@科哥AIGC
科哥AIGC认证作者
19
10H
更新时间2026-01-20
支持自启动
voice pro给视频做多语言配音翻译克隆特定视频声音 直译视频声音本地化 汉化构建by科哥
voice pro给视频做多语言配音翻译克隆特定视频声音 直译视频声音本地化 汉化构建by科哥
0/小时
LTXLora训练
LTX2官方训练器Lora训练
LTX2官方训练器Lora训练
1
@梦影Erislia
23
102H
更新时间2026-01-21
LTX2官方训练器的lora训练支持,内置模型t2v,小白可以一键运行,也可以根据官方文档进行进阶操作
LTX2官方训练器的lora训练支持,内置模型t2v,小白可以一键运行,也可以根据官方文档进行进阶操作
0/小时
LTX视频生成
ltx-2全能lora运镜comfyui工作流文生视频图生视频一键运行 构建by科哥
ltx-2全能lora运镜comfyui工作流文生视频图生视频一键运行 构建by科哥
4
@科哥AIGC
科哥AIGC认证作者
26
17H
更新时间2026-01-21
支持自启动
ltx-2全能lora运镜comfyui工作流文生视频图生视频一键运行 构建by科哥
ltx-2全能lora运镜comfyui工作流文生视频图生视频一键运行 构建by科哥
0/小时
Qwen-Image
Tongbi-支持Qwen-Image和Qwen-Image-Edit
Tongbi-支持Qwen-Image和Qwen-Image-Edit
43
@十字鱼
十字鱼认证作者
221
6079H
更新时间2026-02-02
支持自启动
阿里通义千问开源最强图像模型,强大的文字渲染能力,强大的图像编辑能力
阿里通义千问开源最强图像模型,强大的文字渲染能力,强大的图像编辑能力
0/小时
视频生成Wan
TurboDiffusion清华大学等推出的视频生成加速框架 webUI二次修改构建by科哥
TurboDiffusion清华大学等推出的视频生成加速框架 webUI二次修改构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
33
35H
更新时间2026-01-27
支持自启动
实现将ai视频生成速度提升百倍!基于wan2.1,wan2.2
实现将ai视频生成速度提升百倍!基于wan2.1,wan2.2
0/小时
其他
nano banana谷歌香蕉在线绘画在线改图修改图片模型香蕉模型
nano banana谷歌香蕉在线绘画在线改图修改图片模型香蕉模型
3
@科哥AIGC
科哥AIGC认证作者
38
12H
更新时间2026-01-10
支持自启动
nano banana谷歌香蕉在线绘画在线改图修改图片模型香蕉模型
nano banana谷歌香蕉在线绘画在线改图修改图片模型香蕉模型
0/小时
IndexTTS语音合成
【音谷官方】indextts2-api
【音谷官方】indextts2-api
35
@音谷官方
571
2686H
更新时间2026-01-21
支持自启动
【音谷官方】音谷对应的API
【音谷官方】音谷对应的API
0.01/小时
LTX视频生成
LTX-2 WebUI版
LTX-2 WebUI版
4
@鹄仙
鹄仙认证作者
33
34H
更新时间2026-01-10
基于wangp的LTX-2,WebUI版
基于wangp的LTX-2,WebUI版
0/小时
LTX视频生成
开源版Veo3!LTX2-视频生成合集,文生视频、图生视频、视频人物配音+口型同步、直出1080P,高清细节放大、提示词增强、支持线条+深度+姿势控制!
开源版Veo3!LTX2-视频生成合集,文生视频、图生视频、视频人物配音+口型同步、直出1080P,高清细节放大、提示词增强、支持线条+深度+姿势控制!
38
@与AI同行
与AI同行认证作者
198
127H
更新时间2026-01-21
支持自启动
开源版Veo3!LTX2-视频生成合集,文生视频、图生视频、视频人物配音+口型同步、直出1080P,高清细节放大、提示词增强、支持线条+深度+姿势控制!
开源版Veo3!LTX2-视频生成合集,文生视频、图生视频、视频人物配音+口型同步、直出1080P,高清细节放大、提示词增强、支持线条+深度+姿势控制!
0/小时
LTXComfyUI数字人
 LTX-2:首个开源音画同步生成模型,提示词遵从比肩Sora,理解分镜脚本,一键AI成片!
LTX-2:首个开源音画同步生成模型,提示词遵从比肩Sora,理解分镜脚本,一键AI成片!
6
@社恐的知识树
社恐的知识树认证作者
30
28H
更新时间2026-01-22
LTX-2 是由 Lightricks 开源的 DiT 架构音频-视频基础模型,核心特点是:在同一个模型里同步生成视频与音频,超强提示词理解,支持多镜头脚本,关键词自动匹配视频风格,一键AI成片!
LTX-2 是由 Lightricks 开源的 DiT 架构音频-视频基础模型,核心特点是:在同一个模型里同步生成视频与音频,超强提示词理解,支持多镜头脚本,关键词自动匹配视频风格,一键AI成片!
0/小时
语音合成
Voice Sculptor捏声音基于LLaSA和CosyVoice2的指令化语音合成语音模型 二次开发构建by科哥
Voice Sculptor捏声音基于LLaSA和CosyVoice2的指令化语音合成语音模型 二次开发构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
12
4H
更新时间2026-01-22
支持自启动
Voice Sculptor捏声音基于LLaSA和CosyVoice2的指令化语音合成语音模型 二次开发构建by科哥
Voice Sculptor捏声音基于LLaSA和CosyVoice2的指令化语音合成语音模型 二次开发构建by科哥
0/小时
Qwen-Image图片生成ComfyUI
LTX-2.0音画同步视频生成|Z-Image-Turbo&Qwen-Image-Edit1图片编辑
LTX-2.0音画同步视频生成|Z-Image-Turbo&Qwen-Image-Edit1图片编辑
10
@老徐Ai研习社
老徐Ai研习社认证作者
50
62H
更新时间2026-02-05
支持自启动
LTX-2.0音画同步视频生成
LTX-2.0音画同步视频生成
0/小时
ComfyUIWan
Comfy二次元跑图生视频DaSiWa和vace跳舞
Comfy二次元跑图生视频DaSiWa和vace跳舞
14
@梦影Erislia
111
226H
更新时间2026-01-22
Comfy二次元跑图生视频DaSiWa和vace跳舞
Comfy二次元跑图生视频DaSiWa和vace跳舞
0/小时
语音识别
SenseVoice多语言语音识别情感识别系统  二次开发构建by科哥
SenseVoice多语言语音识别情感识别系统 二次开发构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
6
1H
更新时间2026-01-22
支持自启动
SenseVoice多语言语音识别情感识别系统 二次开发构建by科哥
SenseVoice多语言语音识别情感识别系统 二次开发构建by科哥
0/小时
语音识别
FunASR中文语音识别音频转文本声音转文本系统 二次webui开发构建by科哥
FunASR中文语音识别音频转文本声音转文本系统 二次webui开发构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
12
6H
更新时间2026-01-23
支持自启动
音频声音识别系统
音频声音识别系统
0/小时
语音分离
SAM Audio一个Meta开源的音频分割模型声音分离音频音乐分离应用 二次开发构建by科哥
SAM Audio一个Meta开源的音频分割模型声音分离音频音乐分离应用 二次开发构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
24
27H
更新时间2026-01-28
支持自启动
可从复杂的音频混合中分离出特定的声音
可从复杂的音频混合中分离出特定的声音
0/小时
图片编辑
UNet Universal Matting基于UNet模型抠图批量抠图 webUI一键抠图 构建by科哥
UNet Universal Matting基于UNet模型抠图批量抠图 webUI一键抠图 构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
6
27H
更新时间2026-01-23
支持自启动
基于UNet模型抠图批量抠图 webUI一键抠图 构建by科哥
基于UNet模型抠图批量抠图 webUI一键抠图 构建by科哥
0/小时
ComfyUI
ComfyUI_最新26年01月-Niugee-牛哥整合包-V2
ComfyUI_最新26年01月-Niugee-牛哥整合包-V2
13
@NiuGee
NiuGee认证作者
159
351H
更新时间2026-01-08
整合26年最新版本ComfyUI,已下载好常用图像模型,修改端口到7860方便管理界面一键启动
整合26年最新版本ComfyUI,已下载好常用图像模型,修改端口到7860方便管理界面一键启动
0/小时
Wan视频生成
最强AI生成长视频,Wan2.2-SVI2Pro整合包!一次性生成一分钟视频,一次性生成30s分镜视频!
最强AI生成长视频,Wan2.2-SVI2Pro整合包!一次性生成一分钟视频,一次性生成30s分镜视频!
24
@与AI同行
与AI同行认证作者
199
530H
更新时间2026-01-23
支持自启动
最强AI生成长视频,Wan2.2-SVI2Pro整合包!一次性生成一分钟视频,一次性生成30s分镜视频!
最强AI生成长视频,Wan2.2-SVI2Pro整合包!一次性生成一分钟视频,一次性生成30s分镜视频!
0/小时
ComfyUI
ComfyUI云端整合包2601
ComfyUI云端整合包2601
6
@鹄仙
鹄仙认证作者
58
237H
更新时间2026-01-23
长视频系列升级 不仅仅是SVI2 pro 长视频、LongCat数字人
长视频系列升级 不仅仅是SVI2 pro 长视频、LongCat数字人
0/小时
Qwen-ImageLora训练图片生成
Qwen 2512的Lora训练,内置模型,一键训练AI-Toolkit
Qwen 2512的Lora训练,内置模型,一键训练AI-Toolkit
6
@梦影Erislia
60
264H
更新时间2026-01-23
Qwen 2512的Lora训练,内置模型,一键训练AI-Toolkit
Qwen 2512的Lora训练,内置模型,一键训练AI-Toolkit
0/小时
AI应用
banana-slides基于谷歌人工智能ai制作幻灯片ai制作ppt制作幻灯片 构建by科哥
banana-slides基于谷歌人工智能ai制作幻灯片ai制作ppt制作幻灯片 构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
10
1H
更新时间2026-01-23
支持自启动
banana-slides基于谷歌人工智能ai制作幻灯片ai制作ppt制作幻灯片 构建by科哥
banana-slides基于谷歌人工智能ai制作幻灯片ai制作ppt制作幻灯片 构建by科哥
0/小时
Qwen-Image图片生成ComfyUI
Qwen-Image-2512模型_QwenVL3反推_SeedVR2放大多合一
Qwen-Image-2512模型_QwenVL3反推_SeedVR2放大多合一
5
@社恐的知识树
社恐的知识树认证作者
56
124H
更新时间2026-01-03
集成千问图像2512模型+QwenVL3图像视频反推API+最强放大SeedVR2多合一工作流,Comfyui-v0.7.0
集成千问图像2512模型+QwenVL3图像视频反推API+最强放大SeedVR2多合一工作流,Comfyui-v0.7.0
0/小时
AI电商
magic-tryon图片视频虚拟试装换装模特换衣 二次webui开发构建by科哥
magic-tryon图片视频虚拟试装换装模特换衣 二次webui开发构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
12
2H
更新时间2026-01-26
支持自启动
magic-tryon图片视频虚拟试装换装模特换衣
magic-tryon图片视频虚拟试装换装模特换衣
0/小时
AI应用
图文创作神器一句话一张图片生成小红书图文 构建by科哥
图文创作神器一句话一张图片生成小红书图文 构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
3
0H
更新时间2026-01-26
支持自启动
图文创作神器一句话一张图片生成小红书图文
图文创作神器一句话一张图片生成小红书图文
0/小时
Qwen-Image图片生成
阿里千问开源Qwen-Image-2512图像生成模型 二次开发构建by科哥
阿里千问开源Qwen-Image-2512图像生成模型 二次开发构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
8
6H
更新时间2026-01-26
支持自启动
需要80gb显存运行该项目
需要80gb显存运行该项目
0/小时
物理模拟分子动力
gromacs_deepmd机器学习训练水分子力场
gromacs_deepmd机器学习训练水分子力场
0
@tty
7
116H
更新时间2026-01-26
内含deepmd机器学习力场训练水分子,gromacs调用运行例子
内含deepmd机器学习力场训练水分子,gromacs调用运行例子
0/小时
物理模拟分子动力
deepmd_lammps训练和运行镜像
deepmd_lammps训练和运行镜像
0
@tty
10
27H
更新时间2026-01-26
内含ch4简单例子,也可用来训练自己的模型,3080ti版本
内含ch4简单例子,也可用来训练自己的模型,3080ti版本
0/小时
混元
HY-Motion1.0腾讯混元开源的文本到3D动作生成模型 汉化构建by科哥
HY-Motion1.0腾讯混元开源的文本到3D动作生成模型 汉化构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
4
19H
更新时间2026-01-26
HY-Motion1.0腾讯混元开源的文本到3D动作生成模型 汉化构建by科哥
HY-Motion1.0腾讯混元开源的文本到3D动作生成模型 汉化构建by科哥
0/小时
Wan视频编辑
wan2.1-scail动作迁移
wan2.1-scail动作迁移
13
@匹夫
匹夫认证作者
106
156H
更新时间2026-01-26
wan2.1-scail动作迁移
wan2.1-scail动作迁移
0/小时
Qwen-Image图片生成
Qwen‑Image‑Edit‑2511-LoRA训练 x AI Toolkit
Qwen‑Image‑Edit‑2511-LoRA训练 x AI Toolkit
5
@AI-KSK
AI-KSK认证作者
73
609H
更新时间2026-01-01
这是一个集成了 Qwen-Image-Edit-2511模型与 AI Toolkit 训练框架的预配置环境,旨在支持用户高效微调出具备精准图像编辑、风格迁移及多主体一致性能力的定制化 LoRA 模型。
这是一个集成了 Qwen-Image-Edit-2511模型与 AI Toolkit 训练框架的预配置环境,旨在支持用户高效微调出具备精准图像编辑、风格迁移及多主体一致性能力的定制化 LoRA 模型。
0/小时
语音合成
 ChatterBox多语言语音合成语言克隆声音克隆 webui二次开发构建by科哥
ChatterBox多语言语音合成语言克隆声音克隆 webui二次开发构建by科哥
3
@科哥AIGC
科哥AIGC认证作者
25
10H
更新时间2026-01-26
支持自启动
支持23个国家的语言声音克隆
支持23个国家的语言声音克隆
0/小时
数字人
LatentSync 1.6 纯净版
LatentSync 1.6 纯净版
3
@knzskl
9
5H
更新时间2026-01-26
字节跳动、北京交通大学联合推出的端到端唇形同步框架。Latent Sync利用稳定扩散和TREPA的力量,为动态和逼真的视频生成提供精确的高分辨率唇形同步。
字节跳动、北京交通大学联合推出的端到端唇形同步框架。Latent Sync利用稳定扩散和TREPA的力量,为动态和逼真的视频生成提供精确的高分辨率唇形同步。
0/小时
SDLora训练
SDXL及系列衍生模型训练,内置WD打标编辑,任意C站模型导入,小白也能轻松上手,AI-Toolkit
SDXL及系列衍生模型训练,内置WD打标编辑,任意C站模型导入,小白也能轻松上手,AI-Toolkit
23
@梦影Erislia
347
1923H
更新时间2025-12-30
SDXL及系列衍生模型训练,内置WD打标编辑,任意C站模型导入,小白也能轻松上手,AI-Toolkit
SDXL及系列衍生模型训练,内置WD打标编辑,任意C站模型导入,小白也能轻松上手,AI-Toolkit
0/小时
视频生成图片生成ComfyUI
启梦光影高质量出图二合一
启梦光影高质量出图二合一
0
@麦子AI
24
59H
更新时间2026-01-28
支持自启动
高质量文生图、图生视频。只适配40系显卡
高质量文生图、图生视频。只适配40系显卡
0.15/小时
Wan视频编辑
StoryMem基于wan2.2逐镜脚本生成高连贯电影级1分钟多镜头叙事视频 二次开发构建by科哥
StoryMem基于wan2.2逐镜脚本生成高连贯电影级1分钟多镜头叙事视频 二次开发构建by科哥
5
@科哥AIGC
科哥AIGC认证作者
24
12H
更新时间2026-01-27
支持自启动
StoryMem基于wan2.2逐镜脚本生成高连贯电影级1分钟多镜头叙事视频 二次开发构建by科哥
StoryMem基于wan2.2逐镜脚本生成高连贯电影级1分钟多镜头叙事视频 二次开发构建by科哥
0/小时
ComfyUI
ComfyUI学习版_torch_2.8.0
ComfyUI学习版_torch_2.8.0
5
@Lucas老师
38
72H
更新时间2025-12-28
支持自启动
此版本镜像,5090、4090、3090、3080Ti等系列显卡可用,P40显卡不可用
此版本镜像,5090、4090、3090、3080Ti等系列显卡可用,P40显卡不可用
0/小时
ComfyUI
ComfyUI学习版镜像_torch-2.7.1
ComfyUI学习版镜像_torch-2.7.1
6
@Lucas老师
20
69H
更新时间2025-12-28
支持自启动
ComfyUI学习版镜像_torch-2.7.1,高性价比镜像,可开P40显卡,5090显卡勿用,会报错
ComfyUI学习版镜像_torch-2.7.1,高性价比镜像,可开P40显卡,5090显卡勿用,会报错
0/小时
Qwen-Image
qwen-image工作流合集edit2511-z-image-turbo
qwen-image工作流合集edit2511-z-image-turbo
8
@匹夫
匹夫认证作者
68
147H
更新时间2026-01-27
qwen-image工作流合集
qwen-image工作流合集
0/小时
语音合成
VoxCPM1.5面壁智能开源的端到端语音合成模型附训练lora训练器 构建by科哥
VoxCPM1.5面壁智能开源的端到端语音合成模型附训练lora训练器 构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
15
5H
更新时间2026-01-27
支持自启动
语音合成模型+训练lora训练器
语音合成模型+训练lora训练器
0/小时
Qwen-ImageLora训练图片生成
Qwen-2511和Z图像的Lora训练AI-TOOLKIT
Qwen-2511和Z图像的Lora训练AI-TOOLKIT
4
@梦影Erislia
26
137H
更新时间2026-01-27
Qwen-2511和Z图像的Lora训练AI-TOOLKIT
Qwen-2511和Z图像的Lora训练AI-TOOLKIT
0/小时
Wan视频生成
Egox任意视频一键转第一人称视角视频基于wan2.1模型 webui二次开发构建by科哥
Egox任意视频一键转第一人称视角视频基于wan2.1模型 webui二次开发构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
7
8H
更新时间2026-01-27
支持自启动
将任意视频一键转第一人称视角视频
将任意视频一键转第一人称视角视频
0/小时
视频生成图片生成ComfyUI
启梦光影VIP快速出图二合一
启梦光影VIP快速出图二合一
0
@麦子AI
6
155H
更新时间2026-01-27
支持自启动
2s出图,超级快。注意!本镜像需要部署在50系列显卡上。
2s出图,超级快。注意!本镜像需要部署在50系列显卡上。
0.15/小时
数字人
One-to-All-Animation单图片转换动画视频数字人视频动作模仿器 构建by科哥
One-to-All-Animation单图片转换动画视频数字人视频动作模仿器 构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
6
4H
更新时间2026-01-27
支持自启动
单图片转换动画视频数字人视频动作模仿器
单图片转换动画视频数字人视频动作模仿器
0/小时
数字人
personaLive实时数字人系统
personaLive实时数字人系统
6
@有趣的80后程序员
有趣的80后程序员认证作者
41
56H
更新时间2025-12-27
支持自启动
实时数字人系统,直播室直接生成分身,低延迟
实时数字人系统,直播室直接生成分身,低延迟
0/小时
Qwen-Image图片生成
Qwen-Image-Edit-2511阿里通义推出的全能图像编辑模型 webui二次修改构建by科哥
Qwen-Image-Edit-2511阿里通义推出的全能图像编辑模型 webui二次修改构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
35
4H
更新时间2026-01-27
支持自启动
图片编辑模型 一致性更加好 中文支持更好
图片编辑模型 一致性更加好 中文支持更好
0/小时
AI应用
DocCaptioner 打标器
DocCaptioner 打标器
6
@Doc_workBox
Doc_workBox认证作者
43
66H
更新时间2025-12-26
支持自启动
Doc的打标器,支持 Qwen3vl及 API 调用
Doc的打标器,支持 Qwen3vl及 API 调用
0.1/小时
语音合成
超强AI音色克隆,VoxCPM-V1.5,支持超长文本生成、批量生成,支持音色保存、多音字修改、语速调节,速度超快!
超强AI音色克隆,VoxCPM-V1.5,支持超长文本生成、批量生成,支持音色保存、多音字修改、语速调节,速度超快!
16
@与AI同行
与AI同行认证作者
152
110H
更新时间2026-01-27
支持自启动
超强AI音色克隆,VoxCPM-V1.5,支持超长文本生成、批量生成,支持音色保存、多音字修改、语速调节,速度超快!
超强AI音色克隆,VoxCPM-V1.5,支持超长文本生成、批量生成,支持音色保存、多音字修改、语速调节,速度超快!
0/小时
语音合成语音克隆
SVC-Fusion
SVC-Fusion
67
@aiguoliuguo
aiguoliuguo认证作者
3702
22209H
更新时间2026-02-11
本整合包将整合So-Vits-SVC4.1、DDSP-SVC-6.3/6.1/6.0、ReFlow-VAE-SVC多种SVC模型训练及推理
本整合包将整合So-Vits-SVC4.1、DDSP-SVC-6.3/6.1/6.0、ReFlow-VAE-SVC多种SVC模型训练及推理
0/小时
语音合成SVC
SVC-WebUI
SVC-WebUI
40
@乔大峰
乔大峰认证作者
900
10310H
更新时间2025-12-26
一键训练SVC模型,支持上传压缩干声文件,训练完成发送提醒,一键清空训练环境,追求的就是高效率
一键训练SVC模型,支持上传压缩干声文件,训练完成发送提醒,一键清空训练环境,追求的就是高效率
0/小时
ComfyUIWanQwen-Image
2025.12全新模型ComfyUI整合包
2025.12全新模型ComfyUI整合包
13
@老徐Ai研习社
老徐Ai研习社认证作者
108
448H
更新时间2025-12-26
支持自启动
ComfyUI2025.12整合包
ComfyUI2025.12整合包
0/小时
ComfyUI
ComfyUI云端整合包2512
ComfyUI云端整合包2512
13
@鹄仙
鹄仙认证作者
62
1395H
更新时间2026-01-27
ComfyUI云端整合包2512 支持Z-Image 混元1.5,新增到63个插件,带文件管理系统
ComfyUI云端整合包2512 支持Z-Image 混元1.5,新增到63个插件,带文件管理系统
0/小时
Qwen-Image视频编辑
千问2511与动作迁移三剑客
千问2511与动作迁移三剑客
2
@鹄仙
鹄仙认证作者
14
27H
更新时间2025-12-27
一个基于Wan2GP的图像编辑与动作迁移视频生成的WebUI项目
一个基于Wan2GP的图像编辑与动作迁移视频生成的WebUI项目
0/小时
Wan视频生成ComfyUI
TurboDiffusion 100–200×加速ComfyUI-Wan图到视频生成
TurboDiffusion 100–200×加速ComfyUI-Wan图到视频生成
11
@AI-KSK
AI-KSK认证作者
115
294H
更新时间2025-12-25
这是一个超快的AI视频生成工具,1分钟就能把图片变成短视频,速度是普通AI的200倍。
这是一个超快的AI视频生成工具,1分钟就能把图片变成短视频,速度是普通AI的200倍。
0/小时
物理模拟分子动力
Gromacs系列
Gromacs系列
10
@苍耳阿猫
苍耳阿猫认证作者
234
6295H
更新时间2026-02-04
该镜像集成开源高性能分子动力学模拟软件,通过强化多精度算法与GPU并行加速(支持NVIDIA/AMD显卡)实现纳秒级生物大分子运动模拟,优化AI辅助建模与超大体系计算效率,提供跨平台开箱即用解决方案
该镜像集成开源高性能分子动力学模拟软件,通过强化多精度算法与GPU并行加速(支持NVIDIA/AMD显卡)实现纳秒级生物大分子运动模拟,优化AI辅助建模与超大体系计算效率,提供跨平台开箱即用解决方案
0/小时
语音合成
VoxCPM1.5雨落版整合包
VoxCPM1.5雨落版整合包
5
@雨落实战
雨落实战认证作者
57
106H
更新时间2025-12-24
支持自启动
VoxCPM1.5的雨落版整合包
VoxCPM1.5的雨落版整合包
0/小时
AI应用图片生成
PromptFill专为AI绘画设计的开源结构化提示词生成工具 构建by科哥
PromptFill专为AI绘画设计的开源结构化提示词生成工具 构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
4
0H
更新时间2026-01-27
支持自启动
专为AI绘画设计的开源结构化提示词生成工具
专为AI绘画设计的开源结构化提示词生成工具
0/小时
LongCat数字人
最强长视频数字人:LongCat-Avatar尝鲜版,其他热门生图、视频也都备好了!
最强长视频数字人:LongCat-Avatar尝鲜版,其他热门生图、视频也都备好了!
10
@老许爱吃肉丶
34
133H
更新时间2026-01-27
支持自启动
最强长视频数字人:LongCat-Avatar尝鲜版,其他热门生图、视频也都备好了!
最强长视频数字人:LongCat-Avatar尝鲜版,其他热门生图、视频也都备好了!
0.2/小时
LongCat数字人
SOTA级音频驱动数字人-LongCat-Video-Avatar
SOTA级音频驱动数字人-LongCat-Video-Avatar
8
@AI-KSK
AI-KSK认证作者
46
49H
更新时间2026-01-27
实现身份永续、动作自然的数字人生成
实现身份永续、动作自然的数字人生成
0/小时
LongCat数字人
AI数字人LongCatAvatar,超强口型+表情+姿势效果,支持长视频!
AI数字人LongCatAvatar,超强口型+表情+姿势效果,支持长视频!
42
@与AI同行
与AI同行认证作者
282
234H
更新时间2026-01-04
支持自启动
AI数字人LongCatAvatar,超强口型+表情+姿势效果,支持长视频!
AI数字人LongCatAvatar,超强口型+表情+姿势效果,支持长视频!
0/小时
3D生成
SHARP–苹果开源的3D场景生成AI模型图片转3d模型 二次开发构建by科哥
SHARP–苹果开源的3D场景生成AI模型图片转3d模型 二次开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
11
508H
更新时间2026-01-27
支持自启动
SHARP–苹果开源的3D场景生成AI模型图片转3d模型
SHARP–苹果开源的3D场景生成AI模型图片转3d模型
0/小时
GLM语音识别
GLM-ASR智谱开源的语音识别、语音转文本模型  二次开发构建By科哥
GLM-ASR智谱开源的语音识别、语音转文本模型 二次开发构建By科哥
0
@科哥AIGC
科哥AIGC认证作者
1
0H
更新时间2026-01-27
支持自启动
智谱开源的语音识别语音转文本声音转文本模型
智谱开源的语音识别语音转文本声音转文本模型
0/小时
分子动力生物信息
Rosetta
Rosetta
1
@苍耳阿猫
苍耳阿猫认证作者
2
1H
更新时间2025-12-23
Rosetta
Rosetta
0/小时
AI应用视频生成
Pixelle-Video|一句话生成短视频
Pixelle-Video|一句话生成短视频
3
@科哥AIGC
科哥AIGC认证作者
11
4H
更新时间2026-02-03
支持自启动
零门槛,零剪辑经验,让视频创作成为一句话的事
零门槛,零剪辑经验,让视频创作成为一句话的事
0/小时
其他
ai小说ai在线写作系统ai智能写作系统 构建by科哥
ai小说ai在线写作系统ai智能写作系统 构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
13
36H
更新时间2026-01-28
支持自启动
ai小说ai在线写作系统ai智能写作系统
ai小说ai在线写作系统ai智能写作系统
0/小时
Lora训练
ai-toolkit炼丹炉,支持多种常见模型训练,内置多种模型
ai-toolkit炼丹炉,支持多种常见模型训练,内置多种模型
3
@MumuOpenK
50
340H
更新时间2026-01-29
支持自启动
ai-toolkit炼丹炉(汉化版)
ai-toolkit炼丹炉(汉化版)
0.1/小时
语音合成GLM
智谱开源的AI文本转语音模型支持声音克隆GLM-TTS 语音合成系统 二次开发构建by科哥
智谱开源的AI文本转语音模型支持声音克隆GLM-TTS 语音合成系统 二次开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
25
13H
更新时间2026-01-27
支持自启动
智谱开源的AI文本转语音模型支持声音克隆GLM-TTS 语音合成系统 二次开发构建by科哥
智谱开源的AI文本转语音模型支持声音克隆GLM-TTS 语音合成系统 二次开发构建by科哥
0/小时
ComfyUIQwen-Image图片生成
Twinflow双流加速千问生图1秒1张
Twinflow双流加速千问生图1秒1张
5
@smthem
17
14H
更新时间2025-12-20
支持自启动
最快千问生图方法,顶配1秒1张
最快千问生图方法,顶配1秒1张
0/小时
AI应用
next-ai-draw-io
next-ai-draw-io
0
@苍耳阿猫
苍耳阿猫认证作者
0
0H
更新时间2025-12-19
next-ai-draw-io
next-ai-draw-io
0/小时
3D生成ComfyUI
Trellis2代一键图片生成3D模型
Trellis2代一键图片生成3D模型
7
@smthem
108
186H
更新时间2025-12-19
支持自启动
一键图片生成3D模型,输出glb和obj格式,带贴图和法线,自动脱底
一键图片生成3D模型,输出glb和obj格式,带贴图和法线,自动脱底
0/小时
Wan视频生成ComfyUI
TurboDiffusion-ultra-fast-wan
TurboDiffusion-ultra-fast-wan
6
@有趣的80后程序员
有趣的80后程序员认证作者
63
103H
更新时间2025-12-18
让阿里wan模型的视频生成速度提升200倍
让阿里wan模型的视频生成速度提升200倍
0/小时
语音合成
cosyvoce3阿里最新开源声音克隆应用普通话粤语英语日语方言更加精准情感丰富 二次开发构建By科哥
cosyvoce3阿里最新开源声音克隆应用普通话粤语英语日语方言更加精准情感丰富 二次开发构建By科哥
4
@科哥AIGC
科哥AIGC认证作者
41
57H
更新时间2026-01-28
支持自启动
cosyvoce3阿里最新开源声音克隆应用普通话粤语英语日语方言更加精准情感丰富 二次开发构建By科哥
cosyvoce3阿里最新开源声音克隆应用普通话粤语英语日语方言更加精准情感丰富 二次开发构建By科哥
0/小时
分子动力
cp2k
cp2k
0
@苍耳阿猫
苍耳阿猫认证作者
2
14H
更新时间2025-12-18
cp2k-v2025.2
cp2k-v2025.2
0/小时
语音合成
CosyVoice3,多音字控制,音色保存,接口API调用,流式接口,音频降噪
CosyVoice3,多音字控制,音色保存,接口API调用,流式接口,音频降噪
7
@刘悦的技术博客
刘悦的技术博客认证作者
169
2991H
更新时间2026-01-28
支持自启动
CosyVoice3,多音字控制,音色保存,接口API调用,流式接口,音频降噪
CosyVoice3,多音字控制,音色保存,接口API调用,流式接口,音频降噪
0/小时
ComfyUIAI电商
电商换装到视频-全流程
电商换装到视频-全流程
6
@积木comfyui
42
47H
更新时间2026-01-28
支持自启动
换装-换模特-换姿势-换背景-打光-放大-模特图生视频-全流程
换装-换模特-换姿势-换背景-打光-放大-模特图生视频-全流程
0/小时
文本模型
Nemotron3
Nemotron3
0
@敢敢のwings
敢敢のwings认证作者
0
0H
更新时间2025-12-18
Nemotron 3系列是NVIDIA推出的开放模型家族,包含开放权重、训练数据和训练配方,旨在为构建专业化AI智能体提供领先的效率和准确性。
Nemotron 3系列是NVIDIA推出的开放模型家族,包含开放权重、训练数据和训练配方,旨在为构建专业化AI智能体提供领先的效率和准确性。
0/小时
分子动力
DeePMD-kit
DeePMD-kit
0
@苍耳阿猫
苍耳阿猫认证作者
3
3H
更新时间2025-12-16
DeePMD-kit-v3.1.2
DeePMD-kit-v3.1.2
0/小时
分子动力
LAMMPS
LAMMPS
0
@苍耳阿猫
苍耳阿猫认证作者
15
202H
更新时间2025-12-16
lammps
lammps
0/小时
Wan视频生成数字人
LiveAvatar
LiveAvatar
7
@十字鱼
十字鱼认证作者
19
19H
更新时间2026-01-28
支持自启动
流式实时音频驱动头像生成,无限长度
流式实时音频驱动头像生成,无限长度
0/小时
AI应用
AI命理预测系统ai算命系统ai大模型算命系统 二次开发构建by科哥
AI命理预测系统ai算命系统ai大模型算命系统 二次开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
15
34H
更新时间2026-01-28
使用最新的ai大模型结合中国传统命理系统开发 可以无卡模式运行这个项目
使用最新的ai大模型结合中国传统命理系统开发 可以无卡模式运行这个项目
0/小时
OCR识别
PaddleOCR-VL
PaddleOCR-VL
18
@十字鱼
十字鱼认证作者
105
433H
更新时间2026-01-28
支持自启动
支持 109 种语言 擅长识别文本、表格、公式和图表
支持 109 种语言 擅长识别文本、表格、公式和图表
0/小时
语音合成GLM
GLM-TTS
GLM-TTS
6
@十字鱼
十字鱼认证作者
37
1201H
更新时间2026-01-28
支持自启动
可控且富有情感表达的零样本TTS
可控且富有情感表达的零样本TTS
0/小时
数字人
知鱼-焕焕镜像
知鱼-焕焕镜像
0
@
5
134H
更新时间2026-01-28
支持自启动
数字人视频生成/Digital Human Video Generation
数字人视频生成/Digital Human Video Generation
0/小时
GLMAI应用
Open-AutoGLM
Open-AutoGLM
0
@敢敢のwings
敢敢のwings认证作者
1
1H
更新时间2025-12-13
支持自启动
Open-AutoGLM是由智谱AI在2024年10月推出的开源手机操作智能体框架
Open-AutoGLM是由智谱AI在2024年10月推出的开源手机操作智能体框架
0/小时
GLMAI应用
AutoGLM-Phone-9B
AutoGLM-Phone-9B
0
@Ikaros
6
11H
更新时间2025-12-12
支持自启动
AutoGLM-Phone-9B一键启动镜像
AutoGLM-Phone-9B一键启动镜像
0/小时
Wan视频生成
Wan2.2-14B加速版TTP图片放大ttp加速插画图片放大图片高清图片细节放大 科哥构建
Wan2.2-14B加速版TTP图片放大ttp加速插画图片放大图片高清图片细节放大 科哥构建
1
@科哥AIGC
科哥AIGC认证作者
16
39H
更新时间2026-01-28
支持自启动
专注图片细节放大工作流
专注图片细节放大工作流
0/小时
LongCat图片生成图片编辑
LongCat-Image
LongCat-Image
4
@十字鱼
十字鱼认证作者
17
6H
更新时间2025-12-09
支持自启动
美团龙猫开源图像模型,包含LongCat-Image文生图和LongCat-Image-Edit图像编辑
美团龙猫开源图像模型,包含LongCat-Image文生图和LongCat-Image-Edit图像编辑
0/小时
Z-ImageLora训练
z-image-turbo lora炼丹炉ai-toolkit lora模型训练器
z-image-turbo lora炼丹炉ai-toolkit lora模型训练器
34
@老徐Ai研习社
老徐Ai研习社认证作者
435
4105H
更新时间2026-01-22
支持自启动
z-image-turbo lora炼丹炉ai-toolkit lora模型训练器
z-image-turbo lora炼丹炉ai-toolkit lora模型训练器
0/小时
数字人
Heygem数字人视频生成系统批量版webui版 二次开发构建by科哥
Heygem数字人视频生成系统批量版webui版 二次开发构建by科哥
10
@科哥AIGC
科哥AIGC认证作者
163
314H
更新时间2026-01-28
支持自启动
一键批量生成 一键打包下载视频
一键批量生成 一键打包下载视频
0/小时
OCR识别
PaddleOCR在线webui文字文稿识别多种识别pdf文字识别 二次开发构建by科哥
PaddleOCR在线webui文字文稿识别多种识别pdf文字识别 二次开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
17
31H
更新时间2026-01-30
支持自启动
PaddleOCR在线webui文字文稿识别多种识别pdf文字识别 二次开发构建by科哥
PaddleOCR在线webui文字文稿识别多种识别pdf文字识别 二次开发构建by科哥
0/小时
LongCat图片生成图片编辑
LongCat:双语超强图像生成与编辑,引领写实与精准创作新标准。
LongCat:双语超强图像生成与编辑,引领写实与精准创作新标准。
1
@AI-KSK
AI-KSK认证作者
4
0H
更新时间2025-12-08
LongCat 是美团开源的双语图像生成与编辑模型,具备高效写实表现、强中文渲染与精准一致性编辑能力,在开源领域表现领先。
LongCat 是美团开源的双语图像生成与编辑模型,具备高效写实表现、强中文渲染与精准一致性编辑能力,在开源领域表现领先。
0/小时
语音合成
VoxCPM
VoxCPM
5
@十字鱼
十字鱼认证作者
39
49H
更新时间2025-12-08
支持自启动
面壁智能开源语音克隆 全新1.5版本
面壁智能开源语音克隆 全新1.5版本
0/小时
语音合成
VoxCPM 1.5B
VoxCPM 1.5B
2
@鹄仙
鹄仙认证作者
49
85H
更新时间2025-12-07
全新VoxCPM1.5B,增强长音频输出稳定性
全新VoxCPM1.5B,增强长音频输出稳定性
0/小时
视频编辑
facefusion3.5.1离线全部模型最新TensorRT加速官方原版图片换脸视频换脸高清图片 构建By科哥
facefusion3.5.1离线全部模型最新TensorRT加速官方原版图片换脸视频换脸高清图片 构建By科哥
15
@科哥AIGC
科哥AIGC认证作者
217
579H
更新时间2026-01-30
支持自启动
facefusion3.5.0离线全部模型最新TensorRT加速官方原版图片换脸视频换脸高清图片 构建By科哥
facefusion3.5.0离线全部模型最新TensorRT加速官方原版图片换脸视频换脸高清图片 构建By科哥
0/小时
语音合成
VibeVoice语音合成系统二次webui开发构建by科哥
VibeVoice语音合成系统二次webui开发构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
6
0H
更新时间2026-01-29
支持自启动
基于微软 VibeVoice 的实时语音合成
基于微软 VibeVoice 的实时语音合成
0/小时
Qwen-Image图片编辑Lora训练
Qwen-Edit 2509的Lora训练AI-toolkit
Qwen-Edit 2509的Lora训练AI-toolkit
4
@梦影Erislia
29
211H
更新时间2026-01-29
Qwen-Edit 2509,qwen-edit和z-image的Lora训练DiffusionPipe
Qwen-Edit 2509,qwen-edit和z-image的Lora训练DiffusionPipe
0/小时
数字人
Imtalker
Imtalker
2
@有趣的80后程序员
有趣的80后程序员认证作者
26
28H
更新时间2026-01-29
支持自启动
语音驱动数字人、支持生成超长语音
语音驱动数字人、支持生成超长语音
0/小时
视频编辑
最新视频动作迁移,SteadyDancer,南京大学&腾讯开源!
最新视频动作迁移,SteadyDancer,南京大学&腾讯开源!
26
@与AI同行
与AI同行认证作者
213
321H
更新时间2026-01-29
支持自启动
最新视频动作迁移,SteadyDancer整合包!南京大学&腾讯开源,支持视频动作迁移,支持长视频、批量队列生成、高清放大
最新视频动作迁移,SteadyDancer整合包!南京大学&腾讯开源,支持视频动作迁移,支持长视频、批量队列生成、高清放大
0/小时
目标检测图像分割
SAM3 常见使用案例大全
SAM3 常见使用案例大全
0
@敢敢のwings
敢敢のwings认证作者
13
18H
更新时间2026-01-29
SAM 3提出的PCS任务从根本上突破了这一限制,模型需要检测、分割并追踪输入图像或视频中所有符合该概念的实例。
SAM 3提出的PCS任务从根本上突破了这一限制,模型需要检测、分割并追踪输入图像或视频中所有符合该概念的实例。
0/小时
数字人
Fay数字人-3.1.1
Fay数字人-3.1.1
3
@郭泽斌
郭泽斌认证作者
204
624H
更新时间2025-12-05
Fay数字人3.1.1最小可运行版。fay是一个帮助数字人(2.5d、3d、移动、pc、网页)或大语言模型(openai兼容、deepseek)连通业务系统的mcp框架。
Fay数字人3.1.1最小可运行版。fay是一个帮助数字人(2.5d、3d、移动、pc、网页)或大语言模型(openai兼容、deepseek)连通业务系统的mcp框架。
0/小时
ComfyUI视频生成图片生成
娱乐AI,唱歌跳舞,一应俱全
娱乐AI,唱歌跳舞,一应俱全
5
@老猫本猫
75
186H
更新时间2026-01-29
支持自启动
娱乐AI,唱歌跳舞,一应俱全
娱乐AI,唱歌跳舞,一应俱全
0/小时
ComfyUI图片编辑AI电商
人物,商品,背景,随心所欲替换。
人物,商品,背景,随心所欲替换。
18
@老猫本猫
248
304H
更新时间2026-01-29
支持自启动
人物,商品,背景,随心所欲替换。
人物,商品,背景,随心所欲替换。
0/小时
视频编辑
长视频SteadyDancer动作迁移
长视频SteadyDancer动作迁移
27
@ifelse
147
246H
更新时间2025-12-05
支持自启动
去闪长视频SteadyDancer动作迁移
去闪长视频SteadyDancer动作迁移
0/小时
图片生成
Ovis-Image阿里开源文本生图像大模型在线webui体验版 构建二次开发by科哥
Ovis-Image阿里开源文本生图像大模型在线webui体验版 构建二次开发by科哥
1
@科哥AIGC
科哥AIGC认证作者
6
1H
更新时间2025-12-05
支持自启动
Ovis-Image阿里开源文本生图像大模型在线webui体验版
Ovis-Image阿里开源文本生图像大模型在线webui体验版
0/小时
视频生成
UltraVideo生成高质量超高清1k到4K视频 webUI二次开发构建By科哥
UltraVideo生成高质量超高清1k到4K视频 webUI二次开发构建By科哥
2
@科哥AIGC
科哥AIGC认证作者
22
15H
更新时间2025-12-05
基于wan2.1UltraVideo生成高质量超高清1k到4K视频
基于wan2.1UltraVideo生成高质量超高清1k到4K视频
0/小时
推理框架
vLLM-Omni
vLLM-Omni
1
@敢敢のwings
敢敢のwings认证作者
4
8H
更新时间2026-01-29
vLLM项目团队推出了vLLM-Omni框架,这是一个专门为全模态模型设计的高性能推理系统,旨在将vLLM在文本推理领域积累的性能优势,扩展到包含图像、音频、视频在内的完整多模态生态。
vLLM项目团队推出了vLLM-Omni框架,这是一个专门为全模态模型设计的高性能推理系统,旨在将vLLM在文本推理领域积累的性能优势,扩展到包含图像、音频、视频在内的完整多模态生态。
0/小时
Z-Image图片生成
超强AI图片ZImage-支持批量生成、SeedVR2高清放大
超强AI图片ZImage-支持批量生成、SeedVR2高清放大
59
@与AI同行
与AI同行认证作者
726
1943H
更新时间2026-01-30
支持自启动
阿里ZImageTurbo图片生成整合包,图片真实感、细节全面提升,支持批量生成、SeedVR2高清放大,支持NSFW, 最低6G显存可用!
阿里ZImageTurbo图片生成整合包,图片真实感、细节全面提升,支持批量生成、SeedVR2高清放大,支持NSFW, 最低6G显存可用!
0/小时
其他
MetaGR
MetaGR
0
@Anaconda
1
72H
更新时间2026-01-29
Meta的生成式推荐论文开源仓库的实现。
Meta的生成式推荐论文开源仓库的实现。
0/小时
Z-ImageLora训练
Z-Image-Turbo LoRA训练-AI Toolkit-极致风格化
Z-Image-Turbo LoRA训练-AI Toolkit-极致风格化
7
@AI-KSK
AI-KSK认证作者
141
1745H
更新时间2025-12-04
支持 Z-Image-Turbo LoRA 快速训练的 AI Toolkit 镜像
支持 Z-Image-Turbo LoRA 快速训练的 AI Toolkit 镜像
0/小时
IndexTTS语音合成
IndexTTS2整合包雨落版
IndexTTS2整合包雨落版
104
@雨落实战
雨落实战认证作者
1514
8195H
更新时间2025-12-03
支持自启动
IndexTTS2.0整合包雨落版本,欢迎使用
IndexTTS2.0整合包雨落版本,欢迎使用
0/小时
视频编辑
SteadyDancer-FP8量化,视频动作迁移,支持5090新卡,支持A800计算卡,基于Comfyui,workflow,工作流,批量任务
SteadyDancer-FP8量化,视频动作迁移,支持5090新卡,支持A800计算卡,基于Comfyui,workflow,工作流,批量任务
10
@刘悦的技术博客
刘悦的技术博客认证作者
69
67H
更新时间2026-01-29
支持自启动
SteadyDancer-FP8量化,视频动作迁移,支持5090新卡,支持A800计算卡,基于Comfyui,workflow,工作流,批量任务
SteadyDancer-FP8量化,视频动作迁移,支持5090新卡,支持A800计算卡,基于Comfyui,workflow,工作流,批量任务
0/小时
Z-ImageLora训练
Z-image Lora训练,小白也能轻松上手,AI-toolkit
Z-image Lora训练,小白也能轻松上手,AI-toolkit
27
@梦影Erislia
328
2909H
更新时间2026-01-29
Z-image Lora训练,小白也能轻松上手,AI-toolkit
Z-image Lora训练,小白也能轻松上手,AI-toolkit
0/小时
图片生成
AI艺术二维码生成器在线生成个性二维码 二次开发构建by科哥
AI艺术二维码生成器在线生成个性二维码 二次开发构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
0
0H
更新时间2026-01-29
支持自启动
AI艺术二维码生成器在线生成个性二维码
AI艺术二维码生成器在线生成个性二维码
0/小时
Z-Image图片生成
Z-Image-Turbo-GGUF,局部重绘,文生图,图生图,Qwen3-vl自动提示词,支持5090新卡,支持A800,批量任务队列
Z-Image-Turbo-GGUF,局部重绘,文生图,图生图,Qwen3-vl自动提示词,支持5090新卡,支持A800,批量任务队列
13
@刘悦的技术博客
刘悦的技术博客认证作者
139
100H
更新时间2026-01-29
支持自启动
Z-Image-Turbo-GGUF,局部重绘,文生图,图生图,Qwen3-vl自动提示词,支持5090新卡,支持A800,批量任务队列
Z-Image-Turbo-GGUF,局部重绘,文生图,图生图,Qwen3-vl自动提示词,支持5090新卡,支持A800,批量任务队列
0/小时
Qwen-Image
Qwen-Image的Lora训练DiffusionPipe
Qwen-Image的Lora训练DiffusionPipe
1
@梦影Erislia
16
54H
更新时间2026-01-29
使用diffusion pipe进行qwen image的lora训练,小白也可简单上手,上传image即可开始训练
使用diffusion pipe进行qwen image的lora训练,小白也可简单上手,上传image即可开始训练
0/小时
数字人
HeyGem数字人最新多人面部驱动数字人,支持5090新卡,支持A800计算卡,修复黑框问题,GFP面部超分,修复超长视频上下游阻塞问题
HeyGem数字人最新多人面部驱动数字人,支持5090新卡,支持A800计算卡,修复黑框问题,GFP面部超分,修复超长视频上下游阻塞问题
18
@刘悦的技术博客
刘悦的技术博客认证作者
209
1951H
更新时间2026-01-29
支持自启动
HeyGem数字人最新多人面部驱动数字人,支持5090新卡,支持A800计算卡,修复黑框问题,GFP面部超分,修复超长视频上下游阻塞问题
HeyGem数字人最新多人面部驱动数字人,支持5090新卡,支持A800计算卡,修复黑框问题,GFP面部超分,修复超长视频上下游阻塞问题
0/小时
Z-Image图片生成
阿里通义开源Z-Image文生图片无限制wenbui中文特别版 构建by科哥
阿里通义开源Z-Image文生图片无限制wenbui中文特别版 构建by科哥
7
@科哥AIGC
科哥AIGC认证作者
67
308H
更新时间2026-01-30
支持自启动
文生图片无限制wenbui中文特别版
文生图片无限制wenbui中文特别版
0/小时
Wan视频生成
ComyUI批量z-image出图 SeedVR2 TTP放大 4K  Wan2.2图生视频
ComyUI批量z-image出图 SeedVR2 TTP放大 4K Wan2.2图生视频
3
@ifelse
88
435H
更新时间2026-01-29
支持自启动
ComyUI批量z-image出图 SeedVR2 TTP放大 4K Wan2.2图生视频
ComyUI批量z-image出图 SeedVR2 TTP放大 4K Wan2.2图生视频
0/小时
Z-ImageLora训练
aitookit_z-image_lora_train镜像
aitookit_z-image_lora_train镜像
19
@有趣的80后程序员
有趣的80后程序员认证作者
213
1338H
更新时间2026-01-29
aitookit_z-image_lora_train镜像
aitookit_z-image_lora_train镜像
0/小时
数字人
echomimic_v3阿里蚂蚁团队开源图片加声音生成说话数字人视频基于Comfyui加速和二次高清输出 构建By科哥
echomimic_v3阿里蚂蚁团队开源图片加声音生成说话数字人视频基于Comfyui加速和二次高清输出 构建By科哥
1
@科哥AIGC
科哥AIGC认证作者
33
521H
更新时间2026-01-30
echomimic_v3阿里蚂蚁团队开源图片加声音生成说话数字人视频基于Comfyui加速和二次高清输出 构建By科哥
echomimic_v3阿里蚂蚁团队开源图片加声音生成说话数字人视频基于Comfyui加速和二次高清输出 构建By科哥
0/小时
Z-Image图片生成
Z-Image-Turbo 最真实的生图模型
Z-Image-Turbo 最真实的生图模型
20
@匹夫
匹夫认证作者
160
308H
更新时间2026-01-30
Z-Image-Turbo 最真实的生图模型
Z-Image-Turbo 最真实的生图模型
0/小时
数据分析AI应用
Crawl4AI:基于AI的网络爬虫和数据抓取工具
Crawl4AI:基于AI的网络爬虫和数据抓取工具
3
@AI画师大阳
AI画师大阳认证作者
14
27H
更新时间2026-01-30
支持自启动
Crawl4AI:基于AI的网络爬虫和数据抓取工具
Crawl4AI:基于AI的网络爬虫和数据抓取工具
0/小时
Flux图片生成图片编辑
FLUX.2 [dev]
FLUX.2 [dev]
7
@十字鱼
十字鱼认证作者
41
21H
更新时间2025-11-28
支持自启动
FLUX.2 [dev] 是一个拥有32B参数的流匹配Transformer模型,能够生成和编辑图像。
FLUX.2 [dev] 是一个拥有32B参数的流匹配Transformer模型,能够生成和编辑图像。
0/小时
FluxComfyUI图片生成
flux.2工作流合集-加图片放大工作流
flux.2工作流合集-加图片放大工作流
22
@匹夫
匹夫认证作者
140
278H
更新时间2026-01-30
flux.2工作流合集-及图片高清放大工作流
flux.2工作流合集-及图片高清放大工作流
0/小时
Z-Image图片生成
Z-Image-Turbo · 8步极速 · 无限制生成
Z-Image-Turbo · 8步极速 · 无限制生成
6
@AI-KSK
AI-KSK认证作者
120
296H
更新时间2025-11-27
Z-Image-Turbo 是一款仅用 8 步即可生成旗舰级图像的高效扩散模型,具备快速生成、双语文本渲染、强指令理解与创意编辑能力,是当前开源图像模型中兼具速度与质量的优秀代表。
Z-Image-Turbo 是一款仅用 8 步即可生成旗舰级图像的高效扩散模型,具备快速生成、双语文本渲染、强指令理解与创意编辑能力,是当前开源图像模型中兼具速度与质量的优秀代表。
0/小时
FluxComfyUI图片生成
flux2最新发布f8优化极速版3090显卡可玩含sora2工作流 构建by科哥
flux2最新发布f8优化极速版3090显卡可玩含sora2工作流 构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
17
1H
更新时间2025-11-27
支持自启动
flux2最新发布f8优化极速版3090显卡可玩含sora2工作流 构建by科哥
flux2最新发布f8优化极速版3090显卡可玩含sora2工作流 构建by科哥
0/小时
ComfyUI
ComfyUI基础镜像纯净版0.3.50
ComfyUI基础镜像纯净版0.3.50
7
@龙没耳
龙没耳认证作者
40
105H
更新时间2026-01-30
支持自启动
ComfyUI基础镜像纯净版0.3.50
ComfyUI基础镜像纯净版0.3.50
0/小时
AI应用
PDFMathTranslate-next基于 AI 完整保留排版的 PDF 文档全文双语翻译
PDFMathTranslate-next基于 AI 完整保留排版的 PDF 文档全文双语翻译
5
@AI画师大阳
AI画师大阳认证作者
52
1619H
更新时间2026-01-30
支持自启动
基于 AI 完整保留排版的 PDF 文档全文双语翻译
基于 AI 完整保留排版的 PDF 文档全文双语翻译
0/小时
FluxComfyUI图片生成
FLUX.2:下一代视觉生成引擎
FLUX.2:下一代视觉生成引擎
3
@AI-KSK
AI-KSK认证作者
39
83H
更新时间2026-01-30
Flux.2 是 2025 年最全面、最专业、最强大的统一视觉生成模型之一。
Flux.2 是 2025 年最全面、最专业、最强大的统一视觉生成模型之一。
0/小时
ComfyUI图片编辑Qwen-Image
aha的ComfyUI镜像——姿态编辑
aha的ComfyUI镜像——姿态编辑
5
@叫我aha就好
84
161H
更新时间2026-01-30
SDPose_OOD+Pose_editor+qwen image edit 2509,姿态估计与编辑,随心所欲修改姿态
SDPose_OOD+Pose_editor+qwen image edit 2509,姿态估计与编辑,随心所欲修改姿态
0/小时
混元视频生成
HunyuanVideo 1.5开源视频生成模型-ComfyUI实现
HunyuanVideo 1.5开源视频生成模型-ComfyUI实现
7
@AI-KSK
AI-KSK认证作者
49
85H
更新时间2026-01-30
该镜像集成了刚刚开源的 HunyuanVideo 1.5 模型
该镜像集成了刚刚开源的 HunyuanVideo 1.5 模型
0/小时
ComfyUI
ComfyUI整合镜像
ComfyUI整合镜像
6
@鹄仙
鹄仙认证作者
61
175H
更新时间2026-01-30
一个Comfy UI的整合包,自用版,带插件和部分模型
一个Comfy UI的整合包,自用版,带插件和部分模型
0/小时
DeepSeekOCR识别
Deepseek orc webui在线图片识别文字pdf文件转文字 七种识别文字 构建by科哥
Deepseek orc webui在线图片识别文字pdf文件转文字 七种识别文字 构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
35
476H
更新时间2026-02-02
Deepseek orc webui在线图片识别文字pdf文件转文字
Deepseek orc webui在线图片识别文字pdf文件转文字
0/小时
混元3D生成
ComfyUI-SAM3-Hunyuan3D-Part-SAM3DBody工作流集合 构建By科哥
ComfyUI-SAM3-Hunyuan3D-Part-SAM3DBody工作流集合 构建By科哥
0
@科哥AIGC
科哥AIGC认证作者
11
21H
更新时间2026-01-30
支持自启动
sam3是谷歌开源的一个项目图像拆分,3D渲染等
sam3是谷歌开源的一个项目图像拆分,3D渲染等
0/小时
混元视频生成
HunyuanVideo-1.5
HunyuanVideo-1.5
3
@十字鱼
十字鱼认证作者
20
48H
更新时间2025-11-24
支持自启动
一个领先的超轻量级视频生成模型
一个领先的超轻量级视频生成模型
0/小时
IndexTTS语音合成
AI听书 IndexTTS vllm加速版
AI听书 IndexTTS vllm加速版
6
@CyberWon
63
60H
更新时间2026-01-23
低成本高质量快速生成有声书。
低成本高质量快速生成有声书。
0.01/小时
ComfyUIQwen-Image图片生成
一张图生成多角度工作流-万物融合工作流升级版
一张图生成多角度工作流-万物融合工作流升级版
14
@匹夫
匹夫认证作者
105
221H
更新时间2026-01-30
一张图生成多角度工作流-万物融合工作流升级版
一张图生成多角度工作流-万物融合工作流升级版
0/小时
视频生成Wan
超强AI图生视频RemixV2-支持批量生成、首尾帧视频、高清放大
超强AI图生视频RemixV2-支持批量生成、首尾帧视频、高清放大
55
@与AI同行
与AI同行认证作者
730
2497H
更新时间2026-01-30
支持自启动
AI生成视频,Wan2.2-RemixV2整合包,支持图生视频、首尾帧视频,支持批量单图视频、批量首尾帧,支持高清放大、加载Lora、NSFW,最低8G显存可用
AI生成视频,Wan2.2-RemixV2整合包,支持图生视频、首尾帧视频,支持批量单图视频、批量首尾帧,支持高清放大、加载Lora、NSFW,最低8G显存可用
0/小时
语音合成
错金流TTS地表炸天TTS工具,一百多款自然人声,极速复刻
错金流TTS地表炸天TTS工具,一百多款自然人声,极速复刻
4
@独立工作者
43
178H
更新时间2026-02-02
地表炸天TTS工具,一百多款自然人声,极速复刻
地表炸天TTS工具,一百多款自然人声,极速复刻
0/小时
视频超分
FlashVSR 视频高清放大工具
FlashVSR 视频高清放大工具
19
@AI画师大阳
AI画师大阳认证作者
369
819H
更新时间2026-01-30
支持自启动
FlashVSR 视频高清放大工具
FlashVSR 视频高清放大工具
0/小时
语音合成
XKPLUS2
XKPLUS2
0
@REDCOPY
4
0H
更新时间2025-11-24
支持自启动
加速优化版
加速优化版
0.76/小时
语音合成
XKPLUS1
XKPLUS1
1
@REDCOPY
4
22H
更新时间2025-11-24
支持自启动
30系显卡优化版
30系显卡优化版
0.46/小时
语音合成
云端88888888
云端88888888
0
@REDCOPY
2
22H
更新时间2025-11-17
支持自启动
3080Ti专用
3080Ti专用
0.46/小时
语音合成
语音88888888
语音88888888
0
@REDCOPY
3
10H
更新时间2025-11-17
支持自启动
3080Ti专用
3080Ti专用
0.76/小时
AI应用
video-subtitle-extractor视频字幕提取器 全智能加速优化版 构建by科哥
video-subtitle-extractor视频字幕提取器 全智能加速优化版 构建by科哥
0
@科哥AIGC
科哥AIGC认证作者
12
19H
更新时间2026-01-30
一键提取视频字幕 加速优化
一键提取视频字幕 加速优化
0/小时
语音合成语音识别
Step-Audio-EditX
Step-Audio-EditX
3
@十字鱼
十字鱼认证作者
22
15H
更新时间2025-11-14
支持自启动
一个强大的 3B 参数、基于 LLM 的强化学习音频编辑模型,擅长编辑情感、说话风格和副语言,并具有稳健的零样本文本转语音功能
一个强大的 3B 参数、基于 LLM 的强化学习音频编辑模型,擅长编辑情感、说话风格和副语言,并具有稳健的零样本文本转语音功能
0/小时
语音合成
VibeVoice:富有表现力的长篇多人对话语音合成工具
VibeVoice:富有表现力的长篇多人对话语音合成工具
11
@AI画师大阳
AI画师大阳认证作者
87
201H
更新时间2026-01-30
支持自启动
富有表现力的长篇多人对话语音合成工具
富有表现力的长篇多人对话语音合成工具
0/小时
IndexTTS语音合成
IndexTTS2 B站开源超强语音克隆
IndexTTS2 B站开源超强语音克隆
310
@十字鱼
十字鱼认证作者
2111
8058H
更新时间2026-02-02
支持自启动
B站开源超强语音克隆,在情感表达和时长控制方面取得突破的自回归零样本文本合成系统
B站开源超强语音克隆,在情感表达和时长控制方面取得突破的自回归零样本文本合成系统
0/小时
Wan视频编辑ComfyUI
Remix-Wan2.2一体化多功能创作镜像
Remix-Wan2.2一体化多功能创作镜像
27
@AI-KSK
AI-KSK认证作者
196
687H
更新时间2026-01-30
一体化整合Remix-Wan 2.2 文生视频、图生视频、首尾帧生成与 Qwen3 自动提示词的多功能创作镜像
一体化整合Remix-Wan 2.2 文生视频、图生视频、首尾帧生成与 Qwen3 自动提示词的多功能创作镜像
0/小时
视频编辑AI应用
AI视频消除万物-支持消除人物、物体、水印、字幕等
AI视频消除万物-支持消除人物、物体、水印、字幕等
43
@与AI同行
与AI同行认证作者
512
748H
更新时间2026-01-30
支持自启动
AI视频消除万物整合包,支持消除人物、物体、水印、字幕等,支持较长视频、添加队列任务,打开即用,一键运行!
AI视频消除万物整合包,支持消除人物、物体、水印、字幕等,支持较长视频、添加队列任务,打开即用,一键运行!
0/小时
图片编辑图片生成ComfyUI
ChromoEdit-GGUF模型,,图片修改,图像修改,图生视频,支持5090新卡,comfyui,工作流,workflow
ChromoEdit-GGUF模型,,图片修改,图像修改,图生视频,支持5090新卡,comfyui,工作流,workflow
8
@刘悦的技术博客
刘悦的技术博客认证作者
49
23H
更新时间2026-01-30
支持自启动
ChromoEdit-GGUF模型,,图片修改,图像修改,图生视频,支持5090新卡,comfyui,工作流,workflow
ChromoEdit-GGUF模型,,图片修改,图像修改,图生视频,支持5090新卡,comfyui,工作流,workflow
0/小时
InfiniteTalk数字人
InfiniteTalk数字人视频制作软件,图片转视频,视频人物配音
InfiniteTalk数字人视频制作软件,图片转视频,视频人物配音
31
@AI画师大阳
AI画师大阳认证作者
499
757H
更新时间2026-02-02
支持自启动
InfiniteTalk 是一个无限长度的对话视频生成模型,支持音频驱动的视频到视频和图像到视频的生成
InfiniteTalk 是一个无限长度的对话视频生成模型,支持音频驱动的视频到视频和图像到视频的生成
0/小时
ComfyUI
Diffusion_pipe_in_ComfyUI天冬
Diffusion_pipe_in_ComfyUI天冬
3
@天冬
15
76H
更新时间2025-11-11
支持自启动
为 ComfyUI 提供了完整的 Diffusion 模型训练和微调功能。这个项目允许用户在 ComfyUI 的图形界面中配置和启动各种先进 AI 模型的训练,支持 LoRA 和全量微调
为 ComfyUI 提供了完整的 Diffusion 模型训练和微调功能。这个项目允许用户在 ComfyUI 的图形界面中配置和启动各种先进 AI 模型的训练,支持 LoRA 和全量微调
0/小时
语音合成语音识别
Step-Audio-EditX
Step-Audio-EditX
3
@鹄仙
鹄仙认证作者
17
28H
更新时间2025-11-24
一个音频编辑项目,“情绪编辑”“风格编辑”“语气编辑”和“降噪变速”
一个音频编辑项目,“情绪编辑”“风格编辑”“语气编辑”和“降噪变速”
0/小时
其他
猫哥的商业化AI,SORA2
猫哥的商业化AI,SORA2
18
@老猫本猫
821
2933H
更新时间2026-01-30
支持自启动
SORA2文生视频,图生视频
SORA2文生视频,图生视频
0/小时
AI应用
AI-Trader港大开源的AI自动交易竞赛框架 汉化构建By科哥
AI-Trader港大开源的AI自动交易竞赛框架 汉化构建By科哥
1
@科哥AIGC
科哥AIGC认证作者
8
1H
更新时间2026-01-30
股市有风险 投资请谨慎!
股市有风险 投资请谨慎!
0/小时
Qwen-Image图片生成
Qwen-Image-Edit-2509多图编辑及人物一致性生成
Qwen-Image-Edit-2509多图编辑及人物一致性生成
3
@AI画师大阳
AI画师大阳认证作者
134
169H
更新时间2026-01-30
支持自启动
Qwen-Image-Edit-2509精准多图内容编辑及人物一致性图片生成
Qwen-Image-Edit-2509精准多图内容编辑及人物一致性图片生成
0/小时
其他
超强Sora2视频去水印
超强Sora2视频去水印
43
@与AI同行
与AI同行认证作者
236
478H
更新时间2026-02-02
支持自启动
超强Sora2视频去水印
超强Sora2视频去水印
0/小时
InfiniteTalkWan数字人
SDPOSE 超复杂骨骼识别系统 X Lynx + InfiniteTalk + VACE + Wan 无限时长视频转绘体系
SDPOSE 超复杂骨骼识别系统 X Lynx + InfiniteTalk + VACE + Wan 无限时长视频转绘体系
2
@AI-KSK
AI-KSK认证作者
34
54H
更新时间2026-01-30
以 SDPOSE 为核心,融合 Lynx、InfiniteTalk、VACE 与Wan ,构建出一个可无限时长、骨骼级精度的人体视频转绘与智能生成体系
以 SDPOSE 为核心,融合 Lynx、InfiniteTalk、VACE 与Wan ,构建出一个可无限时长、骨骼级精度的人体视频转绘与智能生成体系
0/小时
视频超分
ComfyUI_FlashVSR 实时视频超分,支持1分钟以上视频超分
ComfyUI_FlashVSR 实时视频超分,支持1分钟以上视频超分
8
@smthem
134
136H
更新时间2025-11-27
支持自启动
实时视频超分项目,显存如果够大,所有视频超分到4K
实时视频超分项目,显存如果够大,所有视频超分到4K
0/小时
QwenVL视觉理解
Qwen3-vl-abliterated视觉模型,视频理解,多图理解,批量任务,反推提示词
Qwen3-vl-abliterated视觉模型,视频理解,多图理解,批量任务,反推提示词
15
@刘悦的技术博客
刘悦的技术博客认证作者
92
1056H
更新时间2026-01-30
支持自启动
Qwen3-vl-abliterated视觉模型,视频理解,多图理解,批量任务,反推提示词
Qwen3-vl-abliterated视觉模型,视频理解,多图理解,批量任务,反推提示词
0/小时
Wan视频编辑
animate完美一致性人物迁移
animate完美一致性人物迁移
20
@
151
233H
更新时间2026-01-30
支持自启动
无惧镜头切换人物迁移
无惧镜头切换人物迁移
0/小时
视频编辑ComfyUI
4步骤完成风格转绘vlog
4步骤完成风格转绘vlog
3
@鹄仙
鹄仙认证作者
7
79H
更新时间2026-01-09
支持自启动
4步骤完成风格转绘vlog
4步骤完成风格转绘vlog
0/小时
WanLora训练
Wan2.2-Lora训练diffusionpipe
Wan2.2-Lora训练diffusionpipe
9
@梦影Erislia
68
171H
更新时间2026-01-30
Wan2.2Lora训练diffusionpipe
Wan2.2Lora训练diffusionpipe
0/小时
图片编辑图片生成
ChronoEdit
ChronoEdit
3
@十字鱼
十字鱼认证作者
10
6H
更新时间2025-11-04
支持自启动
面向图像编辑和世界模拟的时序推理
面向图像编辑和世界模拟的时序推理
0/小时
Wan视频编辑
wan2.2视频编辑人物替换背景替换
wan2.2视频编辑人物替换背景替换
46
@老徐Ai研习社
老徐Ai研习社认证作者
675
1358H
更新时间2025-11-24
支持自启动
视频编辑人物替换背景替换局部修改
视频编辑人物替换背景替换局部修改
0/小时
语音合成
SoulX-Podcast:能说方言、带情绪的真实感长播客生成工具 构建by科哥
SoulX-Podcast:能说方言、带情绪的真实感长播客生成工具 构建by科哥
5
@科哥AIGC
科哥AIGC认证作者
55
65H
更新时间2026-01-30
支持自启动
SoulX-Podcast:能说方言、带情绪的真实感长播客生成工具
SoulX-Podcast:能说方言、带情绪的真实感长播客生成工具
0/小时
Wan视频编辑
Wan2.2-Animate-14B动作模仿及视频人物替换
Wan2.2-Animate-14B动作模仿及视频人物替换
35
@AI画师大阳
AI画师大阳认证作者
362
435H
更新时间2026-01-30
支持自启动
Wan2.2-Animate-14B一张图片模仿视频人物动作及替换视频中人物
Wan2.2-Animate-14B一张图片模仿视频人物动作及替换视频中人物
0/小时
语音合成
SoulX-Podcast-1.7B语音合成,接口API调用,多人播客合成,方言合成,语速调节,支持笑声咳嗽指令,支持5090新卡,音色保存
SoulX-Podcast-1.7B语音合成,接口API调用,多人播客合成,方言合成,语速调节,支持笑声咳嗽指令,支持5090新卡,音色保存
8
@刘悦的技术博客
刘悦的技术博客认证作者
72
122H
更新时间2025-11-14
支持自启动
SoulX-Podcast-1.7B语音合成,接口API调用,多人播客合成,方言合成,语速调节,支持笑声咳嗽指令,支持5090新卡,音色保存
SoulX-Podcast-1.7B语音合成,接口API调用,多人播客合成,方言合成,语速调节,支持笑声咳嗽指令,支持5090新卡,音色保存
0/小时
Qwen-Image图片生成
最强AI图片编辑-QwenImageEdit加速版-支持换装、换姿势、批量生成、高清放大
最强AI图片编辑-QwenImageEdit加速版-支持换装、换姿势、批量生成、高清放大
22
@与AI同行
与AI同行认证作者
247
835H
更新时间2025-11-02
支持自启动
最强AI图片编辑-QwenImageEdit-支持换装、换姿势、批量生成、SeedVR2高清放大
最强AI图片编辑-QwenImageEdit-支持换装、换姿势、批量生成、SeedVR2高清放大
0/小时
视频编辑
facefusion3.4.1图片视频换脸神器 汉化版构建by科哥
facefusion3.4.1图片视频换脸神器 汉化版构建by科哥
23
@科哥AIGC
科哥AIGC认证作者
95
99H
更新时间2025-11-24
facefusion3.4官方原版
facefusion3.4官方原版
0/小时
Flux图片生成
DYPE超大分辨率1600万像素图像生成,ComfyUI插件实现
DYPE超大分辨率1600万像素图像生成,ComfyUI插件实现
1
@smthem
12
39H
更新时间2025-11-02
支持自启动
消费级显卡开始生成4096*4096的超大尺寸图片
消费级显卡开始生成4096*4096的超大尺寸图片
0/小时
Wan视频编辑ComfyUI
wan2.2视频瞳孔转场
wan2.2视频瞳孔转场
1
@skyrimprey
5
167H
更新时间2026-01-30
挂载wan2.2瞳孔转场lora,实现专业的视频转场效果
挂载wan2.2瞳孔转场lora,实现专业的视频转场效果
0/小时
图片编辑AI工具
最强照片上色DDColor-牛哥定制版
最强照片上色DDColor-牛哥定制版
3
@NiuGee
NiuGee认证作者
17
130H
更新时间2026-01-30
支持自启动
🎨 DDColor 牛哥镜像版 - 黑白图像智能上色 牛哥针对DDColor黑白图像上色模型制作的一手镜像,这应该是目前效果最好的黑白照片智能上色解决方案之一。
🎨 DDColor 牛哥镜像版 - 黑白图像智能上色 牛哥针对DDColor黑白图像上色模型制作的一手镜像,这应该是目前效果最好的黑白照片智能上色解决方案之一。
0/小时
IndexTTS语音合成
IndexTTS2/GPT-SoVITS+Srt-AI-Voice-Assistant多角色字幕长文本一键配音镜像
IndexTTS2/GPT-SoVITS+Srt-AI-Voice-Assistant多角色字幕长文本一键配音镜像
30
@数列解析几何一生之敌
数列解析几何一生之敌认证作者
257
1113H
更新时间2026-02-02
支持自启动
Srt-AI-Voice-Assistant配音辅助工具搭配IndexTTS2/GSV的镜像
Srt-AI-Voice-Assistant配音辅助工具搭配IndexTTS2/GSV的镜像
0/小时
视频生成Wan
超强AI生成视频-SmoothMix-V2合集-效果超强
超强AI生成视频-SmoothMix-V2合集-效果超强
31
@与AI同行
与AI同行认证作者
347
1256H
更新时间2025-10-30
支持自启动
SmoothMix-V2合集-效果超强,支持文生视频、图生视频、首尾帧、批量首尾帧视频,支持NSFW、高清修复!
SmoothMix-V2合集-效果超强,支持文生视频、图生视频、首尾帧、批量首尾帧视频,支持NSFW、高清修复!
0/小时
LongCat视频生成
美团LongCat-ComfyUI|文生视频·图生视频·视频延续|长视频生成
美团LongCat-ComfyUI|文生视频·图生视频·视频延续|长视频生成
8
@AI-KSK
AI-KSK认证作者
85
325H
更新时间2026-01-30
这是一个集成了美团LongCat模型与ComfyUI的镜像,提供文生视频、图生视频和视频延续三大功能,核心优势在于能生成长时间且质量稳定的视频。
这是一个集成了美团LongCat模型与ComfyUI的镜像,提供文生视频、图生视频和视频延续三大功能,核心优势在于能生成长时间且质量稳定的视频。
0/小时
Wan视频生成
超强AI生成视频-Lightx2v-I2V-超强动态、分镜效果
超强AI生成视频-Lightx2v-I2V-超强动态、分镜效果
15
@与AI同行
与AI同行认证作者
160
476H
更新时间2025-10-29
支持自启动
超强AI生成视频-Lightx2v-I2V-超强动态、分镜效果。支持图生视频,首尾帧、批量首尾帧视频、批量生成、高清修复
超强AI生成视频-Lightx2v-I2V-超强动态、分镜效果。支持图生视频,首尾帧、批量首尾帧视频、批量生成、高清修复
0/小时
LongCat视频生成
美团Longcat-video视频模型
美团Longcat-video视频模型
4
@社恐的知识树
社恐的知识树认证作者
14
102H
更新时间2025-10-29
支持自启动
美团开源的长视频生成模型-Longcat,ComfyUI抢先体验版,后续优化后继续更新!
美团开源的长视频生成模型-Longcat,ComfyUI抢先体验版,后续优化后继续更新!
0/小时
数字人
LatentSync抖音出品高质量对口型软件
LatentSync抖音出品高质量对口型软件
37
@AI画师大阳
AI画师大阳认证作者
614
7097H
更新时间2026-01-30
支持自启动
高质量对口型工具
高质量对口型工具
0/小时
视频超分
FlashVSR_Ultra_Fast,图片视频超清放大,支持批量任务,支持5090新卡
FlashVSR_Ultra_Fast,图片视频超清放大,支持批量任务,支持5090新卡
32
@刘悦的技术博客
刘悦的技术博客认证作者
668
1328H
更新时间2026-01-30
支持自启动
FlashVSR_Ultra_Fast,图片视频超清放大,支持批量任务,支持5090新卡
FlashVSR_Ultra_Fast,图片视频超清放大,支持批量任务,支持5090新卡
0/小时
视频编辑ComfyUI
一键视频转绘Ditto
一键视频转绘Ditto
4
@鹄仙
鹄仙认证作者
51
61H
更新时间2026-02-02
把视频整体转会成其他风格
把视频整体转会成其他风格
0/小时
ComfyUI
积木comfyui
积木comfyui
5
@积木comfyui
37
56H
更新时间2026-02-02
支持自启动
简单易懂,用核心原理展示工作流
简单易懂,用核心原理展示工作流
0/小时
视频生成
Video-As-Prompt
Video-As-Prompt
2
@十字鱼
十字鱼认证作者
1
1H
更新时间2025-10-28
支持自启动
统一语义控制的视频生成
统一语义控制的视频生成
0/小时
Qwen-ImageComfyUIWan
Pony V7 × Qwen AIO × Smooth 2.0无限制生产|图像 / 编辑 / 视频 一体化
Pony V7 × Qwen AIO × Smooth 2.0无限制生产|图像 / 编辑 / 视频 一体化
4
@AI-KSK
AI-KSK认证作者
101
695H
更新时间2026-02-02
这是一个整合图像生成、图像编辑和视频生产的 AI 创作工具。
这是一个整合图像生成、图像编辑和视频生产的 AI 创作工具。
0/小时
数字人
LiveTalking-V1.5
LiveTalking-V1.5
1
@有黑眼圈的小竹熊
155
1045H
更新时间2026-02-02
实时数字人解决方案
实时数字人解决方案
0.3/小时
ComfyUIWan视频生成
Comfyui_Ditto
Comfyui_Ditto
3
@skyrimprey
10
7H
更新时间2026-02-02
Ditto:基于指令的视频编辑框架,可以用于视频内元素的风格转换 本镜像为https://github.com/EzioBy/Ditto的Comfyui实现
Ditto:基于指令的视频编辑框架,可以用于视频内元素的风格转换 本镜像为https://github.com/EzioBy/Ditto的Comfyui实现
0/小时
AI应用
MinerU:高质量PDF转Markdown/JSON
MinerU:高质量PDF转Markdown/JSON
6
@AI画师大阳
AI画师大阳认证作者
144
630H
更新时间2026-02-02
支持自启动
快速高效的将PDF文档转为Markdown/JSON文件
快速高效的将PDF文档转为Markdown/JSON文件
0/小时
视频编辑视频生成
超强AI视频风格重绘-Ditto-支持长视频、批量生成
超强AI视频风格重绘-Ditto-支持长视频、批量生成
7
@与AI同行
与AI同行认证作者
65
65H
更新时间2026-02-02
支持自启动
超强AI视频重绘Ditto-支持长视频、批量生成,支持视频风格转换、动漫转真人视频,超级方便!
超强AI视频重绘Ditto-支持长视频、批量生成,支持视频风格转换、动漫转真人视频,超级方便!
0/小时
3D生成
微软TRELLIS图片/文本转3D模型资产
微软TRELLIS图片/文本转3D模型资产
2
@AI画师大阳
AI画师大阳认证作者
75
233H
更新时间2026-02-02
支持自启动
高质量图片/文本转3D网格模型
高质量图片/文本转3D网格模型
0/小时
DeepSeekOCR识别
DeepSeek-OCR
DeepSeek-OCR
16
@十字鱼
十字鱼认证作者
54
584H
更新时间2025-10-24
上下文光学压缩
上下文光学压缩
0/小时
Qwen-ImageComfyUI
Qwen-image-Nunchaku智能扩图,AI绘图,关键词扩图,图像填充,图像延展,支持5090新卡
Qwen-image-Nunchaku智能扩图,AI绘图,关键词扩图,图像填充,图像延展,支持5090新卡
5
@刘悦的技术博客
刘悦的技术博客认证作者
33
29H
更新时间2026-02-02
支持自启动
Qwen-image-Nunchaku智能扩图,AI绘图,关键词扩图,图像填充,图像延展,支持5090新卡
Qwen-image-Nunchaku智能扩图,AI绘图,关键词扩图,图像填充,图像延展,支持5090新卡
0/小时
InfiniteTalk数字人
ComfyUI_infiniteTalk数字人工作流
ComfyUI_infiniteTalk数字人工作流
41
@好奇漫步
766
3923H
更新时间2026-02-02
本镜像包含ComfyUI许多工作流,目前优先测试部署完毕infiniteTalk数字人工作流、Wan2.2生视频工作流、HoMo数字人工作流等,后续会继续部署完善更多的工作流。
本镜像包含ComfyUI许多工作流,目前优先测试部署完毕infiniteTalk数字人工作流、Wan2.2生视频工作流、HoMo数字人工作流等,后续会继续部署完善更多的工作流。
0/小时
WanQwen-Image视频生成
Qwen-image以及WAN视频系列,打开即用!
Qwen-image以及WAN视频系列,打开即用!
7
@老许爱吃肉丶
126
1750H
更新时间2026-02-02
支持自启动
comfyui工作流,Qwen-image以及WAN2.1/2.2视频,都已经部署好,里面内置工作流,打开即可使用!
comfyui工作流,Qwen-image以及WAN2.1/2.2视频,都已经部署好,里面内置工作流,打开即可使用!
0/小时
视频超分
FlashVSR视频高清放大webUI狂暴优化版 一键启用多倍放大 二次开发构建by科哥
FlashVSR视频高清放大webUI狂暴优化版 一键启用多倍放大 二次开发构建by科哥
7
@科哥AIGC
科哥AIGC认证作者
110
152H
更新时间2026-02-02
FlashVSR视频高清放大webUI狂暴优化版 一键启用多倍放大
FlashVSR视频高清放大webUI狂暴优化版 一键启用多倍放大
0/小时
Wan视频生成ComfyUI
Smooth Wan 2.2 动态↑速度↑NSFW↑文生/图生视频&首尾帧
Smooth Wan 2.2 动态↑速度↑NSFW↑文生/图生视频&首尾帧
56
@AI-KSK
AI-KSK认证作者
704
5080H
更新时间2026-02-02
Smooth是最新的被社区广泛认可的Wan 2.2无限制合并模型
Smooth是最新的被社区广泛认可的Wan 2.2无限制合并模型
0/小时
OCR识别
baidu-paddle-ocr
baidu-paddle-ocr
3
@有趣的80后程序员
有趣的80后程序员认证作者
42
100H
更新时间2026-02-02
ocr模型天花板、支持109种语言、公式、表格、图标
ocr模型天花板、支持109种语言、公式、表格、图标
0/小时
视频超分
Flash-VSR-1.3B 图片/视频超清放大
Flash-VSR-1.3B 图片/视频超清放大
7
@刘悦的技术博客
刘悦的技术博客认证作者
81
30H
更新时间2026-02-02
支持自启动
Flash-VSR-1.3B,图片/视频超清放大,支持5090新显卡,支持批量任务
Flash-VSR-1.3B,图片/视频超清放大,支持5090新显卡,支持批量任务
0/小时
目标检测VL视觉理解
Rex-Omni
Rex-Omni
2
@十字鱼
十字鱼认证作者
15
309H
更新时间2025-10-19
支持自启动
通过下一个点预测来检测任何事物
通过下一个点预测来检测任何事物
0/小时
Wan视频生成
Wan2.2-SmoothMix 更丝滑的图生视频
Wan2.2-SmoothMix 更丝滑的图生视频
21
@刘悦的技术博客
刘悦的技术博客认证作者
211
154H
更新时间2026-02-02
支持自启动
Wan2.2-SmoothMix,更丝滑的图生视频,首尾帧连贯动画,4步采样,支持5090新卡
Wan2.2-SmoothMix,更丝滑的图生视频,首尾帧连贯动画,4步采样,支持5090新卡
0/小时
Wan视频编辑ComfyUI
Wan2.2-KJ氦气加速ComfyUI 6步极速版(唯一正版授权)
Wan2.2-KJ氦气加速ComfyUI 6步极速版(唯一正版授权)
18
@龙没耳
龙没耳认证作者
411
2766H
更新时间2026-02-02
支持自启动
Wan2.2KJ氦气加速6步极速版唯一正版授权镜像——AI来事&龙没耳联合推出
Wan2.2KJ氦气加速6步极速版唯一正版授权镜像——AI来事&龙没耳联合推出
0/小时
Wan视频编辑
Animate-v2-最强人物替换工作流
Animate-v2-最强人物替换工作流
29
@匹夫
匹夫认证作者
310
584H
更新时间2026-02-02
支持自启动
Animate-v2-最强人物替换工作流
Animate-v2-最强人物替换工作流
0/小时
图片编辑图片生成ComfyUI
DreamOmni2 ComfyUI 量化版
DreamOmni2 ComfyUI 量化版
2
@鹄仙
鹄仙认证作者
29
66H
更新时间2025-11-07
支持自启动
超级强大的图像编辑项目
超级强大的图像编辑项目
0/小时
视频生成
OVI一款使用提示生成音频音效,或者完整的有声视频开源模型
OVI一款使用提示生成音频音效,或者完整的有声视频开源模型
2
@社恐的知识树
社恐的知识树认证作者
20
8H
更新时间2026-02-02
一个类似Veo3 Sora的开源模型,使用提示词自动生成音频视频
一个类似Veo3 Sora的开源模型,使用提示词自动生成音频视频
0/小时
Wan视频编辑
最强视频编辑-阿里WanAnimate-Q8超高精度-合集
最强视频编辑-阿里WanAnimate-Q8超高精度-合集
124
@与AI同行
与AI同行认证作者
2437
11144H
更新时间2026-02-02
支持自启动
最强视频编辑-阿里Wan-Animate-Q8超高精度-合集
最强视频编辑-阿里Wan-Animate-Q8超高精度-合集
0/小时
Wan视频编辑ComfyUI
视频重绘_跳舞姿势视频迁移Wan2.2图生视频
视频重绘_跳舞姿势视频迁移Wan2.2图生视频
13
@梦影Erislia
89
104H
更新时间2026-02-02
视频重绘_跳舞姿势视频迁移Wan2.2图生视频
视频重绘_跳舞姿势视频迁移Wan2.2图生视频
0/小时
ComfyUIAI电商
电商-AI模特/饰品/眼镜/假发模特,ComfyUI一键启动镜像
电商-AI模特/饰品/眼镜/假发模特,ComfyUI一键启动镜像
13
@AI美研所
169
488H
更新时间2026-02-03
支持自启动
适用电商的ComfyUI镜像环境,包括:饰品佩戴、 多姿势,多角度, 一致性模特工作流,一键换装工作流,眼镜模特工作流,假发模特工作流镜像;本镜像采取一键打包形式,不用输入一句命令,点击几次即可
适用电商的ComfyUI镜像环境,包括:饰品佩戴、 多姿势,多角度, 一致性模特工作流,一键换装工作流,眼镜模特工作流,假发模特工作流镜像;本镜像采取一键打包形式,不用输入一句命令,点击几次即可
0/小时
Wan视频编辑ComfyUI
Wan-Lynx 面部信息迁移图生视频+人脸一致性保持
Wan-Lynx 面部信息迁移图生视频+人脸一致性保持
14
@刘悦的技术博客
刘悦的技术博客认证作者
61
41H
更新时间2026-02-02
支持自启动
Wan-Lynx,面部信息迁移图生视频,人脸一致性保持,6步采样,支持5090新卡,支持批量任务,Comfyui,工作流
Wan-Lynx,面部信息迁移图生视频,人脸一致性保持,6步采样,支持5090新卡,支持批量任务,Comfyui,工作流
0/小时
VL视觉理解
Ming-UniVision
Ming-UniVision
2
@十字鱼
十字鱼认证作者
15
4H
更新时间2026-02-02
支持自启动
使用连续统一分词器进行联合图像理解和生成
使用连续统一分词器进行联合图像理解和生成
0/小时
Wan视频编辑ComfyUI
Wan2.2-N版-文生图生视频VACE-10流整合
Wan2.2-N版-文生图生视频VACE-10流整合
30
@AI-KSK
AI-KSK认证作者
294
775H
更新时间2026-02-02
支持自启动
Smooth&Remix&AllInOne-N版合并模型的一键镜像
Smooth&Remix&AllInOne-N版合并模型的一键镜像
0/小时
AI应用
PDFMathTranslate
PDFMathTranslate
4
@十字鱼
十字鱼认证作者
5
3H
更新时间2026-02-02
支持自启动
基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务
基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务
0/小时
IndexTTS语音合成
indextts2-IndexTTS2 最新 V23 版本的全面升级
indextts2-IndexTTS2 最新 V23 版本的全面升级
24
@科哥AIGC
科哥AIGC认证作者
330
1071H
更新时间2026-02-02
IndexTTS2 最新 V23 版本的全面升级
IndexTTS2 最新 V23 版本的全面升级
0/小时
混元3D生成
腾讯混元3d-Omni在线生成Hunyuan3D-Omni轻量版3d模型生成命令行版 构建by科哥
腾讯混元3d-Omni在线生成Hunyuan3D-Omni轻量版3d模型生成命令行版 构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
27
351H
更新时间2026-02-02
24gb可以运行该应用
24gb可以运行该应用
0/小时
视频生成
Ovi 来啦!开源免费,体验一下类似 SORA 2 的视频+音频生成
Ovi 来啦!开源免费,体验一下类似 SORA 2 的视频+音频生成
6
@AI-KSK
AI-KSK认证作者
57
20H
更新时间2026-02-02
认识一下 Ovi —— 一个很像 SORA 2 的免费 AI 模型。它能生成带声音的完整视频,让你探索下一代 AI 创作的无限可能!
认识一下 Ovi —— 一个很像 SORA 2 的免费 AI 模型。它能生成带声音的完整视频,让你探索下一代 AI 创作的无限可能!
0/小时
混元图片生成
HunyuanImage-3.0
HunyuanImage-3.0
11
@十字鱼
十字鱼认证作者
51
61H
更新时间2025-10-06
支持自启动
腾讯开源80B图像生成模型 原生多模态 自回归框架
腾讯开源80B图像生成模型 原生多模态 自回归框架
0/小时
视频生成
Ovi 音频视频生成
Ovi 音频视频生成
10
@十字鱼
十字鱼认证作者
55
34H
更新时间2025-10-20
支持自启动
用于音频视频生成的双主干交叉模态融合
用于音频视频生成的双主干交叉模态融合
0/小时
语音合成
GPT-SoVITS
GPT-SoVITS
59
@aiguoliuguo
aiguoliuguo认证作者
2238
10501H
更新时间2026-02-03
GPT-SoVITS-V4(v2Pro,v2ProPlus),所需素材少,训练耗时短,情绪可控。
GPT-SoVITS-V4(v2Pro,v2ProPlus),所需素材少,训练耗时短,情绪可控。
0/小时
语音分离
MSST
MSST
28
@aiguoliuguo
aiguoliuguo认证作者
1740
3335H
更新时间2025-10-05
MSST-webUI版本,更简单,加入一键处理,效率更高,更好用的干声分离以及去和声混响的项目,可以作为传统UVR的上位替代,并兼容UVR的模型,简单且快。
MSST-webUI版本,更简单,加入一键处理,效率更高,更好用的干声分离以及去和声混响的项目,可以作为传统UVR的上位替代,并兼容UVR的模型,简单且快。
0/小时
IndexTTS语音合成
index-tts2高质量声音克隆语音合成软件
index-tts2高质量声音克隆语音合成软件
31
@AI画师大阳
AI画师大阳认证作者
537
2545H
更新时间2026-02-02
支持自启动
index-tts2高质量声音克隆语音合成软件
index-tts2高质量声音克隆语音合成软件
0/小时
Wan视频编辑ComfyUI
WAN22增强版-eddy-ode采样,文生视频/图生视频
WAN22增强版-eddy-ode采样,文生视频/图生视频
18
@AI-KSK
AI-KSK认证作者
202
220H
更新时间2026-02-02
视频生产更精细、更流畅、更智能、更快速、更具视觉表现力。
视频生产更精细、更流畅、更智能、更快速、更具视觉表现力。
0/小时
混元3D生成
腾讯混元3D2.1生成3d模型hunyuan 3d 构建by科哥
腾讯混元3D2.1生成3d模型hunyuan 3d 构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
27
82H
更新时间2026-02-02
24gb最低显存
24gb最低显存
0/小时
图片编辑
超强图片编辑工具OmniGen2,一句话修改图片内容
超强图片编辑工具OmniGen2,一句话修改图片内容
11
@AI画师大阳
AI画师大阳认证作者
95
83H
更新时间2026-02-02
支持自启动
一句话快速精准修改图片内容
一句话快速精准修改图片内容
0/小时
数字人
StableAvatar快速生成对口型数字人视频  12gb显卡爆改by科哥
StableAvatar快速生成对口型数字人视频 12gb显卡爆改by科哥
7
@科哥AIGC
科哥AIGC认证作者
61
55H
更新时间2025-09-30
对口型数字人视频wan2.1优化项目 12gb显卡爆改by科哥
对口型数字人视频wan2.1优化项目 12gb显卡爆改by科哥
0/小时
混元3D生成
hunyuan3D part腾讯开源3D模型分离图片3D建模应用 汉化构建By科哥
hunyuan3D part腾讯开源3D模型分离图片3D建模应用 汉化构建By科哥
0
@科哥AIGC
科哥AIGC认证作者
6
1H
更新时间2026-02-02
需要80gb显卡使用A800测试通过。
需要80gb显卡使用A800测试通过。
0/小时
ComfyUI视频生成
Lynx字节跳动高保真人脸视频生成方法comfyUI镜像
Lynx字节跳动高保真人脸视频生成方法comfyUI镜像
2
@smthem
7
22H
更新时间2026-02-02
非量化版LYNX,非KJ版,24G显存才能跑
非量化版LYNX,非KJ版,24G显存才能跑
0/小时
InfiniteTalkIndexTTS数字人
顶级中文数字人套件-Easy-IndexTTS2 · FireRedTTS · InfiniteTalk
顶级中文数字人套件-Easy-IndexTTS2 · FireRedTTS · InfiniteTalk
10
@AI-KSK
AI-KSK认证作者
119
1068H
更新时间2026-02-02
克隆目标声音,保留音色、语气与情感;将静态图片与音频驱动生成动态视频。
克隆目标声音,保留音色、语气与情感;将静态图片与音频驱动生成动态视频。
0/小时
IndexTTS语音合成
IndexTTS-V2  DeepSpeed编译加速版
IndexTTS-V2 DeepSpeed编译加速版
86
@刘悦的技术博客
刘悦的技术博客认证作者
1823
6721H
更新时间2026-02-02
支持自启动
支持异步批量任务,支持接口API并发请求,语速调节,音色保存,情绪控制
支持异步批量任务,支持接口API并发请求,语速调节,音色保存,情绪控制
0/小时
推理框架
bunkws
bunkws
1
@杭州国芯微
23
1710H
更新时间2026-02-02
Bunkws 是杭州国芯微自研的一款端到端唤醒词训练框架
Bunkws 是杭州国芯微自研的一款端到端唤醒词训练框架
0/小时
Wan视频编辑
Wan-2.2-Animate视频主体替换,支持批量任务队列
Wan-2.2-Animate视频主体替换,支持批量任务队列
38
@刘悦的技术博客
刘悦的技术博客认证作者
288
276H
更新时间2026-02-02
支持自启动
Wan-2.2-Animate视频主体替换,支持批量任务队列,初始化后,等待服务启动,大概2分钟左右,随后点击SD-WEBUI按钮即可
Wan-2.2-Animate视频主体替换,支持批量任务队列,初始化后,等待服务启动,大概2分钟左右,随后点击SD-WEBUI按钮即可
0/小时
IndexTTS语音合成
Niugee-IndexTTS-V2
Niugee-IndexTTS-V2
32
@NiuGee
NiuGee认证作者
255
634H
更新时间2026-02-02
支持自启动
目前情感效果最好,没有幻觉的文本转语音AI工具
目前情感效果最好,没有幻觉的文本转语音AI工具
0/小时
语音合成
VoxCPM-小而美的TTS
VoxCPM-小而美的TTS
5
@鹄仙
鹄仙认证作者
34
288H
更新时间2026-02-02
比IndexTTS更小的语音生成模型,支持语音克隆、文生语音
比IndexTTS更小的语音生成模型,支持语音克隆、文生语音
0/小时
Qwen-Image图片生成ComfyUI
Qwen-Image-Edit-2509 三图融合,4步采样
Qwen-Image-Edit-2509 三图融合,4步采样
22
@刘悦的技术博客
刘悦的技术博客认证作者
142
206H
更新时间2026-02-02
支持自启动
Qwen-Image-Edit-2509三图融合.4步采样,支持自定义多重Lora嵌套,AI图片编辑修改,支持批量任务队列
Qwen-Image-Edit-2509三图融合.4步采样,支持自定义多重Lora嵌套,AI图片编辑修改,支持批量任务队列
0/小时
ComfyUI
培训师的comfyUI
培训师的comfyUI
5
@鹄仙
鹄仙认证作者
60
399H
更新时间2026-02-02
组合了图像生成、视频生成、数字人的面向培训师群体的ComfyUI
组合了图像生成、视频生成、数字人的面向培训师群体的ComfyUI
0/小时
WanQwen-Image视频生成
Qwen edit+Wan2.2 出图+视频的神! 平替Banana
Qwen edit+Wan2.2 出图+视频的神! 平替Banana
26
@不止设计工作室
266
1430H
更新时间2026-02-02
qwen edit满血模型部署!替代banana,结合comfyui工作流轻松实现出图、p图、视频生成
qwen edit满血模型部署!替代banana,结合comfyui工作流轻松实现出图、p图、视频生成
0/小时
数字人
MultiTalk-生成音乐MV
MultiTalk-生成音乐MV
28
@乔大峰
乔大峰认证作者
70
152H
更新时间2026-02-02
支持自启动
MultiTalk-只需上传图片和音频,帮你生成音乐MV
MultiTalk-只需上传图片和音频,帮你生成音乐MV
0/小时
Wan视频编辑ComfyUI
WanAnimate
WanAnimate
16
@十字鱼
十字鱼认证作者
95
114H
更新时间2025-11-06
支持自启动
Wan2.2-Animate 动作迁移&人物替换 迟来的AnimateAnyone
Wan2.2-Animate 动作迁移&人物替换 迟来的AnimateAnyone
0/小时
Wan视频编辑ComfyUI
Wan-Animate-ComfyUI:角色动画生成与角色替换
Wan-Animate-ComfyUI:角色动画生成与角色替换
10
@AI-KSK
AI-KSK认证作者
98
256H
更新时间2026-02-02
Wan-Animate 是阿里巴巴通义实验室提出的一个统一框架,用于 角色动画生成与角色替换。
Wan-Animate 是阿里巴巴通义实验室提出的一个统一框架,用于 角色动画生成与角色替换。
0/小时
视频超分
SeedVR2-视频高清放大工作流
SeedVR2-视频高清放大工作流
20
@科哥AIGC
科哥AIGC认证作者
9
16H
更新时间2026-02-02
支持自启动
二次高清放大视频!3b、7b模型gguf量化加速版 不易爆显存 镜像by科哥
二次高清放大视频!3b、7b模型gguf量化加速版 不易爆显存 镜像by科哥
0/小时
语音合成
VoxCPM-来自面壁智能和清华的语音生成模型
VoxCPM-来自面壁智能和清华的语音生成模型
3
@科哥AIGC
科哥AIGC认证作者
23
17H
更新时间2026-02-02
支持自启动
几秒音频即可克隆声音 构建by科哥
几秒音频即可克隆声音 构建by科哥
0/小时
Wan视频生成
Wan2.2官方VACE-ComfyUI七大视频生成编辑工作流
Wan2.2官方VACE-ComfyUI七大视频生成编辑工作流
8
@AI-KSK
AI-KSK认证作者
138
311H
更新时间2026-02-02
开源的​​统一视频生成与编辑框架​​,Wan2.2-VACE-Fun​​一个模型即可支持文生视频、图生视频、视频编辑、局部修改、等多项任务
开源的​​统一视频生成与编辑框架​​,Wan2.2-VACE-Fun​​一个模型即可支持文生视频、图生视频、视频编辑、局部修改、等多项任务
0/小时
数字人视频生成
humo-HuMo清华大学联合字节推出的多模态视频生成框架 二改by科哥
humo-HuMo清华大学联合字节推出的多模态视频生成框架 二改by科哥
6
@科哥AIGC
科哥AIGC认证作者
15
55H
更新时间2026-02-02
支持自启动
优化1.7b可以24gb显存运行起来了!
优化1.7b可以24gb显存运行起来了!
0/小时
语音合成
FireRedTTS2
FireRedTTS2
9
@十字鱼
十字鱼认证作者
43
754H
更新时间2026-02-02
支持自启动
面向播客和聊天机器人的长对话语音生成
面向播客和聊天机器人的长对话语音生成
0/小时
Wan视频生成ComfyUI
阿里Wan2.2-14B图生视频超高画质-Q8
阿里Wan2.2-14B图生视频超高画质-Q8
65
@与AI同行
与AI同行认证作者
826
4271H
更新时间2026-02-02
支持自启动
AI生成视频Wan2.2图生视频,使用量化版Wan2.2-I2V-A14B模型
AI生成视频Wan2.2图生视频,使用量化版Wan2.2-I2V-A14B模型
0/小时
Wan视频生成
Wan-2.2-Fun-Vace视频主体替换
Wan-2.2-Fun-Vace视频主体替换
10
@刘悦的技术博客
刘悦的技术博客认证作者
50
61H
更新时间2026-02-02
支持自启动
Wan-2.2-Fun-Vace,视频主体替换、跳舞视频主体替换、广告模特替换
Wan-2.2-Fun-Vace,视频主体替换、跳舞视频主体替换、广告模特替换
0/小时
数字人视频生成
HuMo: 基于协作多模态条件的人体中心视频生成
HuMo: 基于协作多模态条件的人体中心视频生成
6
@Ikaros
13
17H
更新时间2026-02-02
HuMo是一个统一的、以人为中心的视频生成框架,旨在从多模态输入(包括文本、图像和音频)生成高质量、细粒度且可控的人体视频。它支持强大的文本提示跟随、一致的主体保持和同步的音频驱动动作。
HuMo是一个统一的、以人为中心的视频生成框架,旨在从多模态输入(包括文本、图像和音频)生成高质量、细粒度且可控的人体视频。它支持强大的文本提示跟随、一致的主体保持和同步的音频驱动动作。
0/小时
语音合成语音识别
FireRedASR语音识别、语音转文字 构建by科哥
FireRedASR语音识别、语音转文字 构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
22
14H
更新时间2026-02-02
支持自启动
FireRedASR语音识别系统语音转文字语音转文本千问开源 构建by科哥
FireRedASR语音识别系统语音转文字语音转文本千问开源 构建by科哥
0/小时
语音识别
FunASR在线语音识别/语音生成   二次开发构建by科哥
FunASR在线语音识别/语音生成 二次开发构建by科哥
1
@科哥AIGC
科哥AIGC认证作者
26
30H
更新时间2026-02-02
来自阿里开源 科哥二次构建开发webui
来自阿里开源 科哥二次构建开发webui
0/小时
语音合成
VibeVoice – 微软推出的开源文本转语音模型 汉化构建by科哥
VibeVoice – 微软推出的开源文本转语音模型 汉化构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
24
12H
更新时间2026-02-02
支持自启动
可以一次性合成4人的对话播客
可以一次性合成4人的对话播客
0/小时
SD
SD高质量CG绘画
SD高质量CG绘画
9
@AI画师大阳
AI画师大阳认证作者
137
450H
更新时间2025-09-17
支持自启动
SD高质量CG绘画
SD高质量CG绘画
0/小时
其他
alchemy
alchemy
1
@杭州国芯微
0
0H
更新时间2026-02-02
用于训练alchemy kws模型
用于训练alchemy kws模型
0/小时
目标检测图像分割
SAM 2:图像和视频中的任何内容分割
SAM 2:图像和视频中的任何内容分割
1
@Ikaros
9
9H
更新时间2026-02-02
SAM 2:图像和视频中的任何内容分割。比如切出视频中的人物、物体等,可以对目标和背景进行扣除换色等效果设置。
SAM 2:图像和视频中的任何内容分割。比如切出视频中的人物、物体等,可以对目标和背景进行扣除换色等效果设置。
0/小时
数字人
AnchorCrafter:通过人体-物体交互视频生成动画化您的产品销售数字人
AnchorCrafter:通过人体-物体交互视频生成动画化您的产品销售数字人
9
@Ikaros
20
35H
更新时间2026-02-02
AnchorCrafter,生成带货数字人视频。通过人体-物体交互视频生成动画化您的产品销售数字人
AnchorCrafter,生成带货数字人视频。通过人体-物体交互视频生成动画化您的产品销售数字人
0/小时
数字人
OpenAvatarChat——十字鱼镜像
OpenAvatarChat——十字鱼镜像
59
@十字鱼
十字鱼认证作者
557
6617H
更新时间2026-02-03
支持自启动
阿里开源实时交互数字。 模块化的交互数字人对话实现,能够在单台PC上运行完整功能。
阿里开源实时交互数字。 模块化的交互数字人对话实现,能够在单台PC上运行完整功能。
0/小时
数字人视频生成
HuMo
HuMo
5
@十字鱼
十字鱼认证作者
9
10H
更新时间2026-02-02
支持自启动
以人为中心的视频生成方法——协作多模态条件化
以人为中心的视频生成方法——协作多模态条件化
0/小时
语音合成
超强AI音频变声器SeedVC-2.1
超强AI音频变声器SeedVC-2.1
20
@与AI同行
与AI同行认证作者
191
329H
更新时间2026-02-02
支持自启动
超强AI音频变声器SeedVC-2.1
超强AI音频变声器SeedVC-2.1
0/小时
IndexTTS语音合成
最强AI音色克隆IndexTTS-V2-批量生成
最强AI音色克隆IndexTTS-V2-批量生成
159
@与AI同行
与AI同行认证作者
1754
5047H
更新时间2026-02-02
支持自启动
最强AI音色克隆IndexTTS-V2-批量生成
最强AI音色克隆IndexTTS-V2-批量生成
0/小时
数字人
AnchorCrafter-WebUI
AnchorCrafter-WebUI
13
@乔大峰
乔大峰认证作者
8
2H
更新时间2026-02-02
支持自启动
开箱即用,生成真实的带货视频
开箱即用,生成真实的带货视频
0/小时
IndexTTS语音合成
index-tts2 声音克隆
index-tts2 声音克隆
28
@有趣的80后程序员
有趣的80后程序员认证作者
301
1522H
更新时间2025-11-07
让ai声音更真实,更自然,更有温度
让ai声音更真实,更自然,更有温度
0/小时
视频生成
MAGI-1
MAGI-1
1
@苍耳阿猫
苍耳阿猫认证作者
5
9H
更新时间2026-02-02
MAGI-1,一个通过 自回归 预测视频块序列来生成视频的世界模型
MAGI-1,一个通过 自回归 预测视频块序列来生成视频的世界模型
0/小时
视频编辑
大鹏最强FusionX动作迁移(和真人一模一样)
大鹏最强FusionX动作迁移(和真人一模一样)
39
@大鹏
大鹏认证作者
217
287H
更新时间2026-02-02
支持自启动
这个版本无敌了,出的效果兄弟们话不多说直接看图
这个版本无敌了,出的效果兄弟们话不多说直接看图
0/小时
IndexTTS语音合成
IndexTTS2 模型镜像 汉化构建by科哥
IndexTTS2 模型镜像 汉化构建by科哥
20
@科哥AIGC
科哥AIGC认证作者
190
303H
更新时间2026-02-02
B站开源的indextts2.0版本,强势来袭!
B站开源的indextts2.0版本,强势来袭!
0/小时
语音识别
最好用的中文音频视频语音识别转文本字幕软件FunASR
最好用的中文音频视频语音识别转文本字幕软件FunASR
6
@AI画师大阳
AI画师大阳认证作者
79
312H
更新时间2026-02-02
支持自启动
将音频视频语音识别转为文本文件和SRT字幕文件
将音频视频语音识别转为文本文件和SRT字幕文件
0/小时
数字人
HeyGem数字人优化加速版,GFPGAN面部超分增强
HeyGem数字人优化加速版,GFPGAN面部超分增强
36
@刘悦的技术博客
刘悦的技术博客认证作者
539
1237H
更新时间2025-11-14
支持自启动
HeyGem数字人优化加速版,GFPGAN面部超分增强,批量任务,修复多面部报错,推理速度1比2,唱歌数字人
HeyGem数字人优化加速版,GFPGAN面部超分增强,批量任务,修复多面部报错,推理速度1比2,唱歌数字人
0/小时
Wan视频生成
Wan2.2-图生视频-批量任务队列版本
Wan2.2-图生视频-批量任务队列版本
25
@刘悦的技术博客
刘悦的技术博客认证作者
479
1572H
更新时间2026-02-02
支持自启动
Wan2.2-图生视频-批量任务队列版本-自定义lora-自定义首尾帧
Wan2.2-图生视频-批量任务队列版本-自定义lora-自定义首尾帧
0/小时
IndexTTS语音合成
indexTTS2
indexTTS2
9
@白菜工厂1145号员工
白菜工厂1145号员工认证作者
165
423H
更新时间2026-02-02
支持自启动
无需训练,开源最强zero shot语音合成
无需训练,开源最强zero shot语音合成
0/小时
混元视频生成
HunyuanVideo-Foley
HunyuanVideo-Foley
4
@鹄仙
鹄仙认证作者
22
49H
更新时间2026-02-02
为视频添加音效
为视频添加音效
0/小时
IndexTTS语音合成
Index-TTS2--B站9月8日最新开源语音克隆模型ComfyUI版
Index-TTS2--B站9月8日最新开源语音克隆模型ComfyUI版
8
@社恐的知识树
社恐的知识树认证作者
135
286H
更新时间2025-09-12
Index-tts2-B站最新开源语音大模型:声音克隆,情感复刻,多人对话,ComfyUI版
Index-tts2-B站最新开源语音大模型:声音克隆,情感复刻,多人对话,ComfyUI版
0/小时
ComfyUI视频编辑
换装+换脸+换一切+动作迁移+图片视频N合一
换装+换脸+换一切+动作迁移+图片视频N合一
46
@大鹏
大鹏认证作者
363
453H
更新时间2026-02-02
支持自启动
换装+换脸+换一切+动作迁移+图片视频N合一,最快wan2.2加速,最新kontext换一切,最强换装,最强换姿态迁移图片视频方案+最速换脸
换装+换脸+换一切+动作迁移+图片视频N合一,最快wan2.2加速,最新kontext换一切,最强换装,最强换姿态迁移图片视频方案+最速换脸
0/小时
视频编辑
Facefusion3.4最新官方原版 图片换脸视频换脸高清图片 构建By科哥
Facefusion3.4最新官方原版 图片换脸视频换脸高清图片 构建By科哥
4
@科哥AIGC
科哥AIGC认证作者
51
64H
更新时间2025-09-12
支持自启动
Facefusion3.4最新3.4官方原本全部模型已经下载11gb!!!
Facefusion3.4最新3.4官方原本全部模型已经下载11gb!!!
0/小时
Qwen-Image图片生成ComfyUI
musubi-qwen-image lora 训练镜像
musubi-qwen-image lora 训练镜像
21
@有趣的80后程序员
有趣的80后程序员认证作者
163
712H
更新时间2025-09-09
最简单占用资源最小的lora训练镜像
最简单占用资源最小的lora训练镜像
0/小时
Wan视频生成
Wan2.2-图生视频-灵活海量批量任务
Wan2.2-图生视频-灵活海量批量任务
13
@星悦
星悦认证作者
87
87H
更新时间2026-02-02
支持自启动
Wan2.2图生视频灵活批量任务。启动后自动运行。1.在本地修改图片文件名。2.上传到云端文件夹【待处理图片】。3.稍等,下载视频文件夹视频【生成结果】。
Wan2.2图生视频灵活批量任务。启动后自动运行。1.在本地修改图片文件名。2.上传到云端文件夹【待处理图片】。3.稍等,下载视频文件夹视频【生成结果】。
0/小时
其他
cuda124-py310-torch2.7基础镜像版本
cuda124-py310-torch2.7基础镜像版本
3
@科哥AIGC
科哥AIGC认证作者
20
2684H
更新时间2026-02-02
cuda124-py310-torch2.7基础镜像版本
cuda124-py310-torch2.7基础镜像版本
0/小时
Wan数字人
Wan2.2-S2V-14B: 音频驱动的电影视频生成
Wan2.2-S2V-14B: 音频驱动的电影视频生成
0
@AI画师大阳
AI画师大阳认证作者
78
73H
更新时间2026-02-02
支持自启动
通过音频驱动的图片转视频生成软件,支持声音克隆功能
通过音频驱动的图片转视频生成软件,支持声音克隆功能
0/小时
图片生成
USO字节开源风格随心主体如真打造创意与真实完美统一的AI生成新标准 汉化构建by科哥
USO字节开源风格随心主体如真打造创意与真实完美统一的AI生成新标准 汉化构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
12
64H
更新时间2026-02-02
主题风格一致,创意无限,配合lora
主题风格一致,创意无限,配合lora
0/小时
Wan数字人
WAN2.2-S2V最新版数字人+动作参考
WAN2.2-S2V最新版数字人+动作参考
9
@社恐的知识树
社恐的知识树认证作者
88
95H
更新时间2025-09-06
阿里开源音+图片+动作参考生成视频模型,Comfyui官方最终优化版工作流
阿里开源音+图片+动作参考生成视频模型,Comfyui官方最终优化版工作流
0/小时
视频超分
最强AI高清修复-SeedVR2-图片和视频高清放大
最强AI高清修复-SeedVR2-图片和视频高清放大
65
@与AI同行
与AI同行认证作者
980
4402H
更新时间2026-02-02
支持自启动
最强AI高清修复-SeedVR2-图片和视频高清放大
最强AI高清修复-SeedVR2-图片和视频高清放大
0/小时
视频编辑
大鹏姿态迁移,图片,视频,换装,图生视频四合一
大鹏姿态迁移,图片,视频,换装,图生视频四合一
20
@大鹏
大鹏认证作者
125
179H
更新时间2026-02-02
支持自启动
高质量工作流,点开即可运行
高质量工作流,点开即可运行
0/小时
ComfyUI视频生成
Work-Fisher短片制作整合包
Work-Fisher短片制作整合包
15
@Work-Fisher
78
114H
更新时间2026-02-02
创造属于你的AI短片
创造属于你的AI短片
0/小时
AI应用
PDF文档翻译器BabelDOC
PDF文档翻译器BabelDOC
2
@AI画师大阳
AI画师大阳认证作者
76
325H
更新时间2026-02-02
基于强大在线大语言模型的PDF文档翻译器
基于强大在线大语言模型的PDF文档翻译器
0/小时
ComfyUIFlux
牛哥的专属ComfyUI大集合版-V1
牛哥的专属ComfyUI大集合版-V1
14
@NiuGee
NiuGee认证作者
95
188H
更新时间2026-02-02
牛哥的专属ComfyUI大集合版本,功能持续扩充,点击即用
牛哥的专属ComfyUI大集合版本,功能持续扩充,点击即用
0/小时
混元3D生成
HunyuanWorld-WebUI fp8量化魔改版 开发构建by科哥
HunyuanWorld-WebUI fp8量化魔改版 开发构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
15
82H
更新时间2026-02-02
HunyuanWorld 3d世界生成系统 腾讯开源
HunyuanWorld 3d世界生成系统 腾讯开源
0/小时
混元AI音乐
最强AI视频配音-腾讯Hunyuan-Foley
最强AI视频配音-腾讯Hunyuan-Foley
18
@与AI同行
与AI同行认证作者
99
155H
更新时间2026-02-02
最强AI视频配音-腾讯Hunyuan-Foley
最强AI视频配音-腾讯Hunyuan-Foley
0/小时
AI应用语音识别
音频视频语音识别转文本字幕faster-whisper 1.2
音频视频语音识别转文本字幕faster-whisper 1.2
13
@AI画师大阳
AI画师大阳认证作者
162
489H
更新时间2026-02-02
将音频或视频文件语音识别转为文本文件或字幕文件
将音频或视频文件语音识别转为文本文件或字幕文件
0/小时
三维重建
Unique3D在线生成3D模型  汉化构建By科哥
Unique3D在线生成3D模型 汉化构建By科哥
2
@科哥AIGC
科哥AIGC认证作者
22
52H
更新时间2026-02-02
一张图片就可以生成3D glb模型
一张图片就可以生成3D glb模型
0/小时
ComfyUI图片生成
gen_backview
gen_backview
0
@frankyxu
7
1055H
更新时间2026-02-02
gen_backview bug 修复
gen_backview bug 修复
0/小时
Wan视频生成
Wan2.2 S2V 数字人 阿里通义千问出品
Wan2.2 S2V 数字人 阿里通义千问出品
15
@十字鱼
十字鱼认证作者
169
313H
更新时间2026-02-02
Wan2.2 S2V 数字人 阿里通义千问出品 这是一个音频驱动的电影视频生成模型
Wan2.2 S2V 数字人 阿里通义千问出品 这是一个音频驱动的电影视频生成模型
0/小时
混元视频生成
HunyuanVideo-Foley腾讯开源视频音效配音文本配音 汉化构建by科哥
HunyuanVideo-Foley腾讯开源视频音效配音文本配音 汉化构建by科哥
3
@科哥AIGC
科哥AIGC认证作者
35
41H
更新时间2025-09-12
根据一段文本或者视频,生成你的配音
根据一段文本或者视频,生成你的配音
0/小时
混元AI音乐
HunyuanVideo-Foley 腾讯混元开源音效模型
HunyuanVideo-Foley 腾讯混元开源音效模型
2
@十字鱼
十字鱼认证作者
10
8H
更新时间2025-09-03
一键视频配音,完美自动化
一键视频配音,完美自动化
0/小时
ComfyUI
DelikeAI 应用镜像
DelikeAI 应用镜像
1
@Delike乐仔
13
61H
更新时间2026-02-02
DelikeAI 应用镜像
DelikeAI 应用镜像
0/小时
混元视频生成
HunyuanVideoFoley-AI视频配乐
HunyuanVideoFoley-AI视频配乐
11
@匹夫
匹夫认证作者
91
159H
更新时间2026-02-02
支持自启动
HunyuanVideoFoley-能自动给视频配乐的AI模型
HunyuanVideoFoley-能自动给视频配乐的AI模型
0/小时
Wan视频生成
Wan2GP——十字鱼镜像
Wan2GP——十字鱼镜像
3
@十字鱼
十字鱼认证作者
39
169H
更新时间2026-02-02
Wan2GP,高度优化的视频生成项目,支持Wan、Hunyuan和LTX等相关模型
Wan2GP,高度优化的视频生成项目,支持Wan、Hunyuan和LTX等相关模型
0/小时
数字人
HeyGem-webui在线数字人视频口播数字人 构建bu科哥
HeyGem-webui在线数字人视频口播数字人 构建bu科哥
8
@科哥AIGC
科哥AIGC认证作者
125
109H
更新时间2026-02-02
一键运行优化版,开机自启动
一键运行优化版,开机自启动
0/小时
数字人ComfyUI
AI换人术一键将跳舞视频主角变成你!(Stand-In + VACE + ComfyUI 镜像版)
AI换人术一键将跳舞视频主角变成你!(Stand-In + VACE + ComfyUI 镜像版)
18
@电磁波Studio
电磁波Studio认证作者
216
413H
更新时间2026-02-02
AI换人术一键将跳舞视频主角变成你!(Stand-In + VACE + ComfyUI 镜像版)
AI换人术一键将跳舞视频主角变成你!(Stand-In + VACE + ComfyUI 镜像版)
0/小时
WanLora训练
musubi-tunner-wan2.2训练镜像
musubi-tunner-wan2.2训练镜像
29
@有趣的80后程序员
有趣的80后程序员认证作者
357
2207H
更新时间2025-10-28
musubi-tunner-wan2.2 lora 训练镜像,内置模型数据集
musubi-tunner-wan2.2 lora 训练镜像,内置模型数据集
0/小时
InfiniteTalk数字人
InfiniteTalk数字人,4步采样,无限时长,说话数字人,唱歌数字人
InfiniteTalk数字人,4步采样,无限时长,说话数字人,唱歌数字人
56
@刘悦的技术博客
刘悦的技术博客认证作者
1386
2417H
更新时间2026-02-02
InfiniteTalk数字人,4步采样,无限时长,说话数字人,唱歌数字人,支持反推关键词,基于comfyui工作流
InfiniteTalk数字人,4步采样,无限时长,说话数字人,唱歌数字人,支持反推关键词,基于comfyui工作流
0/小时
Qwen-Image
Qwen-image-千问合集
Qwen-image-千问合集
3
@虚幻1024
74
333H
更新时间2026-02-02
ComfyUI - qwen-image-千问合集
ComfyUI - qwen-image-千问合集
0/小时
3D生成三维重建
SpatialGen - 3D场景生成器
SpatialGen - 3D场景生成器
0
@科哥AIGC
科哥AIGC认证作者
6
11H
更新时间2026-02-02
基于多视角多模态扩散模型的3D场景生成工具 支持图像到3D场景和文本到3D场景的生成
基于多视角多模态扩散模型的3D场景生成工具 支持图像到3D场景和文本到3D场景的生成
0/小时
语音合成
ThinkSound视频配音
ThinkSound视频配音
1
@科哥AIGC
科哥AIGC认证作者
25
113H
更新时间2026-02-02
支持自启动
ThinkSound视频配音
ThinkSound视频配音
0/小时
Wan视频生成
wan2.2-S2V数字人,支持批量任务队列
wan2.2-S2V数字人,支持批量任务队列
12
@刘悦的技术博客
刘悦的技术博客认证作者
125
123H
更新时间2026-02-02
支持自启动
支持批量任务队列,说话数字人,唱歌数字人,支持反推关键词,基于comfyui工作流
支持批量任务队列,说话数字人,唱歌数字人,支持反推关键词,基于comfyui工作流
0/小时
Wan视频生成
Wan2.2-S2V数字人-对口型-音频驱动视频生成
Wan2.2-S2V数字人-对口型-音频驱动视频生成
15
@AI-KSK
AI-KSK认证作者
177
252H
更新时间2026-02-02
Wan2.2-S2V数字人,通过一张静态图片和一段音频(如说话或唱歌)自动生成高质量、口型同步的电影级视频。
Wan2.2-S2V数字人,通过一张静态图片和一段音频(如说话或唱歌)自动生成高质量、口型同步的电影级视频。
0/小时
ComfyUI图片编辑
视频人物主体替换
视频人物主体替换
5
@AI画师大阳
AI画师大阳认证作者
42
24H
更新时间2025-08-27
支持自启动
用一张图片中人物替换视频中的人物主体
用一张图片中人物替换视频中的人物主体
0/小时
Qwen-Image图片生成
Qwen-Image-Edit-多图融合-面部一致性保持
Qwen-Image-Edit-多图融合-面部一致性保持
13
@刘悦的技术博客
刘悦的技术博客认证作者
109
293H
更新时间2026-02-02
支持自启动
Qwen-Image-Edit-多图融合-面部一致性保持,基于comfyui工作流
Qwen-Image-Edit-多图融合-面部一致性保持,基于comfyui工作流
0/小时
WanLora训练
Wan2.2-Lora训练,文生视频与图生视频Lora训练,AIToolkit
Wan2.2-Lora训练,文生视频与图生视频Lora训练,AIToolkit
22
@AI-KSK
AI-KSK认证作者
261
2577H
更新时间2026-02-02
用做训练Wan2.2文生视频或者/图生视频的 LoRA 模型
用做训练Wan2.2文生视频或者/图生视频的 LoRA 模型
0/小时
OCR识别
RapidOCR_API_Torch_GPU
RapidOCR_API_Torch_GPU
1
@SWHL
SWHL认证作者
5
10H
更新时间2026-02-02
基于 ONNXRuntime、OpenVINO、PaddlePaddle 和 PyTorch 的超棒 OCR 多编程语言工具包。
基于 ONNXRuntime、OpenVINO、PaddlePaddle 和 PyTorch 的超棒 OCR 多编程语言工具包。
0/小时
Qwen-Image图片生成
最强AI图片QwenImage-Edit-WebUI-支持Lora
最强AI图片QwenImage-Edit-WebUI-支持Lora
13
@与AI同行
与AI同行认证作者
142
198H
更新时间2026-02-02
支持自启动
QwenImage+Edit-WebUI-支持Lora
QwenImage+Edit-WebUI-支持Lora
0/小时
VL视觉理解
VL视觉模型集合
VL视觉模型集合
1
@Ikaros
3
96H
更新时间2026-02-02
内置InternVL3-8B、GLM-4.1V-9B-Thinking、GLM-4.1V-9B-Thinking-bnb-4bit 一键启动API服务
内置InternVL3-8B、GLM-4.1V-9B-Thinking、GLM-4.1V-9B-Thinking-bnb-4bit 一键启动API服务
0/小时
混元
HunyuanWorld-1.0-lite 腾讯混元3D世界lite
HunyuanWorld-1.0-lite 腾讯混元3D世界lite
0
@科哥AIGC
科哥AIGC认证作者
8
18H
更新时间2026-02-02
快速打造你的3D游戏世界1.0,通过jupyterlab命令行运行生成3D游戏世界
快速打造你的3D游戏世界1.0,通过jupyterlab命令行运行生成3D游戏世界
0/小时
InfiniteTalk数字人
infinitetalk数字人工作流
infinitetalk数字人工作流
65
@匹夫
匹夫认证作者
1193
4570H
更新时间2026-02-02
支持自启动
infinitetalk,音频+图片参考、音频+视频参考工作流
infinitetalk,音频+图片参考、音频+视频参考工作流
0/小时
Wan视频生成ComfyUI
wan2.1文生视频动作迁移
wan2.1文生视频动作迁移
5
@AI画师大阳
AI画师大阳认证作者
109
193H
更新时间2026-02-02
支持自启动
模仿参考视频人物动作快速生成新的人物视频
模仿参考视频人物动作快速生成新的人物视频
0/小时
QwenVL视觉理解
Qwen3-Smvl多模态模型
Qwen3-Smvl多模态模型
1
@敢敢のwings
敢敢のwings认证作者
3
0H
更新时间2026-02-02
支持自启动
最近Huggingface团队发布了超小多模态模型SmolVLM2,可以做到端侧1GB显存推理。作者尝试当前中文小模型扛把子Qwen3与SmolVLM2直接微调拼接的想法
最近Huggingface团队发布了超小多模态模型SmolVLM2,可以做到端侧1GB显存推理。作者尝试当前中文小模型扛把子Qwen3与SmolVLM2直接微调拼接的想法
0/小时
推理框架
ms-swift轻量级微调模型框架
ms-swift轻量级微调模型框架
1
@bright
17
282H
更新时间2026-02-02
ms-swift是魔搭社区提供的大模型与多模态大模型微调部署框架.
ms-swift是魔搭社区提供的大模型与多模态大模型微调部署框架.
0/小时
Qwen-Image图片生成
Qwen-Image-Edit-4步采样
Qwen-Image-Edit-4步采样
4
@刘悦的技术博客
刘悦的技术博客认证作者
37
36H
更新时间2026-02-02
支持自启动
支持自定义Lora,AI图片编辑修改,支持反推提示词
支持自定义Lora,AI图片编辑修改,支持反推提示词
0/小时
语音合成
voice-changer
voice-changer
4
@aiguoliuguo
aiguoliuguo认证作者
171
6759H
更新时间2025-08-27
Voice Changer 云端在线变声器
Voice Changer 云端在线变声器
0/小时
ComfyUI
ComfyUI高清4K文生图
ComfyUI高清4K文生图
5
@AI画师大阳
AI画师大阳认证作者
79
344H
更新时间2026-02-02
支持自启动
ComfyUI版实现stable diffusion文生图高清放大人脸修复,直出4K
ComfyUI版实现stable diffusion文生图高清放大人脸修复,直出4K
0/小时
Wan视频生成ComfyUI
WAN2.2视频生产加速套件-ComfyUI
WAN2.2视频生产加速套件-ComfyUI
7
@AI-KSK
AI-KSK认证作者
73
174H
更新时间2026-02-02
WAN 2.2极速性能优化​10工作流多任务视频生成套件
WAN 2.2极速性能优化​10工作流多任务视频生成套件
0/小时
数字人
MultiTalk数字人优化加速版本-无限时长-唱歌/说话数字人
MultiTalk数字人优化加速版本-无限时长-唱歌/说话数字人
4
@刘悦的技术博客
刘悦的技术博客认证作者
140
1507H
更新时间2026-02-02
支持自启动
MultiTalk数字人优化加速版本-2步采样,对精度有要求修改采样数为4或者8
MultiTalk数字人优化加速版本-2步采样,对精度有要求修改采样数为4或者8
0/小时
视频超分
Seed-VR2-7B,图片视频超清放大,人体细节部位放大,支持批量任务
Seed-VR2-7B,图片视频超清放大,人体细节部位放大,支持批量任务
8
@刘悦的技术博客
刘悦的技术博客认证作者
100
102H
更新时间2025-11-14
支持自启动
Seed-VR2-7B,图片视频超清放大,人体细节部位放大,支持批量任务,初始化后,等待服务启动,大概2分钟,然后点击SD-WEBUI即可
Seed-VR2-7B,图片视频超清放大,人体细节部位放大,支持批量任务,初始化后,等待服务启动,大概2分钟,然后点击SD-WEBUI即可
0/小时
图像编辑AI应用
ben2抠图-在线去除图片、视频背景神器,绿幕抠图神器 构建By科哥
ben2抠图-在线去除图片、视频背景神器,绿幕抠图神器 构建By科哥
5
@科哥AIGC
科哥AIGC认证作者
74
137H
更新时间2025-09-12
支持自启动
ben2抠图webui在线抠视频除去图片视频背景神器绿幕抠图神器 构建By科哥
ben2抠图webui在线抠视频除去图片视频背景神器绿幕抠图神器 构建By科哥
0/小时
语音合成
CosyVoice界面优化版 可以粤语、普通、英语、日语、四川话、天津话、上海话等声音克隆
CosyVoice界面优化版 可以粤语、普通、英语、日语、四川话、天津话、上海话等声音克隆
9
@科哥AIGC
科哥AIGC认证作者
152
263H
更新时间2026-02-02
支持自启动
CosyVoice界面优化版 可以粤语、普通、英语、日语、四川话、天津话、上海话等声音克隆
CosyVoice界面优化版 可以粤语、普通、英语、日语、四川话、天津话、上海话等声音克隆
0/小时
图片编辑
DiffBIR一键图片老照片高清修复 汉化构建by科哥
DiffBIR一键图片老照片高清修复 汉化构建by科哥
3
@科哥AIGC
科哥AIGC认证作者
48
21H
更新时间2026-02-02
支持自启动
DiffBIR一键图片老照片高清修复 汉化构建by科哥
DiffBIR一键图片老照片高清修复 汉化构建by科哥
0/小时
视频编辑
最强人脸迁移生成视频Stand-In支持批量生成
最强人脸迁移生成视频Stand-In支持批量生成
11
@与AI同行
与AI同行认证作者
60
48H
更新时间2026-02-02
支持自启动
最强人脸迁移生成视频Stand-In-支持批量生成
最强人脸迁移生成视频Stand-In-支持批量生成
0/小时
数字人
HeyGem数字人加速优化版,解决多脸型报错
HeyGem数字人加速优化版,解决多脸型报错
5
@刘悦的技术博客
刘悦的技术博客认证作者
97
358H
更新时间2025-11-14
支持自启动
HeyGem数字人加速优化版,解决多脸型报错,解决没有脸报错,
HeyGem数字人加速优化版,解决多脸型报错,解决没有脸报错,
0/小时
图片编辑AI应用
HYPIR一个基于扩散生成的分数进行图像恢复的应用 汉化构建By科哥
HYPIR一个基于扩散生成的分数进行图像恢复的应用 汉化构建By科哥
2
@科哥AIGC
科哥AIGC认证作者
12
25H
更新时间2026-02-02
支持自启动
一键进行修复图片
一键进行修复图片
0/小时
AI电商
Magic-TryOn图片换装视频换装 构建by科哥
Magic-TryOn图片换装视频换装 构建by科哥
2
@科哥AIGC
科哥AIGC认证作者
17
66H
更新时间2025-09-12
Magic-TryOn图片换装视频换装 构建by科哥
Magic-TryOn图片换装视频换装 构建by科哥
0/小时
Wan视频生成
Wan2.2-图生视频-批量任务-自定义lora-自定义首尾帧
Wan2.2-图生视频-批量任务-自定义lora-自定义首尾帧
18
@刘悦的技术博客
刘悦的技术博客认证作者
334
1891H
更新时间2026-02-02
支持自启动
Wan2.2-图生视频-批量任务-自定义lora-自定义首尾帧
Wan2.2-图生视频-批量任务-自定义lora-自定义首尾帧
0/小时
推理框架
LlamaFactory纯净版-微调使用
LlamaFactory纯净版-微调使用
5
@WYSLOVE
154
2119H
更新时间2025-08-12
在conda环境下仅安装了LlamaFactory,以及llama.cpp,llama.cpp未编译,可用convert.py来导出gguf模型文件
在conda环境下仅安装了LlamaFactory,以及llama.cpp,llama.cpp未编译,可用convert.py来导出gguf模型文件
0.01/小时
数字人
RuoYI AI 二开AI数字人
RuoYI AI 二开AI数字人
2
@熊猫助手
熊猫助手认证作者
14
106H
更新时间2025-08-14
基于livetalking二开,实现AI数字人功能,支持coze智能体工作流对接,功能更加强大!
基于livetalking二开,实现AI数字人功能,支持coze智能体工作流对接,功能更加强大!
0/小时
视频生成
FramePack-F1 牛哥版
FramePack-F1 牛哥版
7
@NiuGee
NiuGee认证作者
74
236H
更新时间2026-02-02
FramePack F1 牛哥加速版
FramePack F1 牛哥加速版
0/小时
SD
秋叶丹炉(Lora-Scripts)1.12
秋叶丹炉(Lora-Scripts)1.12
18
@龙没耳
龙没耳认证作者
377
2432H
更新时间2026-02-03
支持自启动
秋叶丹炉lora-scripts1.12+Joy Caption 3原创可视化自动批量打标工具1.4版
秋叶丹炉lora-scripts1.12+Joy Caption 3原创可视化自动批量打标工具1.4版
0/小时
FluxComfyUI图片生成
Flux_Krea_Flux_Dev-Loras
Flux_Krea_Flux_Dev-Loras
7
@seazou
33
34H
更新时间2025-08-11
Flux_Krea&Flux_Dev-loras,本镜像包含多个用于Flux的lora
Flux_Krea&Flux_Dev-loras,本镜像包含多个用于Flux的lora
0.02/小时
Qwen-Image
Qwen-Image蒸馏加速版,批量生成,自定义Lora
Qwen-Image蒸馏加速版,批量生成,自定义Lora
4
@刘悦的技术博客
刘悦的技术博客认证作者
71
113H
更新时间2026-02-02
Qwen-Image-蒸馏加速版,支持自定义Lora,支持批量抽卡,文字生成图片
Qwen-Image-蒸馏加速版,支持自定义Lora,支持批量抽卡,文字生成图片
0/小时
语音合成
MOSS TTSD + Qwen3,自动生成完整语音播客(PodCast)
MOSS TTSD + Qwen3,自动生成完整语音播客(PodCast)
10
@刘悦的技术博客
刘悦的技术博客认证作者
62
150H
更新时间2026-02-02
支持自启动
MOSS-TTSD结合Qwen3-30B-A3B-Instruct-2507,自动生成完整语音播客(PodCast),初始化之后,等待服务启动,大概2分钟左右,然后点击 SD-WEBUI 按钮即可
MOSS-TTSD结合Qwen3-30B-A3B-Instruct-2507,自动生成完整语音播客(PodCast),初始化之后,等待服务启动,大概2分钟左右,然后点击 SD-WEBUI 按钮即可
0/小时
数字人
EchoMimicV3
EchoMimicV3
4
@十字鱼
十字鱼认证作者
42
72H
更新时间2026-02-02
EchoMimicV3:1.3B 参数即可实现统一的多模态和多任务人体动画
EchoMimicV3:1.3B 参数即可实现统一的多模态和多任务人体动画
0/小时
WanLora训练
aitookit_wan21_t2v_lora_训练镜像
aitookit_wan21_t2v_lora_训练镜像
10
@有趣的80后程序员
有趣的80后程序员认证作者
189
2672H
更新时间2026-02-02
aitookit_wan21_t2v_lora_训练镜像,内置模型、数据集 cuda 12.6 pytorch 2.7
aitookit_wan21_t2v_lora_训练镜像,内置模型、数据集 cuda 12.6 pytorch 2.7
0/小时
语音合成
mega-tts3无须官方npy文件 几秒音频克隆情感一致的声音字节开源 构建by科哥
mega-tts3无须官方npy文件 几秒音频克隆情感一致的声音字节开源 构建by科哥
4
@科哥AIGC
科哥AIGC认证作者
49
408H
更新时间2026-02-02
支持自启动
mega-tts3无须官方npy文件 几秒音频克隆情感一致的声音
mega-tts3无须官方npy文件 几秒音频克隆情感一致的声音
0/小时
Qwen-Image图片生成ComfyUI
comfyui万物迁移,万物移除,qwen-image,kontext整合包
comfyui万物迁移,万物移除,qwen-image,kontext整合包
10
@匹夫
匹夫认证作者
199
549H
更新时间2026-02-02
支持自启动
comfyui万物迁移、万物移除、qwen-image、kontext整合包
comfyui万物迁移、万物移除、qwen-image、kontext整合包
0/小时
Qwen-Image图片生成
最强AI生成图片-阿里QwenImage-批量生成图片
最强AI生成图片-阿里QwenImage-批量生成图片
10
@与AI同行
与AI同行认证作者
89
135H
更新时间2026-02-02
支持自启动
最强AI生成图片-阿里QwenImage-批量生成图片
最强AI生成图片-阿里QwenImage-批量生成图片
0/小时
视频超分
DLoRAL视频超分
DLoRAL视频超分
2
@Ikaros
12
20H
更新时间2025-08-07
一步扩散实现细节丰富且时间一致的视频超分辨率
一步扩散实现细节丰富且时间一致的视频超分辨率
0/小时
AI音乐
jam在线歌词生成音乐 音乐生成音乐 构建By科哥
jam在线歌词生成音乐 音乐生成音乐 构建By科哥
6
@科哥AIGC
科哥AIGC认证作者
34
13H
更新时间2026-02-02
根据歌词,原音乐创作你的音乐。
根据歌词,原音乐创作你的音乐。
0/小时
AI音乐
jam在线歌词生成音乐音乐生成音乐构建By科哥
jam在线歌词生成音乐音乐生成音乐构建By科哥
2
@科哥AIGC
科哥AIGC认证作者
6
4H
更新时间2026-02-02
jam在线歌词生成音乐音乐生成音乐构建By科哥
jam在线歌词生成音乐音乐生成音乐构建By科哥
0/小时
ComfyUI
RUIQILI_COMFYUI
RUIQILI_COMFYUI
2
@李睿琪
153
673H
更新时间2026-02-03
支持自启动