镜像社区
部署GPU实例
模型API
文档中心
常见问题(FAQ)
登录
镜像社区
我的收藏
快捷筛选
官方镜像
免费镜像
支持自启动
LLM
DeepSeek
Qwen
GLM
Gemma
Baichuan
llama
文本生成
机器翻译
推理框架
模型训练
AI绘画
SD
Flux
ComfyUI
CogView
Lora
Wan
Hunyuan
图像修复
图生文
Qwen-image
视频生成
图片生成
AIGC
语音合成
语音识别
数字人
具身智能
音乐
语音克隆
AI编程
TTS
语音分离
语音翻译
视频剪辑
计算机视觉
目标检测
语义分割图像分类
三维重建
视觉场景识别
科学计算
物理模拟
数据分析
量子计算
生物信息
分子动力
蛋白结构预测
其他
其他
默认排序
TTS
数字人
LiveTalking
4
@lipku
1644
15744H
更新时间:
2025-09-08
LiveTalking镜像提供实时交互数字人解决方案,支持ERNerf、MuseTalk、Wav2Lip,实现单张人脸照片驱动的超低延迟(<100ms)唇形同步、表情及头部运动控制。
LiveTalking镜像提供实时交互数字人解决方案,支持ERNerf、MuseTalk、Wav2Lip,实现单张人脸照片驱动的超低延迟(<100ms)唇形同步、表情及头部运动控制。
0
元/小时
部署实例
语音合成
SVC-Fusion
4
@aiguoliuguo
9
5H
更新时间:
2025-09-08
本整合包将整合So-Vits-SVC4.1、DDSP-SVC-6.3/6.1/6.0、ReFlow-VAE-SVC多种SVC模型训练及推理
本整合包将整合So-Vits-SVC4.1、DDSP-SVC-6.3/6.1/6.0、ReFlow-VAE-SVC多种SVC模型训练及推理
0
元/小时
部署实例
官方镜像
vLLM-DeepSeek-R1-Distill
2
@优云智算
官方
4772
5688H
更新时间:
2025-09-05
DeepSeek-R1-Distill系列模型--基于 Qwen2.5 和 Llama3 系列的 1.5B、7B、8B、14B、32B 和 70B 蒸馏模型
DeepSeek-R1-Distill系列模型--基于 Qwen2.5 和 Llama3 系列的 1.5B、7B、8B、14B、32B 和 70B 蒸馏模型
0
元/小时
部署实例
ComfyUI
深度学习
flux
FusionX最全工作流整合
1
@匹夫
997
6708H
更新时间:
2025-09-08
FusionX最全工作流合集,创建即用,AI视频生成这里都有
FusionX最全工作流合集,创建即用,AI视频生成这里都有
0
元/小时
部署实例
TTS
语音合成
语音克隆
IndexTTS2 B站开源超强语音克隆
0
@十字鱼
1
0H
更新时间:
2025-09-08
B站开源超强语音克隆,在情感表达和时长控制方面取得突破的自回归零样本文本合成系统
B站开源超强语音克隆,在情感表达和时长控制方面取得突破的自回归零样本文本合成系统
0
元/小时
部署实例
语音合成
语音克隆
TTS
IndexTTS2: 情感表达与时长控制的突破性自回归零样本语音合成 汉化构建by科哥
0
@科哥AIGC
0
0H
更新时间:
2025-09-08
支持自启动
B站最新开源index-tts2声音克隆模型
B站最新开源index-tts2声音克隆模型
0
元/小时
部署实例
其他
cuda124-py310-torch2.7基础镜像版本
0
@科哥AIGC
1
1H
更新时间:
2025-09-08
cuda124-py310-torch2.7基础镜像版本
cuda124-py310-torch2.7基础镜像版本
0
元/小时
部署实例
Wan
Wan2.2-S2V-14B: 音频驱动的电影视频生成
0
@AI画师大阳
0
0H
更新时间:
2025-09-08
支持自启动
通过音频驱动的图片转视频生成软件,支持声音克隆功能
通过音频驱动的图片转视频生成软件,支持声音克隆功能
0
元/小时
部署实例
语音合成
VibeVoice – 微软推出的开源文本转语音模型 汉化构建by科哥
0
@科哥AIGC
1
0H
更新时间:
2025-09-08
可以一次性合成4人的对话播客
可以一次性合成4人的对话播客
0
元/小时
部署实例
USO字节开源风格随心主体如真打造创意与真实完美统一的AI生成新标准 汉化构建by科哥
0
@科哥AIGC
0
0H
更新时间:
2025-09-08
主题风格一致,创意无限,配合lora
主题风格一致,创意无限,配合lora
0
元/小时
部署实例
ComfyUI
培训师的comfyUI
1
@鹄仙
2
2H
更新时间:
2025-09-08
组合了图像生成、视频生成、数字人的面向培训师群体的ComfyUI
组合了图像生成、视频生成、数字人的面向培训师群体的ComfyUI
0
元/小时
部署实例
数字人
最强AI数字人InfiniteTalk-图片和视频数字人
2
@与AI同行
269
789H
更新时间:
2025-09-08
支持自启动
InfiniteTalk:用于稀疏帧视频配音的音频驱动视频生成。无限长度的对话视频生成,支持图像转视频、视频转视频。
InfiniteTalk:用于稀疏帧视频配音的音频驱动视频生成。无限长度的对话视频生成,支持图像转视频、视频转视频。
0
元/小时
部署实例
数字人
HeyGem数字人优化加速版,GFPGAN面部超分增强,批量任务,修复多面部报错,推理速度1比2,唱歌数字人
0
@刘悦的技术博客
5
6H
更新时间:
2025-09-08
支持自启动
HeyGem数字人优化加速版,GFPGAN面部超分增强,批量任务,修复多面部报错,推理速度1比2,唱歌数字人
HeyGem数字人优化加速版,GFPGAN面部超分增强,批量任务,修复多面部报错,推理速度1比2,唱歌数字人
0
元/小时
部署实例
TTS
音乐
SVC-WebUI
1
@乔大峰
10
21H
更新时间:
2025-09-08
在线AI翻唱SVC训练,本地般丝滑体验,支持上传压缩文件,支持网页端打包训练好的模型并下载,无需命令行,由网页端自动处理,支持一键清空训练缓存,追求的就是高效率
在线AI翻唱SVC训练,本地般丝滑体验,支持上传压缩文件,支持网页端打包训练好的模型并下载,无需命令行,由网页端自动处理,支持一键清空训练缓存,追求的就是高效率
0
元/小时
部署实例
数字人
Wan
WAN2.2-S2V最新版数字人+动作参考
0
@社恐的知识树
10
6H
更新时间:
2025-09-06
阿里开源音+图片+动作参考生成视频模型,Comfyui官方最终优化版工作流
阿里开源音+图片+动作参考生成视频模型,Comfyui官方最终优化版工作流
0
元/小时
部署实例
图像修复
最强AI高清修复-SeedVR2-图片和视频高清放大
0
@与AI同行
19
23H
更新时间:
2025-09-05
支持自启动
最强AI高清修复-SeedVR2-图片和视频高清放大
最强AI高清修复-SeedVR2-图片和视频高清放大
0
元/小时
部署实例
其他
bunkws
1
@杭州国芯微
0
0H
更新时间:
2025-09-08
Bunkws 是杭州国芯微自研的一款端到端唤醒词训练框架
Bunkws 是杭州国芯微自研的一款端到端唤醒词训练框架
0
元/小时
部署实例
ComfyUI
视频生成
图片生成
大鹏姿态迁移,图片,视频,换装,图生视频四合一
2
@大鹏
17
39H
更新时间:
2025-09-05
支持自启动
高质量工作流,点开即可运行
高质量工作流,点开即可运行
0
元/小时
部署实例
ComfyUI
视频生成
Work-Fisher短片制作整合包
5
@Work-Fisher
18
26H
更新时间:
2025-09-05
创造属于你的AI短片
创造属于你的AI短片
0
元/小时
部署实例
WebUI
LLM
PDF文档翻译器BabelDOC
0
@AI画师大阳
6
24H
更新时间:
2025-09-05
基于强大在线大语言模型的PDF文档翻译器
基于强大在线大语言模型的PDF文档翻译器
0
元/小时
部署实例
ComfyUI
flux
SD
牛哥的专属ComfyUI大集合版-V1
2
@NiuGee
18
21H
更新时间:
2025-09-04
牛哥的专属ComfyUI大集合版本,功能持续扩充,点击即用
牛哥的专属ComfyUI大集合版本,功能持续扩充,点击即用
0
元/小时
部署实例
huanyuan
数字人
HunyuanWorld-WebUI fp8量化魔改版 开发构建by科哥
1
@科哥AIGC
2
1H
更新时间:
2025-09-04
HunyuanWorld 3d世界生成系统 腾讯开源
HunyuanWorld 3d世界生成系统 腾讯开源
0
元/小时
部署实例
Hunyuan
音乐
最强AI视频配音-腾讯Hunyuan-Foley
1
@与AI同行
13
29H
更新时间:
2025-09-03
最强AI视频配音-腾讯Hunyuan-Foley
最强AI视频配音-腾讯Hunyuan-Foley
0
元/小时
部署实例
TTS
音频视频语音识别转文本字幕faster-whisper 1.2
1
@AI画师大阳
6
17H
更新时间:
2025-09-05
将音频或视频文件语音识别转为文本文件或字幕文件
将音频或视频文件语音识别转为文本文件或字幕文件
0
元/小时
部署实例
三维重建
Unique3D在线生成3D模型 汉化构建By科哥
0
@科哥AIGC
7
0H
更新时间:
2025-09-03
一张图片就可以生成3D glb模型
一张图片就可以生成3D glb模型
0
元/小时
部署实例
ComfyUI
图片生成
gen_backview
0
@frankyxu
2
1H
更新时间:
2025-09-03
gen_backview bug 修复
gen_backview bug 修复
0
元/小时
部署实例
wan
数字人
Wan2.2 S2V 数字人 阿里通义千问出品
1
@十字鱼
40
74H
更新时间:
2025-09-02
Wan2.2 S2V 数字人 阿里通义千问出品 这是一个音频驱动的电影视频生成模型
Wan2.2 S2V 数字人 阿里通义千问出品 这是一个音频驱动的电影视频生成模型
0
元/小时
部署实例
Hunyuan
音乐
HunyuanVideo-Foley腾讯开源视频音效配音文本配音 汉化构建by科哥
1
@科哥AIGC
3
0H
更新时间:
2025-09-03
根据一段文本或者视频,生成你的配音
根据一段文本或者视频,生成你的配音
0
元/小时
部署实例
Hunyuan
音乐
HunyuanVideo-Foley 腾讯混元开源音效模型
1
@十字鱼
4
1H
更新时间:
2025-09-03
一键视频配音,完美自动化
一键视频配音,完美自动化
0
元/小时
部署实例
ComfyUI
DelikeAI 应用镜像
1
@Delike乐仔
12
54H
更新时间:
2025-09-01
DelikeAI 应用镜像
DelikeAI 应用镜像
0
元/小时
部署实例
Hunyuan
音乐
HunyuanVideoFoley-AI视频配乐
1
@匹夫
19
17H
更新时间:
2025-09-01
HunyuanVideoFoley-能自动给视频配乐的AI模型
HunyuanVideoFoley-能自动给视频配乐的AI模型
0
元/小时
部署实例
wan
数字人
Wan2GP——十字鱼镜像
0
@十字鱼
22
126H
更新时间:
2025-09-03
Wan2GP,高度优化的视频生成项目,支持Wan、Hunyuan和LTX等相关模型
Wan2GP,高度优化的视频生成项目,支持Wan、Hunyuan和LTX等相关模型
0
元/小时
部署实例
数字人
HeyGem-webui在线数字人视频口播数字人 构建bu科哥
1
@科哥AIGC
31
24H
更新时间:
2025-09-03
一键运行优化版,开机自启动
一键运行优化版,开机自启动
0
元/小时
部署实例
数字人
ComfyUI
AI换人术一键将跳舞视频主角变成你!(Stand-In + VACE + ComfyUI 镜像版)
0
@电磁波Studio
66
42H
更新时间:
2025-09-01
AI换人术一键将跳舞视频主角变成你!(Stand-In + VACE + ComfyUI 镜像版)
AI换人术一键将跳舞视频主角变成你!(Stand-In + VACE + ComfyUI 镜像版)
0
元/小时
部署实例
wan
数字人
musubi-tunner-wan2.2训练镜像
2
@有趣的80后程序员
56
104H
更新时间:
2025-09-01
musubi-tunner-wan2.2 lora 训练镜像,内置模型数据集
musubi-tunner-wan2.2 lora 训练镜像,内置模型数据集
0
元/小时
部署实例
wan
视频生成
Wan2.2-图生视频-批量任务队列版本-
3
@刘悦的技术博客
94
188H
更新时间:
2025-08-31
Wan2.2-图生视频-批量任务队列版本-自定义lora-自定义首尾帧
Wan2.2-图生视频-批量任务队列版本-自定义lora-自定义首尾帧
0
元/小时
部署实例
数字人
InfiniteTalk数字人,4步采样,无限时长,说话数字人,唱歌数字人
4
@刘悦的技术博客
120
203H
更新时间:
2025-08-29
InfiniteTalk数字人,4步采样,无限时长,说话数字人,唱歌数字人,支持反推关键词,基于comfyui工作流
InfiniteTalk数字人,4步采样,无限时长,说话数字人,唱歌数字人,支持反推关键词,基于comfyui工作流
0
元/小时
部署实例
Qwen-image
Qwen-image-千问合集
1
@虚幻1024
18
26H
更新时间:
2025-09-08
ComfyUI - qwen-image-千问合集
ComfyUI - qwen-image-千问合集
0
元/小时
部署实例
三维重建
SpatialGen - 3D场景生成器
0
@科哥AIGC
0
0H
更新时间:
2025-08-29
基于多视角多模态扩散模型的3D场景生成工具 支持图像到3D场景和文本到3D场景的生成
基于多视角多模态扩散模型的3D场景生成工具 支持图像到3D场景和文本到3D场景的生成
0
元/小时
部署实例
音乐
ThinkSound视频配音
1
@科哥AIGC
12
29H
更新时间:
2025-08-29
ThinkSound视频配音
ThinkSound视频配音
0
元/小时
部署实例
wan
数字人
wan2.2-S2V数字人,支持批量任务队列
4
@刘悦的技术博客
49
43H
更新时间:
2025-08-29
支持批量任务队列,说话数字人,唱歌数字人,支持反推关键词,基于comfyui工作流
支持批量任务队列,说话数字人,唱歌数字人,支持反推关键词,基于comfyui工作流
0
元/小时
部署实例
数字人
Wan2.2-S2V数字人-对口型-音频驱动视频生成
1
@AI-KSK
42
51H
更新时间:
2025-08-31
Wan2.2-S2V数字人,通过一张静态图片和一段音频(如说话或唱歌)自动生成高质量、口型同步的电影级视频。
Wan2.2-S2V数字人,通过一张静态图片和一段音频(如说话或唱歌)自动生成高质量、口型同步的电影级视频。
0
元/小时
部署实例
Wan
视频人物主体替换
1
@AI画师大阳
17
7H
更新时间:
2025-08-27
支持自启动
用一张图片中人物替换视频中的人物主体
用一张图片中人物替换视频中的人物主体
0
元/小时
部署实例
Qwen-image
Qwen-Image-Edit-多图融合-面部一致性保持
1
@刘悦的技术博客
22
26H
更新时间:
2025-09-08
支持自启动
Qwen-Image-Edit-多图融合-面部一致性保持,基于comfyui工作流
Qwen-Image-Edit-多图融合-面部一致性保持,基于comfyui工作流
0
元/小时
部署实例
Wan
Wan2.2-Lora训练,文生视频与图生视频Lora训练,AIToolkit
3
@AI-KSK
18
70H
更新时间:
2025-08-31
用做训练Wan2.2文生视频或者/图生视频的 LoRA 模型
用做训练Wan2.2文生视频或者/图生视频的 LoRA 模型
0
元/小时
部署实例
AI编程
RapidOCR_API_Torch_GPU
1
@SWHL
2
2H
更新时间:
2025-08-27
基于 ONNXRuntime、OpenVINO、PaddlePaddle 和 PyTorch 的超棒 OCR 多编程语言工具包。
基于 ONNXRuntime、OpenVINO、PaddlePaddle 和 PyTorch 的超棒 OCR 多编程语言工具包。
0
元/小时
部署实例
Qwen-image
最强AI图片QwenImage-Edit-WebUI-支持Lora
1
@与AI同行
41
81H
更新时间:
2025-09-08
支持自启动
QwenImage+Edit-WebUI-支持Lora
QwenImage+Edit-WebUI-支持Lora
0
元/小时
部署实例
Qwen-image
Qwen-Image-Edit
2
@十字鱼
16
44H
更新时间:
2025-09-08
阿里通义千问开源最强图像模型,强大的文字渲染能力,强大的图像编辑能力
阿里通义千问开源最强图像模型,强大的文字渲染能力,强大的图像编辑能力
0
元/小时
部署实例
其他
VL视觉模型集合
2
@Ikaros
1
96H
更新时间:
2025-08-27
内置InternVL3-8B、GLM-4.1V-9B-Thinking、GLM-4.1V-9B-Thinking-bnb-4bit 一键启动API服务
内置InternVL3-8B、GLM-4.1V-9B-Thinking、GLM-4.1V-9B-Thinking-bnb-4bit 一键启动API服务
0
元/小时
部署实例
Hunyuan
HunyuanWorld-1.0-lite 腾讯混元3D世界lite
0
@科哥AIGC
5
15H
更新时间:
2025-08-27
快速打造你的3D游戏世界1.0,通过jupyterlab命令行运行生成3D游戏世界
快速打造你的3D游戏世界1.0,通过jupyterlab命令行运行生成3D游戏世界
0
元/小时
部署实例
数字人
infinitetalk数字人工作流
2
@匹夫
124
303H
更新时间:
2025-08-27
支持自启动
infinitetalk,音频+图片参考、音频+视频参考工作流
infinitetalk,音频+图片参考、音频+视频参考工作流
0
元/小时
部署实例
Wan
wan2.1文生视频动作迁移
0
@AI画师大阳
48
83H
更新时间:
2025-08-27
支持自启动
模仿参考视频人物动作快速生成新的人物视频
模仿参考视频人物动作快速生成新的人物视频
0
元/小时
部署实例
Qwen
Qwen3-Smvl多模态模型
1
@敢敢のwings
0
0H
更新时间:
2025-09-08
支持自启动
最近Huggingface团队发布了超小多模态模型SmolVLM2,可以做到端侧1GB显存推理。作者尝试当前中文小模型扛把子Qwen3与SmolVLM2直接微调拼接的想法
最近Huggingface团队发布了超小多模态模型SmolVLM2,可以做到端侧1GB显存推理。作者尝试当前中文小模型扛把子Qwen3与SmolVLM2直接微调拼接的想法
0
元/小时
部署实例
推理框架
ms-swift轻量级微调模型框架
1
@bright
3
4H
更新时间:
2025-08-27
ms-swift是魔搭社区提供的大模型与多模态大模型微调部署框架.
ms-swift是魔搭社区提供的大模型与多模态大模型微调部署框架.
0
元/小时
部署实例
Wan
Bob同学的comfyui云端镜像系列
1
@Bob同学
258
1039H
更新时间:
2025-08-29
支持自启动
此版本内置 (Wan2.2\Flux\Kontext)系列的全部基础模型及工作流
此版本内置 (Wan2.2\Flux\Kontext)系列的全部基础模型及工作流
0
元/小时
部署实例
物理模拟
Gromacs系列
1
@苍耳阿猫
54
598H
更新时间:
2025-08-27
Gromacs-2025.0镜像集成开源高性能分子动力学模拟软件,通过强化多精度算法与GPU并行加速(支持NVIDIA/AMD显卡)实现纳秒级生物大分子运动模拟,优化AI辅助建模与超大体系计算效率,提供跨平台开箱即用解决方案
Gromacs-2025.0镜像集成开源高性能分子动力学模拟软件,通过强化多精度算法与GPU并行加速(支持NVIDIA/AMD显卡)实现纳秒级生物大分子运动模拟,优化AI辅助建模与超大体系计算效率,提供跨平台开箱即用解决方案
0
元/小时
部署实例
Qwen-image
Qwen-Image-Edit-4步采样
2
@刘悦的技术博客
13
18H
更新时间:
2025-09-08
支持自启动
支持自定义Lora,AI图片编辑修改,支持反推提示词
支持自定义Lora,AI图片编辑修改,支持反推提示词
0
元/小时
部署实例
语音合成
voice-changer
2
@aiguoliuguo
30
371H
更新时间:
2025-08-27
Voice Changer 云端在线变声器
Voice Changer 云端在线变声器
0
元/小时
部署实例
SD
SD高质量CG绘画
1
@AI画师大阳
14
84H
更新时间:
2025-08-27
支持自启动
SD高质量CG绘画
SD高质量CG绘画
0
元/小时
部署实例
ComfyUI
ComfyUI高清4K文生图
2
@AI画师大阳
11
2H
更新时间:
2025-08-27
支持自启动
ComfyUI版实现stable diffusion文生图高清放大人脸修复,直出4K
ComfyUI版实现stable diffusion文生图高清放大人脸修复,直出4K
0
元/小时
部署实例
Wan
WAN2.2视频生产加速套件-ComfyUI
3
@AI-KSK
31
54H
更新时间:
2025-08-21
WAN 2.2极速性能优化10工作流多任务视频生成套件
WAN 2.2极速性能优化10工作流多任务视频生成套件
0
元/小时
部署实例
ComfyUI
ComfyUI基础镜像纯净版0.3.50
2
@龙没耳
8
82H
更新时间:
2025-08-19
支持自启动
ComfyUI基础镜像纯净版0.3.50
ComfyUI基础镜像纯净版0.3.50
0
元/小时
部署实例
数字人
MultiTalk数字人优化加速版本-无限时长-唱歌/说话数字人
1
@刘悦的技术博客
57
170H
更新时间:
2025-08-19
支持自启动
MultiTalk数字人优化加速版本-2步采样,对精度有要求修改采样数为4或者8
MultiTalk数字人优化加速版本-2步采样,对精度有要求修改采样数为4或者8
0
元/小时
部署实例
ComfyUI
Seed-VR2-7B,图片视频超清放大,人体细节部位放大,支持批量任务
1
@刘悦的技术博客
26
18H
更新时间:
2025-08-19
支持自启动
Seed-VR2-7B,图片视频超清放大,人体细节部位放大,支持批量任务,初始化后,等待服务启动,大概2分钟,然后点击SD-WEBUI即可
Seed-VR2-7B,图片视频超清放大,人体细节部位放大,支持批量任务,初始化后,等待服务启动,大概2分钟,然后点击SD-WEBUI即可
0
元/小时
部署实例
图像修复
ben2抠图-在线去除图片、视频背景神器,绿幕抠图神器 构建By科哥
1
@科哥AIGC
7
18H
更新时间:
2025-08-19
支持自启动
ben2抠图webui在线抠视频除去图片视频背景神器绿幕抠图神器 构建By科哥
ben2抠图webui在线抠视频除去图片视频背景神器绿幕抠图神器 构建By科哥
0
元/小时
部署实例
语音合成
CosyVoice界面优化版 可以粤语、普通、英语、日语、四川话、天津话、上海话等声音克隆
2
@科哥AIGC
36
87H
更新时间:
2025-08-19
支持自启动
CosyVoice界面优化版 可以粤语、普通、英语、日语、四川话、天津话、上海话等声音克隆
CosyVoice界面优化版 可以粤语、普通、英语、日语、四川话、天津话、上海话等声音克隆
0
元/小时
部署实例
图像修复
DiffBIR一键图片老照片高清修复 汉化构建by科哥
1
@科哥AIGC
11
3H
更新时间:
2025-08-19
支持自启动
DiffBIR一键图片老照片高清修复 汉化构建by科哥
DiffBIR一键图片老照片高清修复 汉化构建by科哥
0
元/小时
部署实例
视频生成
最强人脸迁移生成视频Stand-In支持批量生成
2
@与AI同行
35
41H
更新时间:
2025-08-28
支持自启动
最强人脸迁移生成视频Stand-In-支持批量生成
最强人脸迁移生成视频Stand-In-支持批量生成
0
元/小时
部署实例
数字人
HeyGem数字人加速优化版,解决多脸型报错
1
@刘悦的技术博客
48
66H
更新时间:
2025-08-14
支持自启动
HeyGem数字人加速优化版,解决多脸型报错,解决没有脸报错,
HeyGem数字人加速优化版,解决多脸型报错,解决没有脸报错,
0
元/小时
部署实例
图像修复
HYPIR一个基于扩散生成的分数进行图像恢复的应用 汉化构建By科哥
1
@科哥AIGC
3
20H
更新时间:
2025-08-14
支持自启动
一键进行修复图片
一键进行修复图片
0
元/小时
部署实例
图片生成
Magic-TryOn图片换装视频换装 构建by科哥
1
@科哥AIGC
8
54H
更新时间:
2025-08-14
Magic-TryOn图片换装视频换装 构建by科哥
Magic-TryOn图片换装视频换装 构建by科哥
0
元/小时
部署实例
Lora
Wan
Wan2.2-图生视频-批量任务-自定义lora-自定义首尾帧
1
@刘悦的技术博客
165
1105H
更新时间:
2025-08-12
支持自启动
Wan2.2-图生视频-批量任务-自定义lora-自定义首尾帧
Wan2.2-图生视频-批量任务-自定义lora-自定义首尾帧
0
元/小时
部署实例
llama
LlamaFactory纯净版-微调使用
1
@WYSLOVE
9
38H
更新时间:
2025-08-12
在conda环境下仅安装了LlamaFactory,以及llama.cpp,llama.cpp未编译,可用convert.py来导出gguf模型文件
在conda环境下仅安装了LlamaFactory,以及llama.cpp,llama.cpp未编译,可用convert.py来导出gguf模型文件
0.01
元/小时
部署实例
数字人
RuoYI AI 二开AI数字人
1
@熊猫助手
7
28H
更新时间:
2025-08-14
基于livetalking二开,实现AI数字人功能,支持coze智能体工作流对接,功能更加强大!
基于livetalking二开,实现AI数字人功能,支持coze智能体工作流对接,功能更加强大!
0
元/小时
部署实例
其他
Video subtitle remover
1
@如月风铃
4
4H
更新时间:
2025-08-12
一个github上的视频硬字幕去除项目
一个github上的视频硬字幕去除项目
0
元/小时
部署实例
视频生成
FramePack-F1 牛哥版
2
@NiuGee
30
141H
更新时间:
2025-08-11
FramePack F1 牛哥加速版
FramePack F1 牛哥加速版
0
元/小时
部署实例
SD
秋叶丹炉(Lora-Scripts)1.12
2
@龙没耳
97
727H
更新时间:
2025-08-11
支持自启动
秋叶丹炉lora-scripts1.12+Joy Caption 3原创可视化自动批量打标工具1.4版
秋叶丹炉lora-scripts1.12+Joy Caption 3原创可视化自动批量打标工具1.4版
0
元/小时
部署实例
Flux
ComfyUI
Flux_Krea_Flux_Dev-Loras
1
@seazou
11
5H
更新时间:
2025-08-11
Flux_Krea&Flux_Dev-loras,本镜像包含多个用于Flux的lora
Flux_Krea&Flux_Dev-loras,本镜像包含多个用于Flux的lora
0.02
元/小时
部署实例
Qwen-image
Qwen-Image蒸馏加速版,批量生成,自定义Lora
2
@刘悦的技术博客
32
73H
更新时间:
2025-09-08
Qwen-Image-蒸馏加速版,支持自定义Lora,支持批量抽卡,文字生成图片
Qwen-Image-蒸馏加速版,支持自定义Lora,支持批量抽卡,文字生成图片
0
元/小时
部署实例
Qwen
TTS
MOSS TTSD + Qwen3,自动生成完整语音播客(PodCast)
1
@刘悦的技术博客
8
106H
更新时间:
2025-08-11
支持自启动
MOSS-TTSD结合Qwen3-30B-A3B-Instruct-2507,自动生成完整语音播客(PodCast),初始化之后,等待服务启动,大概2分钟左右,然后点击 SD-WEBUI 按钮即可
MOSS-TTSD结合Qwen3-30B-A3B-Instruct-2507,自动生成完整语音播客(PodCast),初始化之后,等待服务启动,大概2分钟左右,然后点击 SD-WEBUI 按钮即可
0
元/小时
部署实例
视频生成
EchoMimicV3
1
@十字鱼
21
34H
更新时间:
2025-08-11
EchoMimicV3:1.3B 参数即可实现统一的多模态和多任务人体动画
EchoMimicV3:1.3B 参数即可实现统一的多模态和多任务人体动画
0
元/小时
部署实例
Lora
Wan
视频生成
aitookit_wan21_t2v_lora_训练镜像
2
@有趣的80后程序员
95
1771H
更新时间:
2025-08-11
aitookit_wan21_t2v_lora_训练镜像,内置模型、数据集 cuda 12.6 pytorch 2.7
aitookit_wan21_t2v_lora_训练镜像,内置模型、数据集 cuda 12.6 pytorch 2.7
0
元/小时
部署实例
TTS
mega-tts3无须官方npy文件 几秒音频克隆情感一致的声音字节开源 构建by科哥
1
@科哥AIGC
23
309H
更新时间:
2025-08-11
支持自启动
mega-tts3无须官方npy文件 几秒音频克隆情感一致的声音
mega-tts3无须官方npy文件 几秒音频克隆情感一致的声音
0
元/小时
部署实例
ComfyUI
Qwen-image
comfyui万物迁移,万物移除,qwen-image,kontext整合包
1
@匹夫
112
325H
更新时间:
2025-09-08
支持自启动
comfyui万物迁移、万物移除、qwen-image、kontext整合包
comfyui万物迁移、万物移除、qwen-image、kontext整合包
0
元/小时
部署实例
图片生成
Qwen-image
最强AI生成图片-阿里QwenImage-批量生成图片
1
@与AI同行
33
61H
更新时间:
2025-08-28
支持自启动
最强AI生成图片-阿里QwenImage-批量生成图片
最强AI生成图片-阿里QwenImage-批量生成图片
0
元/小时
部署实例
语音分割图像分类
DLoRAL视频超分
1
@Ikaros
6
14H
更新时间:
2025-08-07
一步扩散实现细节丰富且时间一致的视频超分辨率
一步扩散实现细节丰富且时间一致的视频超分辨率
0
元/小时
部署实例
音乐
jam在线歌词生成音乐 音乐生成音乐 构建By科哥
1
@科哥AIGC
6
0H
更新时间:
2025-08-07
根据歌词,原音乐创作你的音乐。
根据歌词,原音乐创作你的音乐。
0
元/小时
部署实例
音乐
jam在线歌词生成音乐音乐生成音乐构建By科哥
1
@科哥AIGC
3
2H
更新时间:
2025-08-07
jam在线歌词生成音乐音乐生成音乐构建By科哥
jam在线歌词生成音乐音乐生成音乐构建By科哥
0
元/小时
部署实例
ComfyUI
RUIQILI_COMFYUI
1
@李睿琪
119
568H
更新时间:
2025-08-11
支持自启动
建筑模型 ComfyUI
建筑模型 ComfyUI
0
元/小时
部署实例
数字人
HeyGem数字人加速优化版,批量任务支持唱歌数字人
1
@刘悦的技术博客
160
374H
更新时间:
2025-08-11
支持自启动
HeyGem数字人加速优化版,支持唱歌数字人,批量任务, 部署后,等待服务启动,大概2分钟,然后点击 SD-WebUi
HeyGem数字人加速优化版,支持唱歌数字人,批量任务, 部署后,等待服务启动,大概2分钟,然后点击 SD-WebUi
0
元/小时
部署实例
ComfyUI
Wan
Wan2.2-KJ氦气加速ComfyUI 6步极速版(唯一正版授权)
4
@龙没耳
141
882H
更新时间:
2025-08-06
支持自启动
Wan2.2KJ氦气加速6步极速版唯一正版授权镜像——AI来事&龙没耳联合推出
Wan2.2KJ氦气加速6步极速版唯一正版授权镜像——AI来事&龙没耳联合推出
0
元/小时
部署实例
文本生成
OpenAI-GPT-OSS-120B/20B
0
@敢敢のwings
16
55H
更新时间:
2025-08-07
OpenAI正式发布了其首个开源大语言模型系列——gpt-oss,这标志着自GPT-2以来OpenAI首次将其核心模型技术开源。gpt-oss系列包含两个主要版本:gpt-oss-20b和gpt-oss-120b,分别针对不同的应用场景和硬件配置进行了优化。
OpenAI正式发布了其首个开源大语言模型系列——gpt-oss,这标志着自GPT-2以来OpenAI首次将其核心模型技术开源。gpt-oss系列包含两个主要版本:gpt-oss-20b和gpt-oss-120b,分别针对不同的应用场景和硬件配置进行了优化。
0
元/小时
部署实例
ComfyUI
Qwen-image
Qwen-Image文字生成图片
1
@刘悦的技术博客
65
225H
更新时间:
2025-08-06
支持自启动
Qwen-Image文生图,支持SD-WebUI和Comfyui,10步采样,在图片上精准生成汉字,支持反推提示词
Qwen-Image文生图,支持SD-WebUI和Comfyui,10步采样,在图片上精准生成汉字,支持反推提示词
0
元/小时
部署实例
视频生成
星梦AI
1
@星悦
10
15H
更新时间:
2025-08-05
文生图,图片局部编辑,人物换装,图生视频,多功能文本配音,多功能数字人对口型。
文生图,图片局部编辑,人物换装,图生视频,多功能文本配音,多功能数字人对口型。
0
元/小时
部署实例
Hunyuan
混元世界大模型-v1.0
1
@Ikaros
5
45H
更新时间:
2025-08-07
HunyuanWorld 1.0 是由腾讯混元团队开发并开源的创新3D世界生成框架,它代表了计算机视觉和图形学领域的一项重大突破。该框架旨在解决现有3D世界生成方法中的局限性,通过融合基于视频的方法的多样性与基于三维几何方法的一致性,提供了一种新的解决方案1。 核心功能上,HunyuanWorld 1.0 提供了以下三大优势: 沉浸式体验:利用全景图像作为360°的世界代理,提供了全方位的沉浸式视觉体验。 工业级兼容性:支持将生成的3D场景导出为标准网格格式,可以无缝集成到现有的3D建模软件和游戏引擎中,如Blender、Unreal Engine和Unity等,增强了模型的实用性和灵活性。 增强交互性:采用解耦式的物体表示方法,实现了对场景中物体的单独编辑和交互,提高了用户的操作自由度和创造力。 在技术实现方面,HunyuanWorld 1.0 利用了先进的语义分层3D网格表征技术和两阶段生成范式,即首先通过一个特制的3D感知变分自编码器(VAE)来理解3D世界,然后使用扩散Transformer(DiT)进行创造性的3D世界构建。这种架构不仅能够从文本描述或图片输入中生成高质量的3D全景图,还能够处理复杂的场景分解与重建任务,从而确保生成世界的连贯性和细节丰富度15。 此外,HunyuanWorld 1.0 的应用场景广泛,涵盖了虚拟现实(VR)、物理仿真、游戏开发以及交互式内容创作等多个领域。其强大的功能和高度的兼容性使得它成为了推动这些行业发展的重要工具,预示着AI驱动的3D内容创作新时代的到来7。 综上所述,HunyuanWorld 1.0 不仅是一个技术上的飞跃,也是一个开启未来无限可能的关键里程碑,为创作者提供了前所未有的能力去探索和创建数字世界。
HunyuanWorld 1.0 是由腾讯混元团队开发并开源的创新3D世界生成框架,它代表了计算机视觉和图形学领域的一项重大突破。该框架旨在解决现有3D世界生成方法中的局限性,通过融合基于视频的方法的多样性与基于三维几何方法的一致性,提供了一种新的解决方案1。 核心功能上,HunyuanWorld 1.0 提供了以下三大优势: 沉浸式体验:利用全景图像作为360°的世界代理,提供了全方位的沉浸式视觉体验。 工业级兼容性:支持将生成的3D场景导出为标准网格格式,可以无缝集成到现有的3D建模软件和游戏引擎中,如Blender、Unreal Engine和Unity等,增强了模型的实用性和灵活性。 增强交互性:采用解耦式的物体表示方法,实现了对场景中物体的单独编辑和交互,提高了用户的操作自由度和创造力。 在技术实现方面,HunyuanWorld 1.0 利用了先进的语义分层3D网格表征技术和两阶段生成范式,即首先通过一个特制的3D感知变分自编码器(VAE)来理解3D世界,然后使用扩散Transformer(DiT)进行创造性的3D世界构建。这种架构不仅能够从文本描述或图片输入中生成高质量的3D全景图,还能够处理复杂的场景分解与重建任务,从而确保生成世界的连贯性和细节丰富度15。 此外,HunyuanWorld 1.0 的应用场景广泛,涵盖了虚拟现实(VR)、物理仿真、游戏开发以及交互式内容创作等多个领域。其强大的功能和高度的兼容性使得它成为了推动这些行业发展的重要工具,预示着AI驱动的3D内容创作新时代的到来7。 综上所述,HunyuanWorld 1.0 不仅是一个技术上的飞跃,也是一个开启未来无限可能的关键里程碑,为创作者提供了前所未有的能力去探索和创建数字世界。
0
元/小时
部署实例
语音合成
CosyVoice2-0.5B
1
@科哥AIGC
82
551H
更新时间:
2025-08-05
支持自启动
CosyVoice阿里云同义实验室开源的AI声音克隆应用
CosyVoice阿里云同义实验室开源的AI声音克隆应用
0
元/小时
部署实例
ComfyUI
Wan
视频生成
Wan2.2-14B-图生视频-自定义首尾帧,自定义Lora,6步采样,反推提示词
2
@刘悦的技术博客
199
2216H
更新时间:
2025-08-06
支持自启动
Wan2.2-14B-图生视频-自定义首尾帧,自定义Lora,6步采样,反推提示词,初始化之后,等待服务启动,大概2分钟左右,点击SD-Webui按钮即可,上传首尾帧图片,输入提示词,点击生成即可,如果不传尾帧图片,就是单图生成,可以点击根据图片来生成提示词
Wan2.2-14B-图生视频-自定义首尾帧,自定义Lora,6步采样,反推提示词,初始化之后,等待服务启动,大概2分钟左右,点击SD-Webui按钮即可,上传首尾帧图片,输入提示词,点击生成即可,如果不传尾帧图片,就是单图生成,可以点击根据图片来生成提示词
0
元/小时
部署实例
ComfyUI
ComfyUI最简搭建基座镜像[最新纯净版]
1
@ai来事
4
6H
更新时间:
2025-08-05
支持自启动
最容易的ComfyUI搭建,最新纯净版基座镜像
最容易的ComfyUI搭建,最新纯净版基座镜像
0.5
元/小时
部署实例
语音合成
Step-Audio TTS在线语音克隆3B模型 构建By科哥
1
@科哥AIGC
10
16H
更新时间:
2025-08-05
支持自启动
Step-Audio TTS在线语音克隆3B模型 构建By科哥
Step-Audio TTS在线语音克隆3B模型 构建By科哥
0
元/小时
部署实例
SD
Joy Cation WebUI批量打标工具独立版
1
@龙没耳
5
4H
更新时间:
2025-08-06
支持自启动
Joy Cation WebUI批量打标工具独立版
Joy Cation WebUI批量打标工具独立版
0
元/小时
部署实例
推理框架
thinking-budget-vllm010
2
@不要葱姜蒜
1
0H
更新时间:
2025-08-03
使用vllm实现思考预算
使用vllm实现思考预算
0
元/小时
部署实例
语音合成
MSST-更多模型
1
@我就是五字
23
41H
更新时间:
2025-09-05
本镜像参考了[原MSST镜像作者大大bilibili@爱过_留过]老师的模型启动方法,添加了常用的分离伴奏、人声、和声、混响、降噪等模型
本镜像参考了[原MSST镜像作者大大bilibili@爱过_留过]老师的模型启动方法,添加了常用的分离伴奏、人声、和声、混响、降噪等模型
0
元/小时
部署实例
ComfyUI
Wan
wan2.2工作流合集
2
@匹夫
520
2103H
更新时间:
2025-08-05
支持自启动
wan2.2-首尾帧、文生图、文生视频、图生视频、kontext、flux-krea
wan2.2-首尾帧、文生图、文生视频、图生视频、kontext、flux-krea
0
元/小时
部署实例
ComfyUI
Wan
Wan2.2-14B-文生视频,自定义Lora,反推提示词,lightx2V加速,6步采样
1
@刘悦的技术博客
61
134H
更新时间:
2025-08-05
支持自启动
Wan2.2-14B-文生视频,自定义Lora,反推提示词,lightx2V加速,6步采样,初始化后,等待服务启动,大概2分钟,然后点击 SD-WEBUI 按钮即可
Wan2.2-14B-文生视频,自定义Lora,反推提示词,lightx2V加速,6步采样,初始化后,等待服务启动,大概2分钟,然后点击 SD-WEBUI 按钮即可
0
元/小时
部署实例
Qwen
Qwen3-coder-30B-A3B
1
@苍耳阿猫
5
15H
更新时间:
2025-08-05
qwen3-coder-30B-A3B可视化使用
qwen3-coder-30B-A3B可视化使用
0
元/小时
部署实例
推理框架
alchemy
1
@杭州国芯微
0
0H
更新时间:
2025-08-01
用于训练alchemy kws模型
用于训练alchemy kws模型
0
元/小时
部署实例
目标监测
Yolov13
1
@alex
12
44H
更新时间:
2025-08-01
Yolov13 版本镜像,导入可直接部署运行对应项目。 可直接运行目标检测,分割,分类等视觉任务。
Yolov13 版本镜像,导入可直接部署运行对应项目。 可直接运行目标检测,分割,分类等视觉任务。
0
元/小时
部署实例
Wan
Wan2.2-14B-Lightx2V加速,6步采样,自动提示词
2
@刘悦的技术博客
173
679H
更新时间:
2025-08-05
支持自启动
Wan2.2-14B-Lightx2V加速,6步采样,自动提示词
Wan2.2-14B-Lightx2V加速,6步采样,自动提示词
0
元/小时
部署实例
AI编程
云端VS Code+CodeBuddy IDE AI辅助编程
1
@龙没耳
15
104H
更新时间:
2025-08-05
支持自启动
微软Visual Studio Code+腾讯CodeBuddy AI辅助编程IDE
微软Visual Studio Code+腾讯CodeBuddy AI辅助编程IDE
0
元/小时
部署实例
Wan
Wan2.2-Diffusers
1
@十字鱼
20
32H
更新时间:
2025-07-30
Wan2.2-I2V-A14B-Diffusers + WebUI
Wan2.2-I2V-A14B-Diffusers + WebUI
0
元/小时
部署实例
Wan
阿里Wan2.2-14B图生视频超高画质-Q8
1
@与AI同行
197
688H
更新时间:
2025-07-30
支持自启动
AI生成视频Wan2.2图生视频,使用量化版Wan2.2-I2V-A14B模型
AI生成视频Wan2.2图生视频,使用量化版Wan2.2-I2V-A14B模型
0
元/小时
部署实例
文本生成
self-llm-GLM-4.5-Air
1
@不要葱姜蒜
2
2H
更新时间:
2025-07-29
self-llm-GLM-4.5-Air vllm LORA镜像
self-llm-GLM-4.5-Air vllm LORA镜像
0
元/小时
部署实例
数字人
阿里OpenAvatarChat模型数字人生成
1
@rex
9
2H
更新时间:
2025-08-01
阿里OpenAvatarChat模型数字人生成,可导出下载生成的模型数字人驱动文件包
阿里OpenAvatarChat模型数字人生成,可导出下载生成的模型数字人驱动文件包
1
元/小时
部署实例
ComfyUI
Wan
WAN2.2-ComfyUI 开源SOTA级AI视频生成
1
@AI-KSK
85
695H
更新时间:
2025-08-01
开源AI视频模型中的SOTA,WAN 2.2的ComfyUI实现,包含5b、14b全部模型
开源AI视频模型中的SOTA,WAN 2.2的ComfyUI实现,包含5b、14b全部模型
0
元/小时
部署实例
ComfyUI
电商-AI模特/饰品/眼镜/假发模特,ComfyUI一键启动镜像
1
@AI美研所
44
267H
更新时间:
2025-07-28
支持自启动
适用电商的ComfyUI镜像环境,包括:饰品佩戴、 多姿势,多角度, 一致性模特工作流,一键换装工作流,眼镜模特工作流,假发模特工作流镜像;本镜像采取一键打包形式,不用输入一句命令,点击几次即可
适用电商的ComfyUI镜像环境,包括:饰品佩戴、 多姿势,多角度, 一致性模特工作流,一键换装工作流,眼镜模特工作流,假发模特工作流镜像;本镜像采取一键打包形式,不用输入一句命令,点击几次即可
0
元/小时
部署实例
数字人
星悦数字人-专业版
1
@星悦
27
224H
更新时间:
2025-07-25
星悦数字人专业版,文本转语音,灵活配音,数字人对口型,灵活批量生成数字人。
星悦数字人专业版,文本转语音,灵活配音,数字人对口型,灵活批量生成数字人。
0
元/小时
部署实例
语音合成
Higgs_Audio_V2
1
@敢敢のwings
1
0H
更新时间:
2025-07-24
支持自启动
沐神新作,不得不学
沐神新作,不得不学
0
元/小时
部署实例
ComfyUI
ComfyUI童装一键换装
1
@xiaofang
18
14H
更新时间:
2025-07-31
支持自启动
0
元/小时
部署实例
语音合成
vits-simple-api-v2.0 声音推理api服务
1
@科哥AIGC
17
31H
更新时间:
2025-07-29
支持自启动
vits-simple-api一个出色的声音API管理应用。
vits-simple-api一个出色的声音API管理应用。
0
元/小时
部署实例
语音合成
数字人
LatentSync1.5数字人视频制作v1.5.3
1
@科哥AIGC
80
451H
更新时间:
2025-07-22
支持自启动
LatentSync1.5是字节跳动2025年3月开源的端到端唇形同步框架,基于潜在扩散模型,仅用6 GB显存即可将任意音频驱动成高分辨率、时序连贯的中文说话视频
LatentSync1.5是字节跳动2025年3月开源的端到端唇形同步框架,基于潜在扩散模型,仅用6 GB显存即可将任意音频驱动成高分辨率、时序连贯的中文说话视频
0
元/小时
部署实例
TTS
index-tts
1
@十字鱼
45
115H
更新时间:
2025-07-21
B站开源工业级可控高效语音克隆
B站开源工业级可控高效语音克隆
0
元/小时
部署实例
语音合成
Srt-AI-Voice-Assistant+GPT-SoVITS-2506(V2Pro)
1
@数列解析几何一生之敌
52
2431H
更新时间:
2025-08-23
支持自启动
Srt-AI-Voice-Assistant配音辅助工具搭配GSV的镜像
Srt-AI-Voice-Assistant配音辅助工具搭配GSV的镜像
0
元/小时
部署实例
Flux
ComfyUI
Lora
ai-tookit-lora-train
1
@有趣的80后程序员
129
1242H
更新时间:
2025-08-11
aitookit lora 训练镜像-包含flux kontext 模型与数据集
aitookit lora 训练镜像-包含flux kontext 模型与数据集
0
元/小时
部署实例
推理框架
AstrBot
1
@AstrBotDevs
6
44H
更新时间:
2025-07-31
AstrBot 是一个支持 QQ、微信、飞书等多消息平台部署、具有易用的插件系统和完善的大语言模型(LLM)接入功能的聊天机器人及开发框架。
AstrBot 是一个支持 QQ、微信、飞书等多消息平台部署、具有易用的插件系统和完善的大语言模型(LLM)接入功能的聊天机器人及开发框架。
0
元/小时
部署实例
SD
Forge WebUI大镜像
1
@龙没耳
31
228H
更新时间:
2025-07-18
Forge WebUI大镜像
Forge WebUI大镜像
0
元/小时
部署实例
TTS
vits-simple-api
1
@Artrajz
4
10H
更新时间:
2025-07-29
vits-simple-api语音合成推理服务,支持vits、hubert-vits、w2v2-vits、bert-vits2、gpt-sovits
vits-simple-api语音合成推理服务,支持vits、hubert-vits、w2v2-vits、bert-vits2、gpt-sovits
0
元/小时
部署实例
ComfyUI
音乐
最强图片数字人Multitalk唱歌说话(支持长视频)
1
@与AI同行
258
1887H
更新时间:
2025-07-31
支持自启动
最强的图片数字人,支持唱歌、说话,效果超强!
最强的图片数字人,支持唱歌、说话,效果超强!
0
元/小时
部署实例
数字人
LiveTalking_GPT-SOVITS-V2_Ollama_洛曦AI数字人
1
@Ikaros
367
1191H
更新时间:
2025-07-11
LiveTalking + GPT-SOVITS V2 + Ollama + FunASR 洛曦AI定制版。 实时语音对话数字人 + 直播版数字人 注意防火墙需要开放UDP所有的端口,让WebRTC可以建立通信
LiveTalking + GPT-SOVITS V2 + Ollama + FunASR 洛曦AI定制版。 实时语音对话数字人 + 直播版数字人 注意防火墙需要开放UDP所有的端口,让WebRTC可以建立通信
0
元/小时
部署实例
语音合成
musetalk1.5音频驱动视频生成数字人汉化webUI版 构建By科哥
1
@科哥AIGC
24
76H
更新时间:
2025-07-15
支持自启动
musetalk1.5音频驱动视频生成数字人汉化webUI版 构建By科哥
musetalk1.5音频驱动视频生成数字人汉化webUI版 构建By科哥
0
元/小时
部署实例
TTS
index-tts-api-v1.5-ap在线推理服务deepspeed加速版
1
@科哥AIGC
28
34H
更新时间:
2025-07-15
index-tts-api-v1.5 在线推理服务deepspeed加速版封装,支持自行调用API
index-tts-api-v1.5 在线推理服务deepspeed加速版封装,支持自行调用API
0
元/小时
部署实例
数字人
MuseTalk
1
@有黑眼圈的小竹能
55
87H
更新时间:
2025-07-15
MuseTalk数字人模型,建议选择显存48G及以上的GPU
MuseTalk数字人模型,建议选择显存48G及以上的GPU
0.3
元/小时
部署实例
语音识别
ASR大集合-V1.0
1
@Ikaros
19
196H
更新时间:
2025-07-09
搜集主流的开源ASR项目,提供api接口或webui页面完成ASR工作。 目前内置的项目有:FunASR(SenseVoice、speech_paraformer-large)、FireRedASR、PaddleSpeech
搜集主流的开源ASR项目,提供api接口或webui页面完成ASR工作。 目前内置的项目有:FunASR(SenseVoice、speech_paraformer-large)、FireRedASR、PaddleSpeech
0
元/小时
部署实例
TTS
语音克隆
MOSS-TTSD邱锡鹏团队开源最新百万小时训练声音推理模型声音克隆 构建By科哥
1
@科哥AIGC
9
2H
更新时间:
2025-07-31
支持自启动
MOSS-TTSD邱锡鹏团队开源最新百万小时训练声音推理模型声音克隆 构建By科哥
MOSS-TTSD邱锡鹏团队开源最新百万小时训练声音推理模型声音克隆 构建By科哥
0
元/小时
部署实例
推理框架
LangBot
1
@LangBotTeam
5
12H
更新时间:
2025-07-31
简单易用的大模型即时通信机器人开发平台,支持 QQ 微信 企微 飞书 钉钉 等多种平台,已配置好 Ollama DeepSeek 模型
简单易用的大模型即时通信机器人开发平台,支持 QQ 微信 企微 飞书 钉钉 等多种平台,已配置好 Ollama DeepSeek 模型
0
元/小时
部署实例
Flux
Lora
lora-scripts
1
@Faych
350
302H
更新时间:
2025-07-11
lora-scripts镜像提供轻量级LoRA训练套件,集成Kohya_ss训练器与WebUI界面,支持一键式模型微调、数据集预处理及参数可视化,简化Stable Diffusion衍生模型的定制流程,开箱即用。
lora-scripts镜像提供轻量级LoRA训练套件,集成Kohya_ss训练器与WebUI界面,支持一键式模型微调、数据集预处理及参数可视化,简化Stable Diffusion衍生模型的定制流程,开箱即用。
0
元/小时
部署实例
数字人
Latentsync1.6最新牛哥魔改版本
1
@NiuGee
173
825H
更新时间:
2025-07-08
牛哥专属调教版本: 开机即用 默认授权码9259 做了队列限制,多人排队,默认依次执行
牛哥专属调教版本: 开机即用 默认授权码9259 做了队列限制,多人排队,默认依次执行
0
元/小时
部署实例
Flux
图片生成
Kontext-Nunchaku极速修图(含基础工作流)
1
@ai来事
55
164H
更新时间:
2025-07-14
支持自启动
Kontext-Nunchaku 是一款结合了 FLUX.1 Kontext 图像编辑模型与 Nunchaku 高性能推理加速引擎的工具。它支持基于文本和图像的精准局部修改,能有效实现无损细节的水印擦除,并可在几乎不损失画质的前提下显著提升推理速度
Kontext-Nunchaku 是一款结合了 FLUX.1 Kontext 图像编辑模型与 Nunchaku 高性能推理加速引擎的工具。它支持基于文本和图像的精准局部修改,能有效实现无损细节的水印擦除,并可在几乎不损失画质的前提下显著提升推理速度
0
元/小时
部署实例
ComfyUI
图片生成
ComfyUI_nunchaku 双节棍极速搓图
1
@ai来事
35
76H
更新时间:
2025-07-08
支持自启动
comfyui+nunchaku极速出图、改图!
comfyui+nunchaku极速出图、改图!
0
元/小时
部署实例
Flux
图片生成
Flux-kontext & Nunchaku急速高清修复工作流
1
@匹夫
276
2018H
更新时间:
2025-07-07
Flux-kontext & Nunchaku急速高清修复工作流
Flux-kontext & Nunchaku急速高清修复工作流
0
元/小时
部署实例
ComfyUI
图片生成
Kontext-ComfyUI-多种玩法合集
1
@AI-KSK
43
62H
更新时间:
2025-07-29
开源的SOTA级图像编辑模型的多种应用
开源的SOTA级图像编辑模型的多种应用
0
元/小时
部署实例
ComfyUI
图片生成
comfyui_Kontext_Dev
0
@ai来事
32
410H
更新时间:
2025-07-03
最强大的图片编辑模型,支持基础修改、风格转换、角色一致性、文本编辑
最强大的图片编辑模型,支持基础修改、风格转换、角色一致性、文本编辑
0
元/小时
部署实例
Flux
图片生成
FLUX.1-Kontext-dev
0
@十字鱼
75
236H
更新时间:
2025-07-14
FLUX.1-Kontext-dev是Black Forest Labs开源的120亿参数图像编辑模型,基于文本指令修改图片,支持角色、风格、物体引用,无需微调即可多步编辑,训练效率高
FLUX.1-Kontext-dev是Black Forest Labs开源的120亿参数图像编辑模型,基于文本指令修改图片,支持角色、风格、物体引用,无需微调即可多步编辑,训练效率高
0
元/小时
部署实例
语音合成
voice-changer
0
@skl
70
516H
更新时间:
2025-07-14
Voice-Changer(VCClient)是 w-okada 开源的跨平台实时 AI 变声器,内置 RVC、Beatrice v2、MMVC、DDSP-SVC 等主流模型
Voice-Changer(VCClient)是 w-okada 开源的跨平台实时 AI 变声器,内置 RVC、Beatrice v2、MMVC、DDSP-SVC 等主流模型
0
元/小时
部署实例
TTS
数字人
multitalk数字人-indextts语音克隆工作流
0
@匹夫
232
794H
更新时间:
2025-07-07
镜像集成了multitalk数字人工作流与indextts语音克隆工作流
镜像集成了multitalk数字人工作流与indextts语音克隆工作流
0
元/小时
部署实例
语音合成
GPT-SoVITS
4
@aiguoliuguo
1294
5278H
更新时间:
2025-07-07
GPT-SoVITS-V4(v2Pro,v2ProPlus),所需素材少,训练耗时短,情绪可控。
GPT-SoVITS-V4(v2Pro,v2ProPlus),所需素材少,训练耗时短,情绪可控。
0
元/小时
部署实例
TTS
index-tts在线api声音克隆快速声音生成api服务用于听小说语音直播等
0
@科哥AIGC
69
527H
更新时间:
2025-07-22
index-tts在线api声音克隆快速声音生成api服务用于听小说语音直播等
index-tts在线api声音克隆快速声音生成api服务用于听小说语音直播等
0
元/小时
部署实例
Flux
视频生成
6-20更新-大凯智障君VACE/FusionX专属AI视频镜像
0
@大凯智障君
102
488H
更新时间:
2025-07-07
6-23更新v2.7-大凯智障君-VACE / FusionX 专属AI视频镜像本镜像中包括了:最新的面部追踪流程、 Flux文生图+高清放大工作流 VACE / FusionX 文生视频、图生视频、视频生视频、首帧+尾帧视频comfyUI工作流。 如果你需要学习AIGC相关课程,可以前往哔哩哔哩(免费课程): https://space.bilibili.com/499577088
6-23更新v2.7-大凯智障君-VACE / FusionX 专属AI视频镜像本镜像中包括了:最新的面部追踪流程、 Flux文生图+高清放大工作流 VACE / FusionX 文生视频、图生视频、视频生视频、首帧+尾帧视频comfyUI工作流。 如果你需要学习AIGC相关课程,可以前往哔哩哔哩(免费课程): https://space.bilibili.com/499577088
0
元/小时
部署实例
Hunyuan
Hunyuan3D-2.1
0
@苍耳阿猫
10
0H
更新时间:
2025-07-14
Hunyuan3D-2.1是腾讯开源的3D生成大模型,支持文本、图片、草图输入,生成高精度PBR材质与几何模型,加速游戏、影视、工业设计等领域3D资产创建,推动3D生成技术发展
Hunyuan3D-2.1是腾讯开源的3D生成大模型,支持文本、图片、草图输入,生成高精度PBR材质与几何模型,加速游戏、影视、工业设计等领域3D资产创建,推动3D生成技术发展
0
元/小时
部署实例
三维重建
PartPacker
0
@十字鱼
15
36H
更新时间:
2025-07-14
单图生成零件级3D模型-PartPacker是 NVIDIA 开源的单视图零件级 3D 对象生成框架,通过“双体素打包”将整体与部件隐式编码解耦
单图生成零件级3D模型-PartPacker是 NVIDIA 开源的单视图零件级 3D 对象生成框架,通过“双体素打包”将整体与部件隐式编码解耦
0
元/小时
部署实例
AI编程
n8n
0
@敢敢のwings
7
36H
更新时间:
2025-07-10
n8n 是一个工作流自动化平台,为技术团队提供代码的灵活性和无代码的速度。拥有 400+ 集成、原生 AI 功能和公平代码许可证,n8n 让您构建强大的自动化,同时保持对数据和部署的完全控制。
n8n 是一个工作流自动化平台,为技术团队提供代码的灵活性和无代码的速度。拥有 400+ 集成、原生 AI 功能和公平代码许可证,n8n 让您构建强大的自动化,同时保持对数据和部署的完全控制。
0
元/小时
部署实例
Flux
视频生成
大凯智障君-VACE / FusionX 专属AI视频镜像
0
@大凯智障君
74
439H
更新时间:
2025-07-03
大凯智障君-VACE / FusionX 专属AI视频镜像:包含Flux文生图高清放大、VACE模型视频创作流程、FusionX模型的图生视频、文生视频、视频转视频等最新的comfyUI工作流,我会定期更新本教学镜像,欢迎大家学习和测试使用。
大凯智障君-VACE / FusionX 专属AI视频镜像:包含Flux文生图高清放大、VACE模型视频创作流程、FusionX模型的图生视频、文生视频、视频转视频等最新的comfyUI工作流,我会定期更新本教学镜像,欢迎大家学习和测试使用。
0
元/小时
部署实例
音乐
SongGeneration
0
@Smzh
6
28H
更新时间:
2025-07-07
tencent-ailab旗下的SongGeneration项目,目前只有base模型
tencent-ailab旗下的SongGeneration项目,目前只有base模型
0
元/小时
部署实例
TTS
语音克隆
Voila-语音语言模型
0
@敢敢のwings
12
4H
更新时间:
2025-07-02
Voila是一个超越人类反应速度的开源语音大模型,专为实时情感对话而设计。作为由美国加州大学圣地亚哥分校、阿联酋穆罕默德·本·扎耶德人工智能大学以及Maitrix.org团队共同开发的革命性语音基础模型,Voila采用端到端架构,实现了195ms超快响应,支持百万音色和10秒声音克隆,是构建有温度AI语音交互系统的理想选择。
Voila是一个超越人类反应速度的开源语音大模型,专为实时情感对话而设计。作为由美国加州大学圣地亚哥分校、阿联酋穆罕默德·本·扎耶德人工智能大学以及Maitrix.org团队共同开发的革命性语音基础模型,Voila采用端到端架构,实现了195ms超快响应,支持百万音色和10秒声音克隆,是构建有温度AI语音交互系统的理想选择。
0
元/小时
部署实例
推理框架
Langchain-Chatchat
0
@BhAem
10
106H
更新时间:
2025-07-14
Langchain-Chatchat 是一种利用 langchain 思想实现的基于本地知识库的问答应用,目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案
Langchain-Chatchat 是一种利用 langchain 思想实现的基于本地知识库的问答应用,目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案
0
元/小时
部署实例
具身智能
v-jepa2
0
@敢敢のwings
1
0H
更新时间:
2025-07-07
V-JEPA 2(Video Joint-Embedding Predictive Architecture 2)是Meta AI在世界模型构建领域的重大突破,这是一个能够像人类一样理解、预测和规划的自监督视频模型
V-JEPA 2(Video Joint-Embedding Predictive Architecture 2)是Meta AI在世界模型构建领域的重大突破,这是一个能够像人类一样理解、预测和规划的自监督视频模型
0
元/小时
部署实例
数字人
OpenAvatarChat——十字鱼镜像
0
@十字鱼
181
3332H
更新时间:
2025-07-14
阿里开源实时交互数字。 模块化的交互数字人对话实现,能够在单台PC上运行完整功能。
阿里开源实时交互数字。 模块化的交互数字人对话实现,能够在单台PC上运行完整功能。
0
元/小时
部署实例
Flux
ComfyUI
Wan
Comfyui热门工作流
0
@匹夫
980
4420H
更新时间:
2025-07-05
最新版comfyui,集成了360旋转工作流,WAN2.1视频转绘工作流,和图片重绘、flux-kontex工作流
最新版comfyui,集成了360旋转工作流,WAN2.1视频转绘工作流,和图片重绘、flux-kontex工作流
0
元/小时
部署实例
语音合成
语音克隆
GPT-Sovits_V4
2
@红血球AE3803
1073
6907H
更新时间:
2025-07-14
GPT-SoVITS V4 是 RVC-Boss 开源的极致低门槛 TTS/变声器,仅需 1 分钟干声即可训练高相似音色;V4 修复金属失真并原生输出 48 kHz,支持中英日韩粤五语种零样本与跨语言推理
GPT-SoVITS V4 是 RVC-Boss 开源的极致低门槛 TTS/变声器,仅需 1 分钟干声即可训练高相似音色;V4 修复金属失真并原生输出 48 kHz,支持中英日韩粤五语种零样本与跨语言推理
0
元/小时
部署实例
Lora
FluxGym
0
@匹夫
388
1462H
更新时间:
2025-08-01
最简单的lora制作工具,三步让你制作出自己的lora
最简单的lora制作工具,三步让你制作出自己的lora
0
元/小时
部署实例
文本生成
TabbyAPI
0
@Smzh
3
2H
更新时间:
2025-07-14
TabbyAPI 是 ExLlamaV2 官方开源的高性能文本生成服务器,OpenAI 兼容、轻量极速,支持 Exl2/GPTQ/FP16 模型,内置并发批处理、LoRA 热插、工具调用与草稿推测解码
TabbyAPI 是 ExLlamaV2 官方开源的高性能文本生成服务器,OpenAI 兼容、轻量极速,支持 Exl2/GPTQ/FP16 模型,内置并发批处理、LoRA 热插、工具调用与草稿推测解码
0
元/小时
部署实例
文本生成
Text-Generation-Webui
0
@Smzh
4
2H
更新时间:
2025-07-14
Text-Generation-Webui大语言模型综合终端。Text-Generation-Webui 是 oobabooga 开发的开源 LLM 前端,被誉为“文本界的 AUTOMATIC1111”,支持 llama.cpp、Transformers、ExLlamaV3、TensorRT-LLM 等多种后端
Text-Generation-Webui大语言模型综合终端。Text-Generation-Webui 是 oobabooga 开发的开源 LLM 前端,被誉为“文本界的 AUTOMATIC1111”,支持 llama.cpp、Transformers、ExLlamaV3、TensorRT-LLM 等多种后端
0
元/小时
部署实例
图片生成
DreamO-v1.0
0
@科哥AIGC
9
4H
更新时间:
2025-07-05
DreamO实现了比以前的适配器方法更高的保真度,在保留字符身份方面具有明显的优势。
DreamO实现了比以前的适配器方法更高的保真度,在保留字符身份方面具有明显的优势。
0
元/小时
部署实例
Wan
视频生成
Wan2.1-AI视频创作多功能合集
0
@AI-KSK
160
803H
更新时间:
2025-08-31
这是一套强大的AI视频生成工具包,支持文生视频、图生视频,具备动作、镜头、参考图等高级控制功能,并可进行首尾特效、风格转绘、数字人生成等后期处理。
这是一套强大的AI视频生成工具包,支持文生视频、图生视频,具备动作、镜头、参考图等高级控制功能,并可进行首尾特效、风格转绘、数字人生成等后期处理。
0
元/小时
部署实例
ComfyUI
Wan
ComfyUI-WAN-AI视频
0
@Hugo
43
344H
更新时间:
2025-07-05
支持自启动
Wan2.1模型的文生视频、图生视频、首尾帧过渡动画体验镜像
Wan2.1模型的文生视频、图生视频、首尾帧过渡动画体验镜像
0
元/小时
部署实例
其他
吟惋兮-自动部署本地QQ机器人
0
@吟惋兮
23
66H
更新时间:
2025-07-04
一键部署AstrBot+NapCat+Ollama,兼容所有nv显卡 当廉价的喜欢布满街道 纯粹的爱意显得弱不禁风
一键部署AstrBot+NapCat+Ollama,兼容所有nv显卡 当廉价的喜欢布满街道 纯粹的爱意显得弱不禁风
0
元/小时
部署实例
DeepSeek
DeepSeek-R1-0528-Qwen3-8B
0
@苍耳阿猫
22
282H
更新时间:
2025-07-14
DeepSeek R1 模型进行了小版本升级,当前版本为 DeepSeek-R1-0528。在最新的更新中,DeepSeek R1 通过利用增加的计算资源并在后训练期间引入算法优化机制,显著提高了其推理和推理能力的深度。
DeepSeek R1 模型进行了小版本升级,当前版本为 DeepSeek-R1-0528。在最新的更新中,DeepSeek R1 通过利用增加的计算资源并在后训练期间引入算法优化机制,显著提高了其推理和推理能力的深度。
0
元/小时
部署实例
图片生成
Niugee-HiDream-I1
0
@NiuGee
29
46H
更新时间:
2025-07-25
支持自启动
使用Hidream,一次性生成一批图片
使用Hidream,一次性生成一批图片
0
元/小时
部署实例
TTS
语音克隆
Index-TTS
0
@科哥AIGC
66
154H
更新时间:
2025-06-17
index-tts来自B站的一个工业级别的声音克隆应用
index-tts来自B站的一个工业级别的声音克隆应用
0
元/小时
部署实例
数字人
Fay数字人-3.1.1
0
@郭泽斌
88
268H
更新时间:
2025-07-14
Fay数字人3.1.1最小可运行版。fay是一个帮助数字人(2.5d、3d、移动、pc、网页)或大语言模型(openai兼容、deepseek)连通业务系统的mcp框架。
Fay数字人3.1.1最小可运行版。fay是一个帮助数字人(2.5d、3d、移动、pc、网页)或大语言模型(openai兼容、deepseek)连通业务系统的mcp框架。
0
元/小时
部署实例
数字人
HeyGem-Linux-Python-Hack-v1.0.2
0
@科哥AIGC
88
1238H
更新时间:
2025-06-17
支持自启动
HeyGem的docker免费离线版本,你只需要Python和Linux!
HeyGem的docker免费离线版本,你只需要Python和Linux!
0
元/小时
部署实例
TTS
语音克隆
F5-TTS
0
@科哥AIGC
30
128H
更新时间:
2025-07-28
支持自启动
F5-TTS 是由上海交通大学、剑桥大学和吉利汽车研究院(宁波)有限公司于 2024 年共同开源的一款高性能文本到语音 (TTS) 系统,它基于流匹配的非自回归生成方法,结合了扩散变换器 (DiT) 技术。
F5-TTS 是由上海交通大学、剑桥大学和吉利汽车研究院(宁波)有限公司于 2024 年共同开源的一款高性能文本到语音 (TTS) 系统,它基于流匹配的非自回归生成方法,结合了扩散变换器 (DiT) 技术。
0
元/小时
部署实例
语音合成
Voice-Changer
0
@icecoins
79
1817H
更新时间:
2025-07-14
Voice-Changer 云端在线变声器。Voice-Changer(VCClient)是 w-okada 开源的跨平台实时 AI 变声器,内置 RVC、Beatrice v2、MMVC、DDSP-SVC 等主流模型
Voice-Changer 云端在线变声器。Voice-Changer(VCClient)是 w-okada 开源的跨平台实时 AI 变声器,内置 RVC、Beatrice v2、MMVC、DDSP-SVC 等主流模型
0
元/小时
部署实例
图片生成
HiDream-I1
0
@苍耳阿猫
13
10H
更新时间:
2025-07-03
HiDream-I1是一种新的开源图像生成基础模型,具有 17B 参数,可在几秒钟内实现最先进的图像生成质量。
HiDream-I1是一种新的开源图像生成基础模型,具有 17B 参数,可在几秒钟内实现最先进的图像生成质量。
0
元/小时
部署实例
Qwen
推理框架
LLaMAFactory-0.9.3.dev-Qwen3-8B
0
@llamafactory_cn
54
1136H
更新时间:
2025-09-05
本镜像基于 LLaMA-Factory 框架,支持在多张 4090 GPU 上进行模型微调。
本镜像基于 LLaMA-Factory 框架,支持在多张 4090 GPU 上进行模型微调。
0
元/小时
部署实例
蛋白结构预测
Alphafold3
0
@
4
20H
更新时间:
2025-07-03
Alphafold3基础镜像,无MSA所需的数据库,无模型权重文件,需要自行下载
Alphafold3基础镜像,无MSA所需的数据库,无模型权重文件,需要自行下载
0
元/小时
部署实例
文本生成
其他
InternVL
0
@CC仔
2
0H
更新时间:
2025-07-03
支持自启动
InternVL 系列:GPT-4o 的开创性开源替代品。 接近GPT-4o表现的开源多模态对话模型
InternVL 系列:GPT-4o 的开创性开源替代品。 接近GPT-4o表现的开源多模态对话模型
0
元/小时
部署实例
ComfyUI
Wan
视频生成
AI视频生成-ComfyUI-Wan2.1-多功能大合集
0
@AI-KSK
246
872H
更新时间:
2025-08-31
这是一套强大的AI视频生成工具包,支持文生视频、图生视频,具备动作、镜头、参考图等高级控制功能,并可进行首尾特效、风格转绘、数字人生成等后期处理。
这是一套强大的AI视频生成工具包,支持文生视频、图生视频,具备动作、镜头、参考图等高级控制功能,并可进行首尾特效、风格转绘、数字人生成等后期处理。
0
元/小时
部署实例
文本生成
其他
ZhongJing-仲景中医大语言模型
0
@CC仔
19
116H
更新时间:
2025-07-03
支持自启动
首个中医大语言模型——“仲景”。受古代中医学巨匠张仲景深邃智慧启迪,专为传统中医领域打造的预训练大语言模型。
首个中医大语言模型——“仲景”。受古代中医学巨匠张仲景深邃智慧启迪,专为传统中医领域打造的预训练大语言模型。
0
元/小时
部署实例
语音克隆
gpt-sovits-v4
0
@39c5bb
179
398H
更新时间:
2025-07-03
GPT-SoVITS,已更新V4,[优先使用较新镜像],所需素材少,训练耗时短,情绪较可控。已打包好整个流程所需的所有环境,开箱即用。
GPT-SoVITS,已更新V4,[优先使用较新镜像],所需素材少,训练耗时短,情绪较可控。已打包好整个流程所需的所有环境,开箱即用。
0
元/小时
部署实例
ComfyUI
Lora
三面ComfyUI
0
@三面君
131
324H
更新时间:
2025-07-04
支持自启动
三面ComfyUI,400GB精选模型 + 105个常用节点
三面ComfyUI,400GB精选模型 + 105个常用节点
0
元/小时
部署实例
Qwen
推理框架
Qwen3-vLLM-Series
1
@优云智算
官方
62
274H
更新时间:
2025-07-03
Qwen3系列模型,单卡4090推荐0.6B-8B模型,2卡推荐14B模型,4卡推荐32B模型
Qwen3系列模型,单卡4090推荐0.6B-8B模型,2卡推荐14B模型,4卡推荐32B模型
0
元/小时
部署实例
Lora
Wan
Wan2.1-Lora训练
0
@麻雀
16
38H
更新时间:
2025-07-03
WAN2.1-lora训练包,基于kohya的musubi-tuner和TTP大佬的gui,我增加了tensorboard功能,希望能够帮助到大家!共建wan视频生态。
WAN2.1-lora训练包,基于kohya的musubi-tuner和TTP大佬的gui,我增加了tensorboard功能,希望能够帮助到大家!共建wan视频生态。
0
元/小时
部署实例
Qwen
推理框架
Qwen3-Ollama-Series
0
@苍耳阿猫
19
71H
更新时间:
2025-07-14
Qwen3-0.6B-235B量化模型,支持OpenWebUI。Qwen3-0.6B-235B 是通义千问开源的完整量化模型矩阵,覆盖 0.6B-235B 共 8 个规模(含 MoE 235B-A22B 旗舰),均已 AWQ/FP8/GGUF 量化
Qwen3-0.6B-235B量化模型,支持OpenWebUI。Qwen3-0.6B-235B 是通义千问开源的完整量化模型矩阵,覆盖 0.6B-235B 共 8 个规模(含 MoE 235B-A22B 旗舰),均已 AWQ/FP8/GGUF 量化
0
元/小时
部署实例
视频生成
FramePack图生视频
0
@xiaoxu
77
264H
更新时间:
2025-07-14
FramePack 是 lllyasviel 开源的“下一帧预测”视频扩散框架,通过把任意长度上下文压缩为固定 token,实现 13B 模型在 6 GB 显存笔记本上生成 60 秒 30 fps 视频
FramePack 是 lllyasviel 开源的“下一帧预测”视频扩散框架,通过把任意长度上下文压缩为固定 token,实现 13B 模型在 6 GB 显存笔记本上生成 60 秒 30 fps 视频
0
元/小时
部署实例
数字人
DeepFaceLab训练环境dfl训练linux环境v1.0
0
@科哥AIGC
24
140H
更新时间:
2025-07-14
DeepFaceLab训练环境dfl训练linux环境v1.0。DeepFaceLab 是开源换脸领域最成熟的端到端工具链,单仓库整合数据标注、人脸对齐、模型训练与合成全流程,支持 SAEHD、DFDNet、XSeg 等主流网络
DeepFaceLab训练环境dfl训练linux环境v1.0。DeepFaceLab 是开源换脸领域最成熟的端到端工具链,单仓库整合数据标注、人脸对齐、模型训练与合成全流程,支持 SAEHD、DFDNet、XSeg 等主流网络
0
元/小时
部署实例
数字人
Heygem数字人WebUI轻量版 By科哥
0
@科哥AIGC
238
683H
更新时间:
2025-07-03
支持自启动
Heygem数字人WebUI轻量版视频生成数字人克隆对口型音频驱动视频构建By科哥
Heygem数字人WebUI轻量版视频生成数字人克隆对口型音频驱动视频构建By科哥
0
元/小时
部署实例
ComfyUI
ComfyUI-v0.3.26+JoyCaption2
0
@龙没耳
66
569H
更新时间:
2025-07-18
ComfyUI-v0.3.26+JoyCaption2 集成包开箱即用,已预装 ComfyUI-v0.3.26 及 JoyCaption2 反推节点,支持图生文、批量打标、中文语义优化
ComfyUI-v0.3.26+JoyCaption2 集成包开箱即用,已预装 ComfyUI-v0.3.26 及 JoyCaption2 反推节点,支持图生文、批量打标、中文语义优化
0
元/小时
部署实例
GLM
GLM-4-0414
0
@苍耳阿猫
8
2H
更新时间:
2025-07-14
智谱GLM 家族迎来新一代开源模型 GLM-4-32B-0414 系列,320 亿参数,效果比肩 OpenAI 的 GPT 系列和 DeepSeek 的 V3/R1 系列,且支持非常友好的本地部署特性
智谱GLM 家族迎来新一代开源模型 GLM-4-32B-0414 系列,320 亿参数,效果比肩 OpenAI 的 GPT 系列和 DeepSeek 的 V3/R1 系列,且支持非常友好的本地部署特性
0
元/小时
部署实例
官方镜像
HeyGem-lite
0
@优云智算
官方
42
38H
更新时间:
-
HeyGem镜像使用教程,HeyGem是由Duix.com开发的免费开源 AI 头像项目。
HeyGem镜像使用教程,HeyGem是由Duix.com开发的免费开源 AI 头像项目。
0
元/小时
部署实例
推理框架
LLaMA-Factory-YingHuoAI
0
@萤火君
93
2034H
更新时间:
2025-07-08
LLaMA-Factory(v0.9.2)大模型训练环境,内置WebUI启动器和API启动器,以及常用的6B、7B、8B、9B模型。
LLaMA-Factory(v0.9.2)大模型训练环境,内置WebUI启动器和API启动器,以及常用的6B、7B、8B、9B模型。
0
元/小时
部署实例
Qwen
Qwen-vLLM-Series
1
@优云智算
官方
54
2044H
更新时间:
2025-07-14
包含Qwen2.5-VL多模态、QWQ-32B两个模型,并带有WebUI界面,立即部署即可快速使用
包含Qwen2.5-VL多模态、QWQ-32B两个模型,并带有WebUI界面,立即部署即可快速使用
0
元/小时
部署实例
Qwen
Qwen2.5-Omni
0
@苍耳阿猫
8
8H
更新时间:
2025-07-14
Qwen 2.5-Omni是一个端到端的多模态大语言模型,旨在感知包括文本、图像、音频和视频在内的多种模态,同时以流式的方式生成文本和自然语音响应,该镜像推荐使用单卡A100
Qwen 2.5-Omni是一个端到端的多模态大语言模型,旨在感知包括文本、图像、音频和视频在内的多种模态,同时以流式的方式生成文本和自然语音响应,该镜像推荐使用单卡A100
0
元/小时
部署实例
Gemma
gemma3
0
@Coderabo
8
0H
更新时间:
2025-07-28
Google发布的Gemma_3全系列模型
Google发布的Gemma_3全系列模型
0
元/小时
部署实例
具身智能
GR00T-NIVIDIA
0
@敢敢のwings
14
218H
更新时间:
2025-07-28
NVIDIA Isaac GR00T N1是全球首个用于通用人形机器人推理和技能的开源基础模型。
NVIDIA Isaac GR00T N1是全球首个用于通用人形机器人推理和技能的开源基础模型。
0
元/小时
部署实例
Hunyuan
hunyuan3D-2
0
@苍耳阿猫
32
38H
更新时间:
2025-07-14
混元 3D 2.0 是一款先进的大规模 3D 资产创作系统,它可以用于生成带有高分辨率纹理贴图的高保真度3D模型。该系统包含两个基础组件:一个大规模几何生成模型 — 混元 3D-DiT,以及一个大规模纹理生成模型 — 混元 3D-Paint
混元 3D 2.0 是一款先进的大规模 3D 资产创作系统,它可以用于生成带有高分辨率纹理贴图的高保真度3D模型。该系统包含两个基础组件:一个大规模几何生成模型 — 混元 3D-DiT,以及一个大规模纹理生成模型 — 混元 3D-Paint
0
元/小时
部署实例
Hunyuan
Hunyuan3D-2.0
0
@39c5bb
19
20H
更新时间:
2025-07-01
腾讯混元3d生成模型,自带环境,开箱即用
腾讯混元3d生成模型,自带环境,开箱即用
0
元/小时
部署实例
语音分离
MSST
1
@aiguoliuguo
1005
1714H
更新时间:
2025-07-03
MSST-webUI版本,更简单,加入一键处理,效率更高,更好用的干声分离以及去和声混响的项目,可以作为传统UVR的上位替代,并兼容UVR的模型,简单且快。
MSST-webUI版本,更简单,加入一键处理,效率更高,更好用的干声分离以及去和声混响的项目,可以作为传统UVR的上位替代,并兼容UVR的模型,简单且快。
0
元/小时
部署实例
Gemma
推理框架
Ollama-Gemma 3
0
@苍耳阿猫
32
12H
更新时间:
2025-07-14
Gemma 3 是谷歌最新推出的开源轻量级多模态模型,被称为全球最强的单加速器模型,在单 GPU 或 TPU 环境下表现显著优于其他同类模型。它支持超过 140 种语言的预训练,直接支持超过 35 种语言,具备分析文本、图像及短视频的能力
Gemma 3 是谷歌最新推出的开源轻量级多模态模型,被称为全球最强的单加速器模型,在单 GPU 或 TPU 环境下表现显著优于其他同类模型。它支持超过 140 种语言的预训练,直接支持超过 35 种语言,具备分析文本、图像及短视频的能力
0
元/小时
部署实例
ComfyUI
ComfyUI-v0.3.26
0
@龙没耳
267
270H
更新时间:
2025-07-18
ComfyUI-v0.3.26,预装了ComfyUI相关常用插件,点击立即部署开箱即用,快速体验
ComfyUI-v0.3.26,预装了ComfyUI相关常用插件,点击立即部署开箱即用,快速体验
0
元/小时
部署实例
ComfyUI
Wan
ComfyUI-Wanx-I2V
0
@Faych
140
462H
更新时间:
2025-07-14
ComfyUI-Wanx-I2V是社区为阿里开源视频模型 Wan2.1 定制的 ComfyUI 原生图生视频工作流节点包,一键运行wanx i2v
ComfyUI-Wanx-I2V是社区为阿里开源视频模型 Wan2.1 定制的 ComfyUI 原生图生视频工作流节点包,一键运行wanx i2v
0
元/小时
部署实例
语音克隆
GPT-SoVITS-V3
0
@39c5bb
275
82H
更新时间:
2025-07-10
GPT-SoVITS,已更新V3,[优先使用较新镜像],所需素材少,训练耗时短,情绪较可控。已打包好整个流程所需的所有环境,开箱即用。
GPT-SoVITS,已更新V3,[优先使用较新镜像],所需素材少,训练耗时短,情绪较可控。已打包好整个流程所需的所有环境,开箱即用。
0
元/小时
部署实例
推理框架
OpenManus自动生成项目
0
@敢敢のwings
78
188H
更新时间:
2025-07-03
这个镜像提供了一个免费的OpenManus环境,并基于ollama来快速启动一个 LLM(大型语言模型)应用程序。该项目可支持单卡运行整个项目。
这个镜像提供了一个免费的OpenManus环境,并基于ollama来快速启动一个 LLM(大型语言模型)应用程序。该项目可支持单卡运行整个项目。
0
元/小时
部署实例
Qwen
QwQ-32B-深度思考满血版
0
@敢敢のwings
20
0H
更新时间:
2025-07-03
该版本是满血版本,需要四卡运行!!!Qwen发布了最新的32B推理模型QwQ-32B,其性能在许多基准测试中表现出色,甚至不逊色于671B参数的满血版DeepSeek R1。QwQ-32B基于Qwen2.5-32B,并通过强化学习(RL)进行进一步优化。
该版本是满血版本,需要四卡运行!!!Qwen发布了最新的32B推理模型QwQ-32B,其性能在许多基准测试中表现出色,甚至不逊色于671B参数的满血版DeepSeek R1。QwQ-32B基于Qwen2.5-32B,并通过强化学习(RL)进行进一步优化。
0
元/小时
部署实例
CogView
CogView4-6B
0
@苍耳阿猫
6
0H
更新时间:
2025-07-14
CogView4-6B是清华团队最新开源的60亿参数中文原生文生图扩散模型,支持512-2048分辨率、BF16精度和1024 token超长提示词,中文文字准确率达69.7%
CogView4-6B是清华团队最新开源的60亿参数中文原生文生图扩散模型,支持512-2048分辨率、BF16精度和1024 token超长提示词,中文文字准确率达69.7%
0
元/小时
部署实例
Qwen
QwQ-32B-GGUF
0
@苍耳阿猫
29
20H
更新时间:
2025-07-14
QwQ 是 Qwen 系列中的推理模型。与传统的指令调优模型相比,具备思考和推理能力的 QwQ 在下游任务中,特别是在解决难题时,能够显著提升性能。QwQ-32B 是一个中等规模的推理模型,其性能可以与最先进的推理模型相媲美,例如 DeepSeek-R1、o1-mini
QwQ 是 Qwen 系列中的推理模型。与传统的指令调优模型相比,具备思考和推理能力的 QwQ 在下游任务中,特别是在解决难题时,能够显著提升性能。QwQ-32B 是一个中等规模的推理模型,其性能可以与最先进的推理模型相媲美,例如 DeepSeek-R1、o1-mini
0
元/小时
部署实例
数字人
LivePortrait
0
@windsing
27
64H
更新时间:
2025-07-14
LivePortrait是由快手科技、中国科学技术大学和复旦大学联合开发的一个项目,旨在将驱动视频的表情和姿态迁移到静态或动态人像视频上,生成极具表现力的视频结果
LivePortrait是由快手科技、中国科学技术大学和复旦大学联合开发的一个项目,旨在将驱动视频的表情和姿态迁移到静态或动态人像视频上,生成极具表现力的视频结果
0
元/小时
部署实例
Lora
Koyha-ss Lora训练
0
@windsing
21
14H
更新时间:
2025-07-03
Koyha_ss项目使用了gradio对lora的训练任务进行了封装,提供了可视化交互界面,通过交互界面,可以方面修改训练参数的配置,对小白更加友好。
Koyha_ss项目使用了gradio对lora的训练任务进行了封装,提供了可视化交互界面,通过交互界面,可以方面修改训练参数的配置,对小白更加友好。
0
元/小时
部署实例
Wan
视频生成
ComfyUI-Wanx-T2V
0
@Faych
30
10H
更新时间:
2025-07-14
WAN 2.1 是一款强大的文本到视频(T2V)生成模型,专为创建流畅、高质量的视频内容而设计。该模型提供两个版本:全尺寸14B参数版本(支持FP8精度)和轻量级1.3B参数版本,可根据不同硬件条件灵活选择
WAN 2.1 是一款强大的文本到视频(T2V)生成模型,专为创建流畅、高质量的视频内容而设计。该模型提供两个版本:全尺寸14B参数版本(支持FP8精度)和轻量级1.3B参数版本,可根据不同硬件条件灵活选择
0
元/小时
部署实例
Wan
视频生成
Wan2.1-T2V-1.3B
0
@Alex
10
14H
更新时间:
2025-07-14
Wan2.1-T2V-1.3B是阿里开源的极速版文本到视频扩散模型,仅13亿参数,支持中英文动态文字与复杂运动场景
Wan2.1-T2V-1.3B是阿里开源的极速版文本到视频扩散模型,仅13亿参数,支持中英文动态文字与复杂运动场景
0
元/小时
部署实例
数字人
marketing_creator_pro_max
0
@
99
50H
更新时间:
2025-07-03
数字人成品项目包含数字人克隆、声音克隆、短视频生成、直播(待发布)、AI配音、AI字幕,包括Windows安装版,Web版,H5版,小程序版,副业必备
数字人成品项目包含数字人克隆、声音克隆、短视频生成、直播(待发布)、AI配音、AI字幕,包括Windows安装版,Web版,H5版,小程序版,副业必备
0
元/小时
部署实例
Lora
Wan
视频生成
Wan2.1-WebUI
0
@苍耳阿猫
49
48H
更新时间:
2025-07-14
Wan2.1-WebUI是阿里通义开源视频大模型Wan-2.1的浏览器操作界面,已内置1.3B与14B双精度模型,支持文本/图像一键生成高清视频,提供实时预览、批量脚本与LoRA扩展
Wan2.1-WebUI是阿里通义开源视频大模型Wan-2.1的浏览器操作界面,已内置1.3B与14B双精度模型,支持文本/图像一键生成高清视频,提供实时预览、批量脚本与LoRA扩展
0
元/小时
部署实例
ComfyUI
Wan
ComfyUI-Wan2.1
0
@O_O
92
28H
更新时间:
2025-07-14
阿里推出的视频生成模型,效果媲美商用模型,ComfyUI-Wan2.1镜像集成定制化高级图像生成工作流套件,开箱即用
阿里推出的视频生成模型,效果媲美商用模型,ComfyUI-Wan2.1镜像集成定制化高级图像生成工作流套件,开箱即用
0
元/小时
部署实例
推理框架
ollama
0
@Faych
36
66H
更新时间:
2025-07-14
Ollama镜像提供轻量级大语言模型本地运行框架,支持-R1 (7B/4.7GB)、Llama3.3 一键拉取与运行包括但不限于以下模型:DeepSeek、Llama3.2 、Phi4 、Gemma2:2b 、Mistral
Ollama镜像提供轻量级大语言模型本地运行框架,支持-R1 (7B/4.7GB)、Llama3.3 一键拉取与运行包括但不限于以下模型:DeepSeek、Llama3.2 、Phi4 、Gemma2:2b 、Mistral
0
元/小时
部署实例
其他
SPO-自监督提示优化
0
@Airmomo
34
30H
更新时间:
2025-02-27
基于大语言模型自监督能力的提示优化框架,SPO通过对比不同提示生成的输出质量,自主完成优化迭代。
基于大语言模型自监督能力的提示优化框架,SPO通过对比不同提示生成的输出质量,自主完成优化迭代。
0
元/小时
部署实例
推理框架
xinference_GPU
0
@
27
112H
更新时间:
2025-07-14
Xorbits Inference (Xinference) 是一个开源平台,用于简化各种AI 模型的运行和集成。 借助Xinference,可以使用任何开源LLM、Embedding模型和Rerank模型在云端或本地环境中运行推理
Xorbits Inference (Xinference) 是一个开源平台,用于简化各种AI 模型的运行和集成。 借助Xinference,可以使用任何开源LLM、Embedding模型和Rerank模型在云端或本地环境中运行推理
0
元/小时
部署实例
TTS
Zonos-v0.1
0
@HelloGitHub
14
0H
更新时间:
2025-07-14
Zonos 是一款由 Zyphra 开发的先进开源文本到语音(TTS)模型,基于超过 20 万小时的多语言语音数据训练而成。它能够生成自然流畅的语音,并在表达力和音质上超越许多顶级 TTS 提供商。Zonos 支持零样本语音合成和语音克隆,能够通过几秒钟的参考音频复现说话人的语音特征
Zonos 是一款由 Zyphra 开发的先进开源文本到语音(TTS)模型,基于超过 20 万小时的多语言语音数据训练而成。它能够生成自然流畅的语音,并在表达力和音质上超越许多顶级 TTS 提供商。Zonos 支持零样本语音合成和语音克隆,能够通过几秒钟的参考音频复现说话人的语音特征
0
元/小时
部署实例
语音克隆
RVC
4
@aiguoliuguo
3156
9613H
更新时间:
2025-07-10
AI翻唱+语音变声器:RVC语音转换训练推理用WebUI,3分钟极速训练新模型
AI翻唱+语音变声器:RVC语音转换训练推理用WebUI,3分钟极速训练新模型
0
元/小时
部署实例
其他
OmniParser
0
@HelloGitHub
23
101H
更新时间:
2025-07-14
OmniParser 是微软推出的一款强大的屏幕解析工具,专注于将用户界面截图转化为结构化元素,从而提升视觉模型在图形界面中的交互能力。它通过细粒度的图标检测和交互性预测,为自动化测试、智能助手开发以及无障碍技术提供了强大的支持
OmniParser 是微软推出的一款强大的屏幕解析工具,专注于将用户界面截图转化为结构化元素,从而提升视觉模型在图形界面中的交互能力。它通过细粒度的图标检测和交互性预测,为自动化测试、智能助手开发以及无障碍技术提供了强大的支持
0
元/小时
部署实例
SD
sdwebui_xl_2
0
@xiaolxl
309
1421H
更新时间:
2025-07-14
最新WebUi1.10.0+全新整合包4.0+一个命令启动。Stable-Diffusion-WebUI镜像集成主流文生图可视化工具,通过一键启动界面支持文生图/图生图/局部重绘等全功能创作流程,内置ControlNet/ADetailer等海量插件并兼容SDXL模型,提供开箱即用的本地化AI绘画解决方案
最新WebUi1.10.0+全新整合包4.0+一个命令启动。Stable-Diffusion-WebUI镜像集成主流文生图可视化工具,通过一键启动界面支持文生图/图生图/局部重绘等全功能创作流程,内置ControlNet/ADetailer等海量插件并兼容SDXL模型,提供开箱即用的本地化AI绘画解决方案
0
元/小时
部署实例
DeepSeek
推理框架
LLaMAFactory-0.9.2.dev-DeepSeek-R1-Distill
1
@llamafactory_cn
173
174H
更新时间:
2025-06-24
使用[LLaMA-Factory](https://github.com/hiyouga/LLaMA-Factory)在多张RTX4090上微调DeepSeek-R1-Distill系列模型
使用[LLaMA-Factory](https://github.com/hiyouga/LLaMA-Factory)在多张RTX4090上微调DeepSeek-R1-Distill系列模型
0
元/小时
部署实例
其他
SF_Loc
0
@敢敢のwings
0
0H
更新时间:
2025-07-03
SF-Loc应该算是DBA-Fusion(RAL2024)的改进版。 在image+IMU的基础上额外加了map-aided localization.而所谓的map属于priori map,是由稀疏帧(每帧为稠密的深度)来组成的。而要实现map-aided localization,就需要分别解决mapping以及re-localization的两个问题。
SF-Loc应该算是DBA-Fusion(RAL2024)的改进版。 在image+IMU的基础上额外加了map-aided localization.而所谓的map属于priori map,是由稀疏帧(每帧为稠密的深度)来组成的。而要实现map-aided localization,就需要分别解决mapping以及re-localization的两个问题。
0
元/小时
部署实例
推理框架
TPO-LLM-WebUI
0
@Airmomo
11
0H
更新时间:
2025-07-03
用纯文本提示的方法实时“微调”LLM,使得基础模型在推理过程中与人类偏好对齐,生成更好的结果。`TPO-LLM-WebUI` 为TPO框架提供了一个友好的WebUI以便你加载LLM和奖励模型,以及展示输出结果。
用纯文本提示的方法实时“微调”LLM,使得基础模型在推理过程中与人类偏好对齐,生成更好的结果。`TPO-LLM-WebUI` 为TPO框架提供了一个友好的WebUI以便你加载LLM和奖励模型,以及展示输出结果。
0
元/小时
部署实例
Flux
Lora
Flux-Lora训练ai-toolkit极简可视化窗口
0
@南墙_Rylee
142
672H
更新时间:
2025-07-02
终端输入 cd /root/ai-toolkit && bash /root/ai-toolkit/运行.sh
终端输入 cd /root/ai-toolkit && bash /root/ai-toolkit/运行.sh
0
元/小时
部署实例
DeepSeek
推理框架
KTransformers-DeepSeek-R1
0
@敢敢のwings
77
50H
更新时间:
2025-06-24
建议4卡4090,内存300G以上!KTransformers 使用说明文档,目前支持Q4级别的deepseek的QA对话
建议4卡4090,内存300G以上!KTransformers 使用说明文档,目前支持Q4级别的deepseek的QA对话
0
元/小时
部署实例
语音克隆
BertVits2-2.4中文特化版
0
@aiguoliuguo
11
4H
更新时间:
2025-07-03
0
元/小时
部署实例
语音分离
FishSpeech
0
@aiguoliuguo
57
90H
更新时间:
2025-07-02
Fish Speech,已发布正式版1.5,强大的zero shot能力,支持中日英德法阿拉伯等多国语言。镜像打包了所需的环境,包括干声分离,切片,标注等工具,开箱即用。
Fish Speech,已发布正式版1.5,强大的zero shot能力,支持中日英德法阿拉伯等多国语言。镜像打包了所需的环境,包括干声分离,切片,标注等工具,开箱即用。
0
元/小时
部署实例
推理框架
其他
Satori-7B-Round2-WebUI
0
@蚝油菜花
1
0H
更新时间:
2025-07-02
仅7B就在数学推理能力上超越70B和一众小型模型,MIT与哈佛基于行动-思维链(COAT)机制训练的 Satori-7B-Round2 推理模型。本镜像提供了一个 Gradio API 提供了一个友好的 Web UI,方便快速部署实例后立即体验 Satori-7B-Round2 模型的推理能力。
仅7B就在数学推理能力上超越70B和一众小型模型,MIT与哈佛基于行动-思维链(COAT)机制训练的 Satori-7B-Round2 推理模型。本镜像提供了一个 Gradio API 提供了一个友好的 Web UI,方便快速部署实例后立即体验 Satori-7B-Round2 模型的推理能力。
0
元/小时
部署实例
目标监测
YOLOv5
0
@BhAem
73
264H
更新时间:
2025-07-14
YOLOv5 镜像,开箱即用,支持模型训练、模型验证和模型推理。YOLOv5 是当前工业界最流行的目标检测算法之一,本镜像是基于 YOLOv5 v7.0 构建的 YOLOv5 镜像,方便用户测试 YOLOv5 模型
YOLOv5 镜像,开箱即用,支持模型训练、模型验证和模型推理。YOLOv5 是当前工业界最流行的目标检测算法之一,本镜像是基于 YOLOv5 v7.0 构建的 YOLOv5 镜像,方便用户测试 YOLOv5 模型
0
元/小时
部署实例
GLM
ChatGLM3
0
@BhAem
30
0H
更新时间:
2025-07-14
ChatGLM3 镜像,开源双语对话语言模型,支持模型的推理和模型微调。ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的对话预训练模型。ChatGLM3-6B 是 ChatGLM3 系列中的开源模型
ChatGLM3 镜像,开源双语对话语言模型,支持模型的推理和模型微调。ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的对话预训练模型。ChatGLM3-6B 是 ChatGLM3 系列中的开源模型
0
元/小时
部署实例
推理框架
SGLang推理加速
0
@whisdom
5
0H
更新时间:
2025-07-03
这个镜像将会创建大模型推理加速SGLang框架所需的环境,同时将会采用Xinference作为模型管理工具。
这个镜像将会创建大模型推理加速SGLang框架所需的环境,同时将会采用Xinference作为模型管理工具。
0
元/小时
部署实例
语音分割图像分类
segment-anything
0
@naoxin
11
54H
更新时间:
2025-07-03
分割任何物体模型 (SAM)可根据点或框等输入提示生成高质量物体蒙版,并可用于为图像中的所有物体生成蒙版。该模型已在包含 1100 万张图像和 11 亿个蒙版的数据集上进行了训练,并且在各种分割任务中具有强大的零样本性能
分割任何物体模型 (SAM)可根据点或框等输入提示生成高质量物体蒙版,并可用于为图像中的所有物体生成蒙版。该模型已在包含 1100 万张图像和 11 亿个蒙版的数据集上进行了训练,并且在各种分割任务中具有强大的零样本性能
0
元/小时
部署实例
语音分割图像分类
Fastsam
0
@naoxin
6
2H
更新时间:
2025-07-15
快速分割任何内容。快速分割任意模型 (FastSAM)是一个 CNN 分割任意模型,仅使用 SAM 作者发布的 SA-1B 数据集的 2% 进行训练。FastSAM 实现了与 SAM 方法相当的性能,但运行速度提高了 50 倍
快速分割任何内容。快速分割任意模型 (FastSAM)是一个 CNN 分割任意模型,仅使用 SAM 作者发布的 SA-1B 数据集的 2% 进行训练。FastSAM 实现了与 SAM 方法相当的性能,但运行速度提高了 50 倍
0
元/小时
部署实例
DeepSeek
DeepScaleR-1.5B
0
@敢敢のwings
13
2H
更新时间:
2025-07-03
Deepseek-R1-Distilled-Qwen-1.5B,通过简单的强化学习(RL)微调,得到了全新的DeepScaleR-1.5B-Preview。 在AIME2024基准中,模型的Pass@1准确率达高达43.1% ——不仅比基础模型提高了14.3%,而且在只有1.5B参数的情况下超越了OpenAI o1-preview!
Deepseek-R1-Distilled-Qwen-1.5B,通过简单的强化学习(RL)微调,得到了全新的DeepScaleR-1.5B-Preview。 在AIME2024基准中,模型的Pass@1准确率达高达43.1% ——不仅比基础模型提高了14.3%,而且在只有1.5B参数的情况下超越了OpenAI o1-preview!
0
元/小时
部署实例
DeepSeek
DeepSeek-R1:32b
0
@fancy
33
13H
更新时间:
2025-07-03
deepseek-r1:32b版本,单卡4090可以流畅推理,适合用于自己的知识库构建。
deepseek-r1:32b版本,单卡4090可以流畅推理,适合用于自己的知识库构建。
0
元/小时
部署实例
ComfyUI
兰雀ComfyUI
0
@兰雀AI
226
187H
更新时间:
2025-07-02
最强大和模块化的扩散模型GUI、api和后端,具有图形/节点界面,专业人士首选。
最强大和模块化的扩散模型GUI、api和后端,具有图形/节点界面,专业人士首选。
0
元/小时
部署实例
语音克隆
BertVits2-2.3
0
@aiguoliuguo
8
0H
更新时间:
2025-07-03
0
元/小时
部署实例
语音克隆
CosyVoice
0
@aiguoliuguo
110
32H
更新时间:
2025-07-02
阿里 TTS模型,提供多语言语音生成、零样本语音生成、跨语言语音克隆和指令跟随能力
阿里 TTS模型,提供多语言语音生成、零样本语音生成、跨语言语音克隆和指令跟随能力
0
元/小时
部署实例
DeepSeek
推理框架
Ollama-DeepSeek-R1-671B-Q1
0
@敢敢のwings
41
12H
更新时间:
2025-07-02
671Bdeepseek 量化版本,最低可以双卡4090运行,速度较慢,如果有较快需求可以提卡,建议4卡运行这个ollama模型是最好的,并在`vim /etc/systemd/system/ollama.service`文件中将两卡,修改成你加载的卡数`Environment=CUDA_VISIBLE_DEVICES=0,1`
671Bdeepseek 量化版本,最低可以双卡4090运行,速度较慢,如果有较快需求可以提卡,建议4卡运行这个ollama模型是最好的,并在`vim /etc/systemd/system/ollama.service`文件中将两卡,修改成你加载的卡数`Environment=CUDA_VISIBLE_DEVICES=0,1`
0
元/小时
部署实例
DeepSeek
推理框架
vLLM-DeepSeek-chatbot可视化大模型聊天机器人
1
@苍耳阿猫
7
0H
更新时间:
2025-07-14
deepseek-vllm-chatbot可视化大模型聊天机器人。vLLM-DeepSeek-chatbot是基于原生vLLM镜像扩展的增强版聊天机器人(ChatBot),集成 Gradio 实现了可视化的 WebUI 对话界面,支持实时交互式参数调节和对话历史展示
deepseek-vllm-chatbot可视化大模型聊天机器人。vLLM-DeepSeek-chatbot是基于原生vLLM镜像扩展的增强版聊天机器人(ChatBot),集成 Gradio 实现了可视化的 WebUI 对话界面,支持实时交互式参数调节和对话历史展示
0
元/小时
部署实例
DeepSeek
推理框架
Ollama-DeepSeek-R1-70B
0
@敢敢のwings
408
19H
更新时间:
2025-07-02
需要双卡,Ollama 和 Open WebUI搭建的DeepSeek-R1-70B版本,支持API调用
需要双卡,Ollama 和 Open WebUI搭建的DeepSeek-R1-70B版本,支持API调用
0
元/小时
部署实例
DeepSeek
推理框架
Ollama-DeepSeek-R1-32B
0
@敢敢のwings
1364
1025H
更新时间:
2025-07-02
本手册提供了 Ollama 和 Open WebUI 的安装和使用指南,支持deepseek r1版本
本手册提供了 Ollama 和 Open WebUI 的安装和使用指南,支持deepseek r1版本
0
元/小时
部署实例
官方镜像
Janus-Pro-7B
0
@优云智算
官方
1105
1153H
更新时间:
2025-07-14
DeepSeek Janus-Pro 是一种创新的自回归框架,旨在统一多模态理解与生成任务。它通过将视觉编码解耦为独立的路径,同时仍采用单一的统一 Transformer 架构进行处理,不仅终结了传统模型在视觉理解与图像生成间的两难抉择,更以统一架构刷新性能极限
DeepSeek Janus-Pro 是一种创新的自回归框架,旨在统一多模态理解与生成任务。它通过将视觉编码解耦为独立的路径,同时仍采用单一的统一 Transformer 架构进行处理,不仅终结了传统模型在视觉理解与图像生成间的两难抉择,更以统一架构刷新性能极限
0
元/小时
部署实例
DeepSeek
Unsloth-DeepSeek-R1-GGUF
0
@39c5bb
96
16H
更新时间:
2025-07-15
R1-671b动态量化版,由unsloth发布,推荐使用多卡进行部署。 详情请查看镜像内说明或者readme。还附带32b的无限制版蒸馏模型,使用open-webui和ollama以及llama.cpp进行部署。
R1-671b动态量化版,由unsloth发布,推荐使用多卡进行部署。 详情请查看镜像内说明或者readme。还附带32b的无限制版蒸馏模型,使用open-webui和ollama以及llama.cpp进行部署。
0
元/小时
部署实例
语音合成
Diffsinger
0
@39c5bb
8
8H
更新时间:
2025-07-14
diffsinger基本全自动的声库制作镜像,镜像内涵盖了所有环境,开箱即用。DiffSinger是AAAI 2022官方开源的PyTorch歌声合成模型,通过浅扩散机制实现SVS与TTS统一框架,支持中文/英文多语种所制作声库用于openutau歌声合成引擎,该镜像使用diffsinger的多字典分支,默认支持中日跨语种,但仅支持中文的全自动数据集处理。
diffsinger基本全自动的声库制作镜像,镜像内涵盖了所有环境,开箱即用。DiffSinger是AAAI 2022官方开源的PyTorch歌声合成模型,通过浅扩散机制实现SVS与TTS统一框架,支持中文/英文多语种所制作声库用于openutau歌声合成引擎,该镜像使用diffsinger的多字典分支,默认支持中日跨语种,但仅支持中文的全自动数据集处理。
0
元/小时
部署实例
分子动力
cp2k_lammps_deepmd-kit
0
@苍耳阿猫
7
0H
更新时间:
2025-07-14
cp2k_lammps_deepmd-kit是连接第一性原理与经典分子动力学的极简工作流:用CP2K算少量高精度数据→DeepMD-kit训练DPA-2势函数→LAMMPS驱动亿级原子长时程模拟
cp2k_lammps_deepmd-kit是连接第一性原理与经典分子动力学的极简工作流:用CP2K算少量高精度数据→DeepMD-kit训练DPA-2势函数→LAMMPS驱动亿级原子长时程模拟
0
元/小时
部署实例
其他
HivisonIDPhoto
0
@Samphi
44
32H
更新时间:
2025-07-02
一款简单易用的 AI 证件照制作工具,能够生成标准证件照和六寸排版照。支持抠图、尺寸调整和自定义底色等功能。
一款简单易用的 AI 证件照制作工具,能够生成标准证件照和六寸排版照。支持抠图、尺寸调整和自定义底色等功能。
0
元/小时
部署实例
语音分割图像分类
SAMed
0
@naoxin
4
0H
更新时间:
2025-07-14
用于医学图像分割的定制化 Segment Anything 模型。SAMed是面向医学影像的轻量化SAM定制方案,基于LoRA微调ViT编码器+提示编码器+掩码解码器,仅需更新18M参数即可在Synapse多器官数据集上达到81.88 DSC精度,支持224/512分辨率一键推理与训练
用于医学图像分割的定制化 Segment Anything 模型。SAMed是面向医学影像的轻量化SAM定制方案,基于LoRA微调ViT编码器+提示编码器+掩码解码器,仅需更新18M参数即可在Synapse多器官数据集上达到81.88 DSC精度,支持224/512分辨率一键推理与训练
0
元/小时
部署实例
CogView
Cogview3
0
@liusha
2
0H
更新时间:
2025-07-07
Cogview3 是一个先进的文本到图像生成模型,由清华大学 KEG 实验室和智谱AI公司联合训练。CogView-3-Plus 基于 CogView3 (ECCV'24),引入了最新的 DiT 框架,以进一步提高整体性能。 CogView-3-Plus 使用零信噪比扩散噪声调度,并结合了联合文本图像注意机制。与常用的MMDiT结构相比,它在保持模型基本能力的同时,有效降低了训练和推理成本。 CogView-3Plus 使用潜在维度为 16 的 VAE。
Cogview3 是一个先进的文本到图像生成模型,由清华大学 KEG 实验室和智谱AI公司联合训练。CogView-3-Plus 基于 CogView3 (ECCV'24),引入了最新的 DiT 框架,以进一步提高整体性能。 CogView-3-Plus 使用零信噪比扩散噪声调度,并结合了联合文本图像注意机制。与常用的MMDiT结构相比,它在保持模型基本能力的同时,有效降低了训练和推理成本。 CogView-3Plus 使用潜在维度为 16 的 VAE。
0
元/小时
部署实例
文本生成
MiniCPM-o-2.6
0
@liusha
3
0H
更新时间:
2025-06-27
MiniCPM-o 是从 MiniCPM-V 分级的最新端侧多模态 LLM (MLLM) 系列。这些模型现在可以将图像、视频、文本和音频作为输入,并以端到端方式提供高质量的文本和语音输出。
MiniCPM-o 是从 MiniCPM-V 分级的最新端侧多模态 LLM (MLLM) 系列。这些模型现在可以将图像、视频、文本和音频作为输入,并以端到端方式提供高质量的文本和语音输出。
0
元/小时
部署实例
具身智能
Cosmos-v1.0
0
@苍耳阿猫
9
0H
更新时间:
2025-07-14
Cosmos-v1.0是英伟达开源的首款物理世界生成模型,可同时处理文本、图像、激光雷达等多模态输入,一键生成高逼真机器人或自动驾驶训练视频
Cosmos-v1.0是英伟达开源的首款物理世界生成模型,可同时处理文本、图像、激光雷达等多模态输入,一键生成高逼真机器人或自动驾驶训练视频
0
元/小时
部署实例
推理框架
语音合成
DDSP-SVC-6.2
0
@39c5bb
196
71H
更新时间:
2025-07-14
ddsp6.2,内置环境,上传数据即可训练,支持批量推理。后续会更新。DDSP-SVC-6.2是轻量级端到端歌声转换开源框架,基于DDSP+Rectified Flow双路径建模,推理显存≤4G即可实时变声,训练速度十倍于SO-VITS,集成RMVPE基频提取、NSF-HiFiGAN声码器、内容编码器一键切换,支持多人混合音色、滑窗交叉淡入、SOLA低延迟拼接,附赠Gradio GUI与预训练模型,开箱即唱。
ddsp6.2,内置环境,上传数据即可训练,支持批量推理。后续会更新。DDSP-SVC-6.2是轻量级端到端歌声转换开源框架,基于DDSP+Rectified Flow双路径建模,推理显存≤4G即可实时变声,训练速度十倍于SO-VITS,集成RMVPE基频提取、NSF-HiFiGAN声码器、内容编码器一键切换,支持多人混合音色、滑窗交叉淡入、SOLA低延迟拼接,附赠Gradio GUI与预训练模型,开箱即唱。
0
元/小时
部署实例
llama
LLaMA3-8B
0
@liusha
7
0H
更新时间:
2025-07-14
Meta Llama3-8B是2024年4月发布的80亿参数自回归大模型,基于15T多语言公开数据预训练,8K上下文Grouped-Query Attention架构,指令版经SFT+RLHF对齐,在通用、推理、代码等基准全面领先同级开源模型
Meta Llama3-8B是2024年4月发布的80亿参数自回归大模型,基于15T多语言公开数据预训练,8K上下文Grouped-Query Attention架构,指令版经SFT+RLHF对齐,在通用、推理、代码等基准全面领先同级开源模型
0
元/小时
部署实例
推理框架
TensorRT-LLM
0
@Tlntin
14
0H
更新时间:
2025-07-02
TensorRT-LLM 为用户提供了易于使用的 Python API,用于定义大型语言模型 (LLM) 并构建包含最先进优化的 TensorRT 引擎,以便在 NVIDIA GPU 上高效执行推理。TensorRT-LLM 还包含用于创建执行这些 TensorRT 引擎的 Python 和 C++ 运行时的组件。
TensorRT-LLM 为用户提供了易于使用的 Python API,用于定义大型语言模型 (LLM) 并构建包含最先进优化的 TensorRT 引擎,以便在 NVIDIA GPU 上高效执行推理。TensorRT-LLM 还包含用于创建执行这些 TensorRT 引擎的 Python 和 C++ 运行时的组件。
0
元/小时
部署实例
数字人
Xier-EchoMimicV2
0
@Xier
103
54H
更新时间:
2025-07-02
EchoMimicV2是阿里蚂蚁集团推出的半身人体AI数字人项目,基于参考图片、音频剪辑和手部姿势序列生成高质量动画视频,确保音频内容与半身动作的一致性。
EchoMimicV2是阿里蚂蚁集团推出的半身人体AI数字人项目,基于参考图片、音频剪辑和手部姿势序列生成高质量动画视频,确保音频内容与半身动作的一致性。
0
元/小时
部署实例
视频剪辑
Xier-FunClip
0
@Xier
3
0H
更新时间:
2025-06-27
FunClip 是一款开源的自动化视频剪辑工具,通过集成先进的 AI 技术,降低了视频剪辑的难度,使得非专业人士也能够轻松制作出专业水准的视频内容。
FunClip 是一款开源的自动化视频剪辑工具,通过集成先进的 AI 技术,降低了视频剪辑的难度,使得非专业人士也能够轻松制作出专业水准的视频内容。
0
元/小时
部署实例
三维重建
guassion_splat_cuda
0
@敢敢のwings
44
0H
更新时间:
2025-07-14
Gaussian-Splatting-CUDA镜像集成CUDA加速的高斯点云渲染框架,通过纯CUDA重构核心渲染管线实现10倍于原始实现的性能提升,支持实时高保真3D场景重建与渲染。支持cuda版本的高斯渲染的代码操作,并支持二次激光雷达开发
Gaussian-Splatting-CUDA镜像集成CUDA加速的高斯点云渲染框架,通过纯CUDA重构核心渲染管线实现10倍于原始实现的性能提升,支持实时高保真3D场景重建与渲染。支持cuda版本的高斯渲染的代码操作,并支持二次激光雷达开发
0
元/小时
部署实例
语音翻译
VoiceTransl
1
@Simple
392
516H
更新时间:
2025-07-04
VoiceTransl是一站式离线AI视频字幕生成和翻译软件,从视频下载,音频提取,听写打轴,字幕翻译各个环节为翻译者提供便利。
VoiceTransl是一站式离线AI视频字幕生成和翻译软件,从视频下载,音频提取,听写打轴,字幕翻译各个环节为翻译者提供便利。
0
元/小时
部署实例
具身智能
Genesis
0
@敢敢のwings
29
0H
更新时间:
2025-07-02
Compshare云服务平台Genesis世界模型的上手与测试。详情可以参考:https://hermit.blog.csdn.net/article/details/144665610
Compshare云服务平台Genesis世界模型的上手与测试。详情可以参考:https://hermit.blog.csdn.net/article/details/144665610
0
元/小时
部署实例
ComfyUI
Lora
Hunyuan
ComfyUI-HunyuanVideo-Lora_Train
0
@39c5bb
112
400H
更新时间:
2025-06-19
混元视频模型lora一键训练,镜像内打包了标注,训练,和用于测试的comfyui,打包所有环境,支持上传图片一键训练
混元视频模型lora一键训练,镜像内打包了标注,训练,和用于测试的comfyui,打包所有环境,支持上传图片一键训练
0
元/小时
部署实例
推理框架
TTS
VoiceMamba
0
@小冷一直在摸鱼
5
0H
更新时间:
2024-12-24
0
元/小时
部署实例
ComfyUI
Hunyuan
ComfyUI-HunyuanVideo
0
@39c5bb
183
28H
更新时间:
2025-06-19
基于ComfyUI,支持当前最强的开源视频基础模型,目前支持t2v,之后会更i2v和v2v,镜像内置完整环境,包含bf16和fp8量化后占用更小的两种模型,并链接了插帧和超分功能,开箱即用
基于ComfyUI,支持当前最强的开源视频基础模型,目前支持t2v,之后会更i2v和v2v,镜像内置完整环境,包含bf16和fp8量化后占用更小的两种模型,并链接了插帧和超分功能,开箱即用
0
元/小时
部署实例
语音分离
so-vits-svc
0
@39c5bb
565
2692H
更新时间:
2025-07-02
sovits svc项目的主分支,带干声分离和音频切割,打包了整套数据集制作工具,基本一键训练,开箱即用
sovits svc项目的主分支,带干声分离和音频切割,打包了整套数据集制作工具,基本一键训练,开箱即用
0
元/小时
部署实例
Hunyuan
HunyuanVideoGP
0
@苍耳阿猫
4
0H
更新时间:
2025-07-14
HunyuanVideoGP镜像集成腾讯开源的视频生成大模型,通过时空分离注意力机制与多粒度控制技术实现文本/图像到高保真视频的端到端生成,支持动态场景构建与物理运动模拟,提供工业级视频创作解决方案与开箱即用部署
HunyuanVideoGP镜像集成腾讯开源的视频生成大模型,通过时空分离注意力机制与多粒度控制技术实现文本/图像到高保真视频的端到端生成,支持动态场景构建与物理运动模拟,提供工业级视频创作解决方案与开箱即用部署
0
元/小时
部署实例
Flux
FLUX预装反推插件
0
@弑迁士
26
0H
更新时间:
2025-07-14
FLUX预装反推插件由弑迁士原创打造,已集成场景C4D渲染、一键反推、高清放大、LoRA自动加载等全套节点,开箱即用,支持ComfyUI本地显卡零门槛生图
FLUX预装反推插件由弑迁士原创打造,已集成场景C4D渲染、一键反推、高清放大、LoRA自动加载等全套节点,开箱即用,支持ComfyUI本地显卡零门槛生图
0
元/小时
部署实例
具身智能
Diffusion_Policy具身智能
0
@敢敢のwings
23
28H
更新时间:
2025-07-28
Diffusion_Policy扩散策略,这是一种生成机器人行为的新方法
Diffusion_Policy扩散策略,这是一种生成机器人行为的新方法
0
元/小时
部署实例
目标监测
YOLOv3环境,数据集,代码,全套可,一键跑通
0
@Ai学术叫叫兽
11
46H
更新时间:
2025-07-14
Ai学术叫叫兽出品,必属精品!YOLOv3环境,数据集,代码,全套可,一键跑通,YOLOv3是目标检测领域经典单阶段算法,以Darknet-53为主干网络,通过多尺度预测在速度与精度间取得出色平衡,支持80类COCO目标实时识别,适用于安防、自动驾驶、工业质检等场景
Ai学术叫叫兽出品,必属精品!YOLOv3环境,数据集,代码,全套可,一键跑通,YOLOv3是目标检测领域经典单阶段算法,以Darknet-53为主干网络,通过多尺度预测在速度与精度间取得出色平衡,支持80类COCO目标实时识别,适用于安防、自动驾驶、工业质检等场景
0
元/小时
部署实例
目标监测
rtdetr环境,数据集,代码,全套可,一键部署
0
@Ai学术叫叫兽
17
0H
更新时间:
2025-07-14
RT-DETR镜像集成首个实时端到端目标检测框架,Ai学术叫叫兽出品,必属精品!RT-DETR环境,数据集,代码,全套可,一键跑通,通过混合编码器与查询去噪技术实现高精度实时检测,支持ResNet/DarkNet等多种骨干网络开箱即用部署
RT-DETR镜像集成首个实时端到端目标检测框架,Ai学术叫叫兽出品,必属精品!RT-DETR环境,数据集,代码,全套可,一键跑通,通过混合编码器与查询去噪技术实现高精度实时检测,支持ResNet/DarkNet等多种骨干网络开箱即用部署
0
元/小时
部署实例
目标监测
YOLOv6环境,数据集,代码,全套可,一键跑通
0
@Ai学术叫叫兽
3
0H
更新时间:
2025-07-14
YOLOv6镜像集成美团开源的高效目标检测框架,Ai学术叫叫兽出品,必属精品!YOLOv6环境,数据集,代码,全套可,一键跑通,通过双向卷积(BiC)模块与锚点辅助训练(AAT)策略优化工业级实时检测精度,支持端到端部署与开箱即用
YOLOv6镜像集成美团开源的高效目标检测框架,Ai学术叫叫兽出品,必属精品!YOLOv6环境,数据集,代码,全套可,一键跑通,通过双向卷积(BiC)模块与锚点辅助训练(AAT)策略优化工业级实时检测精度,支持端到端部署与开箱即用
0
元/小时
部署实例
目标监测
YOLOv9环境,数据集,代码,全套可,一键跑通
0
@Ai学术叫叫兽
8
0H
更新时间:
2025-07-14
YOLOv9镜像集成新一代实时目标检测框架,Ai学术叫叫兽出品,必属精品!YOLOv9环境,数据集,代码,全套可,一键跑通,通过PGI可编程梯度信息与GELAN架构实现精度-速度-泛化性三重突破,支持端到端训练与开箱即用部署
YOLOv9镜像集成新一代实时目标检测框架,Ai学术叫叫兽出品,必属精品!YOLOv9环境,数据集,代码,全套可,一键跑通,通过PGI可编程梯度信息与GELAN架构实现精度-速度-泛化性三重突破,支持端到端训练与开箱即用部署
0
元/小时
部署实例
目标监测
YOLOv5环境,数据集,代码,全套可,一键跑通
0
@Ai学术叫叫兽
35
112H
更新时间:
2025-07-14
YOLOv5镜像集成Ultralytics经典目标检测框架,Ai学术叫叫兽出品必属精品!完整提供环境配置、数据集与代码,通过CSP骨干网络与自适应锚框计算实现高精度实时检测,全套支持一键跑通,开箱即用。
YOLOv5镜像集成Ultralytics经典目标检测框架,Ai学术叫叫兽出品必属精品!完整提供环境配置、数据集与代码,通过CSP骨干网络与自适应锚框计算实现高精度实时检测,全套支持一键跑通,开箱即用。
0
元/小时
部署实例
Flux
ComfyUI
ComfyUI-LTX-Video
0
@弑迁士
73
2H
更新时间:
2025-07-14
ComfyUI-LTX-Video镜像集成Lightricks开源的视频生成工作流节点,通过ComfyUI可视化界面实现文本/图像到视频的端到端生成流程,支持动态运动控制与多参数精细化调节,提供开箱即用的节点式视频创作环境
ComfyUI-LTX-Video镜像集成Lightricks开源的视频生成工作流节点,通过ComfyUI可视化界面实现文本/图像到视频的端到端生成流程,支持动态运动控制与多参数精细化调节,提供开箱即用的节点式视频创作环境
0
元/小时
部署实例
目标监测
YOLOv8环境,数据集,代码,全套可,一键跑通
0
@Ai学术叫叫兽
149
400H
更新时间:
2025-07-14
YOLOv8镜像集成Ultralytics实时目标检测框架,Ai学术叫叫兽出品必属精品!完整提供环境配置、数据集与代码,通过无锚点设计及任务特定优化实现精度-速度平衡,全套支持一键跑通,开箱即用
YOLOv8镜像集成Ultralytics实时目标检测框架,Ai学术叫叫兽出品必属精品!完整提供环境配置、数据集与代码,通过无锚点设计及任务特定优化实现精度-速度平衡,全套支持一键跑通,开箱即用
0
元/小时
部署实例
语音分割图像分类
Unet算法环境,数据集,代码,全套可,一键跑通
0
@Ai学术叫叫兽
29
0H
更新时间:
2025-07-14
UNet镜像集成经典医学图像分割架构,通过对称编码器-解码器结构与跳跃连接实现高精度像素级定位,支持端到端训练与轻量部署,适用于生物医学影像分析、工业缺陷检测等场景,提供PyTorch实现的开箱即用解决方案。
UNet镜像集成经典医学图像分割架构,通过对称编码器-解码器结构与跳跃连接实现高精度像素级定位,支持端到端训练与轻量部署,适用于生物医学影像分析、工业缺陷检测等场景,提供PyTorch实现的开箱即用解决方案。
0
元/小时
部署实例
推理框架
LLaMA-Factory-YingHuo6AI
0
@萤火君
69
4H
更新时间:
2025-07-02
LLaMA-Factory 大模型训练环境,内置WebUI启动器和API启动器,以及常用的6B、7B、8B、9B模型。
LLaMA-Factory 大模型训练环境,内置WebUI启动器和API启动器,以及常用的6B、7B、8B、9B模型。
0
元/小时
部署实例
Qwen
QwQ-32B-Preview
0
@苍耳阿猫
9
0H
更新时间:
2025-07-29
QwQ-32B-Preview镜像集成高性能开源大语言模型预览版,基于320亿参数架构优化通用任务处理能力,支持128K长上下文推理与多语言交互,提供完整工具链及开箱即用部署方案,适用于学术研究与应用开发测试。
QwQ-32B-Preview镜像集成高性能开源大语言模型预览版,基于320亿参数架构优化通用任务处理能力,支持128K长上下文推理与多语言交互,提供完整工具链及开箱即用部署方案,适用于学术研究与应用开发测试。
0
元/小时
部署实例
Qwen
Qwen_Audio
0
@敢敢のwings
11
0H
更新时间:
2025-06-24
Qwen-Audio 是阿里云研发的大规模音频语言模型(Large Audio Language Model)。Qwen-Audio 可以以多种音频 (包括说话人语音、自然音、音乐、歌声)和文本作为输入,并以文本作为输出。
Qwen-Audio 是阿里云研发的大规模音频语言模型(Large Audio Language Model)。Qwen-Audio 可以以多种音频 (包括说话人语音、自然音、音乐、歌声)和文本作为输入,并以文本作为输出。
0
元/小时
部署实例
目标监测
YOLOv10环境,数据集,代码,全套可,一键跑通
0
@Ai学术叫叫兽
67
52H
更新时间:
2025-07-14
YOLOv10镜像集成最新实时目标检测框架,Ai学术叫叫兽出品必属精品!完整提供环境配置、数据集与代码,通过无NMS设计及整体-局部蒸馏技术实现端到端训练与精度-速度双提升,全套支持一键跑通,开箱即用。
YOLOv10镜像集成最新实时目标检测框架,Ai学术叫叫兽出品必属精品!完整提供环境配置、数据集与代码,通过无NMS设计及整体-局部蒸馏技术实现端到端训练与精度-速度双提升,全套支持一键跑通,开箱即用。
0
元/小时
部署实例
推理框架
Apple-OpenELM大模型
0
@敢敢のwings
2
0H
更新时间:
2025-07-28
OpenELM是由苹果公司开发的一款先进语言模型,通过一种新的层级缩放策略优化每个Transformer层的参数分配,从而提升模型的效率和准确性。
OpenELM是由苹果公司开发的一款先进语言模型,通过一种新的层级缩放策略优化每个Transformer层的参数分配,从而提升模型的效率和准确性。
0
元/小时
部署实例
文本生成
其他
Phi_4k
0
@敢敢のwings
2
0H
更新时间:
2025-06-23
Phi-3-4k,Phi-3系列包含三个规模的模型,该模型经过了一个后期培训过程,其中包括指导遵循和安全措施的监督微调和直接偏好优化。当根据测试常识、语言理解、数学、代码、长上下文和逻辑推理的基准进行评估时,Phi-3-Medium-128k-Instruction在参数不到130亿的模型中展示了稳健和最先进的性能。
Phi-3-4k,Phi-3系列包含三个规模的模型,该模型经过了一个后期培训过程,其中包括指导遵循和安全措施的监督微调和直接偏好优化。当根据测试常识、语言理解、数学、代码、长上下文和逻辑推理的基准进行评估时,Phi-3-Medium-128k-Instruction在参数不到130亿的模型中展示了稳健和最先进的性能。
0
元/小时
部署实例
推理框架
YuanLLM
0
@敢敢のwings
4
0H
更新时间:
2025-07-28
YuanLLM 模型,源2.0 是浪潮信息发布的新一代基础语言大模型,包括源2.0-102B,源2.0-51B和源2.0-2B。
YuanLLM 模型,源2.0 是浪潮信息发布的新一代基础语言大模型,包括源2.0-102B,源2.0-51B和源2.0-2B。
0
元/小时
部署实例
AI编程
Yi-LLM-9B-coder
0
@敢敢のwings
4
0H
更新时间:
2025-07-14
Yi-LLM-9B-Coder镜像集成01.AI开源代码大语言模型,专为代码生成与程序理解优化,基于90亿参数架构与128K长上下文支持,在HumanEval基准测试中超越GPT-3.5,支持30+编程语言的高效推理与工程部署,提供开箱即用的代码补全及调试辅助服务
Yi-LLM-9B-Coder镜像集成01.AI开源代码大语言模型,专为代码生成与程序理解优化,基于90亿参数架构与128K长上下文支持,在HumanEval基准测试中超越GPT-3.5,支持30+编程语言的高效推理与工程部署,提供开箱即用的代码补全及调试辅助服务
0
元/小时
部署实例
推理框架
TransNormerLLM
0
@敢敢のwings
5
0H
更新时间:
2025-07-14
TransNormerLLM镜像集成首个基于线性注意力机制的开源大语言模型,通过门控线性注意力(GLA)架构替代传统Transformer,实现3倍训练加速与线性计算复杂度,支持128K长上下文推理,显著降低计算成本并提供开箱即用部署方案
TransNormerLLM镜像集成首个基于线性注意力机制的开源大语言模型,通过门控线性注意力(GLA)架构替代传统Transformer,实现3倍训练加速与线性计算复杂度,支持128K长上下文推理,显著降低计算成本并提供开箱即用部署方案
0
元/小时
部署实例
文本生成
其他
MiniCPM-chat
0
@敢敢のwings
2
0H
更新时间:
2025-07-14
MiniCPM-Chat镜像集成轻量级开源大语言模型,基于2B参数MoE架构与128K上下文窗口实现多模态交互(文本/图像),支持中英等30+语种的高效推理与移动端部署,在低资源场景下超越部分70B模型性能,提供开箱即用的Web交互界面
MiniCPM-Chat镜像集成轻量级开源大语言模型,基于2B参数MoE架构与128K上下文窗口实现多模态交互(文本/图像),支持中英等30+语种的高效推理与移动端部署,在低资源场景下超越部分70B模型性能,提供开箱即用的Web交互界面
0
元/小时
部署实例
文本生成
其他
InternLM2-7B-chat
0
@敢敢のwings
5
0H
更新时间:
2025-07-14
InternLM2-7B-Chat镜像集成上海AI实验室开源对话大语言模型,通过7B参数架构与128K上下文窗口优化长程对话一致性,专注智能体任务与多轮交互,支持低成本本地部署及XTuner微调工具链,提供开箱即用对话服务
InternLM2-7B-Chat镜像集成上海AI实验室开源对话大语言模型,通过7B参数架构与128K上下文窗口优化长程对话一致性,专注智能体任务与多轮交互,支持低成本本地部署及XTuner微调工具链,提供开箱即用对话服务
0
元/小时
部署实例
Gemma
Gemma-2-9b
0
@敢敢のwings
3
0H
更新时间:
2025-07-11
Gemma-2-9b镜像集成谷歌轻量级开源大语言模型,基于Gemini同源技术构建,专注文本生成任务(问答/摘要/推理),通过90亿参数优化实现高性能与低资源消耗,支持笔记本到云环境的灵活部署,提供开箱即用的英文文本生成服务。
Gemma-2-9b镜像集成谷歌轻量级开源大语言模型,基于Gemini同源技术构建,专注文本生成任务(问答/摘要/推理),通过90亿参数优化实现高性能与低资源消耗,支持笔记本到云环境的灵活部署,提供开箱即用的英文文本生成服务。
0
元/小时
部署实例
GLM
CharacterGLM-chat
0
@敢敢のwings
2
0H
更新时间:
2025-07-11
CharacterGLM-6B-Chat镜像集成清华大学开源的对话大语言模型,专注角色扮演与个性化交互,通过6B参数架构与128K上下文窗口实现长程角色一致性,支持多轮情感化对话与性格定制,预训练融合戏剧/文学角色数据
CharacterGLM-6B-Chat镜像集成清华大学开源的对话大语言模型,专注角色扮演与个性化交互,通过6B参数架构与128K上下文窗口实现长程角色一致性,支持多轮情感化对话与性格定制,预训练融合戏剧/文学角色数据
0
元/小时
部署实例
文本生成
其他
BlueLM-7B-WebDemo
0
@敢敢のwings
6
0H
更新时间:
2025-06-23
BlueLM-7B 是由 vivo AI 全球研究院自主研发的大规模预训练语言模型,参数规模为 70 亿。需要一个4090 GPU来完成运行,这里提供了一个Web端以供使用者二次开发
BlueLM-7B 是由 vivo AI 全球研究院自主研发的大规模预训练语言模型,参数规模为 70 亿。需要一个4090 GPU来完成运行,这里提供了一个Web端以供使用者二次开发
0
元/小时
部署实例
文本生成
其他
Index-1.9B-Chat
0
@敢敢のwings
2
0H
更新时间:
2025-07-11
Index-1.9B-Chat镜像集成轻量级开源对话大语言模型,基于Index-1.9B模型经SFT与DPO对齐优化,预训练引入海量网络社区语料,显著增强趣味聊天能力与多轮交互表现,兼顾低资源部署与高响应速度,开箱即用。
Index-1.9B-Chat镜像集成轻量级开源对话大语言模型,基于Index-1.9B模型经SFT与DPO对齐优化,预训练引入海量网络社区语料,显著增强趣味聊天能力与多轮交互表现,兼顾低资源部署与高响应速度,开箱即用。
0
元/小时
部署实例
文本生成
其他
Atom-7B
0
@敢敢のwings
1
0H
更新时间:
2025-07-11
Atom-7B镜像集成高性能轻量级开源大语言模型,基于2T高质量多语种数据预训练,具备高效推理与强泛化能力,支持中英双语任务处理及低成本本地部署,兼顾性能与资源效率,开箱即用。
Atom-7B镜像集成高性能轻量级开源大语言模型,基于2T高质量多语种数据预训练,具备高效推理与强泛化能力,支持中英双语任务处理及低成本本地部署,兼顾性能与资源效率,开箱即用。
0
元/小时
部署实例
目标监测
YOLOv11算法环境-数据集-代码全套
0
@Ai学术叫叫兽
299
1708H
更新时间:
2025-07-11
YOLOv11镜像集成最新目标检测框架升级版,关注B站:Ai学术叫叫兽,跟着视频教程一分钟快速跑通,免费福利专为遥遥领先大家庭小伙伴提供,开箱即用。
YOLOv11镜像集成最新目标检测框架升级版,关注B站:Ai学术叫叫兽,跟着视频教程一分钟快速跑通,免费福利专为遥遥领先大家庭小伙伴提供,开箱即用。
0
元/小时
部署实例
DeepSeek
DeepSeek-V2-Lite
0
@敢敢のwings
8
0H
更新时间:
2025-07-11
DeepSeek-V2-Lite镜像提供高性能开源大语言模型服务,需双4090 GPU支持运行,集成完整Web交互界面供用户直接调用与二次开发,开箱即用。
DeepSeek-V2-Lite镜像提供高性能开源大语言模型服务,需双4090 GPU支持运行,集成完整Web交互界面供用户直接调用与二次开发,开箱即用。
0
元/小时
部署实例
数字人
facefusion3.0.1图片视频换脸应用
0
@科哥AIGC
243
167H
更新时间:
2025-07-11
FaceFusion 3.0.1镜像集成开源人脸融合与增强工具,支持图像/视频/直播流的高精度人脸交换、年龄性别编辑及清晰度修复,通过多线程优化与显存管理实现实时处理速度,提供简洁API与开箱即用的一键式本地部署方案。
FaceFusion 3.0.1镜像集成开源人脸融合与增强工具,支持图像/视频/直播流的高精度人脸交换、年龄性别编辑及清晰度修复,通过多线程优化与显存管理实现实时处理速度,提供简洁API与开箱即用的一键式本地部署方案。
0
元/小时
部署实例
语音分离
MSST-WebUI
0
@39c5bb
95
153H
更新时间:
2025-07-02
MSST,更好用的干声分离以及去和声混响的项目,可以作为传统UVR的上位替代,并兼容UVR的模型,带webui,也可通过笔记本一键处理音频,简单且高效
MSST,更好用的干声分离以及去和声混响的项目,可以作为传统UVR的上位替代,并兼容UVR的模型,带webui,也可通过笔记本一键处理音频,简单且高效
0
元/小时
部署实例
三维重建
3dgs
0
@敢敢のwings
17
58H
更新时间:
2025-07-11
3DGS镜像集成开源3D高斯点云渲染框架,通过高效可微栅格化技术实现实时的照片级场景重建与渲染,支持从稀疏图像生成高质量动态3D场景,在渲染速度与视觉保真度上超越传统神经辐射场方案,适用于虚拟现实、数字孪生及影视制作领域
3DGS镜像集成开源3D高斯点云渲染框架,通过高效可微栅格化技术实现实时的照片级场景重建与渲染,支持从稀疏图像生成高质量动态3D场景,在渲染速度与视觉保真度上超越传统神经辐射场方案,适用于虚拟现实、数字孪生及影视制作领域
0
元/小时
部署实例
具身智能
视觉场景识别
MixVpr
0
@敢敢のwings
1
0H
更新时间:
2025-07-11
MixVPR镜像集成全局特征聚合的位置识别模型,通过混合多尺度特征与自适应聚合技术提升复杂场景(如视角/光照变化)下的定位鲁棒性,支持端到端训练与轻量部署,适用于自动驾驶、机器人导航等视觉定位任务
MixVPR镜像集成全局特征聚合的位置识别模型,通过混合多尺度特征与自适应聚合技术提升复杂场景(如视角/光照变化)下的定位鲁棒性,支持端到端训练与轻量部署,适用于自动驾驶、机器人导航等视觉定位任务
0
元/小时
部署实例
目标监测
YOLOv5
0
@狼哥
51
138H
更新时间:
2025-07-02
这是一个基于 YOLOv5 v7.0 版本构建的 YOLO Docker 镜像,适用于 YOLOv5 v7.0版本的 AI 视觉处理任务。通过该镜像,用户可以轻松进行 图像分类、目标检测、目标跟踪、姿态识别、图像分割 等任务,该镜像支持以下操作: 模型训练(train):在自定义数据集上训练 YOLO 模型。 模型验证(val):验证模型性能,获得关键指标。 模型推理(inf):对图像、视频流进行目标检测和分类。 部署优化(opt):通过 TensorRT 等工具,优化 GPU 加速推理。
这是一个基于 YOLOv5 v7.0 版本构建的 YOLO Docker 镜像,适用于 YOLOv5 v7.0版本的 AI 视觉处理任务。通过该镜像,用户可以轻松进行 图像分类、目标检测、目标跟踪、姿态识别、图像分割 等任务,该镜像支持以下操作: 模型训练(train):在自定义数据集上训练 YOLO 模型。 模型验证(val):验证模型性能,获得关键指标。 模型推理(inf):对图像、视频流进行目标检测和分类。 部署优化(opt):通过 TensorRT 等工具,优化 GPU 加速推理。
0
元/小时
部署实例
具身智能
VNC可视化镜像
0
@敢敢のwings
9
0H
更新时间:
2025-07-11
VNC可视化镜像专为具身智能从业者提供优刻得远程可视化服务,支持无物理显示设备的跨平台图形界面交互,可基于此完成定制化开发与发布。
VNC可视化镜像专为具身智能从业者提供优刻得远程可视化服务,支持无物理显示设备的跨平台图形界面交互,可基于此完成定制化开发与发布。
0
元/小时
部署实例
推理框架
LLaMAFactory
0
@Faych
50
52H
更新时间:
2025-07-11
LLaMAFactory镜像提供一站式开源大语言模型微调框架,支持全参数/部分参数/QLoRA等高效微调方法,兼容LLaMA、BLOOM等主流架构,通过无需代码的Web界面简化训练流程,显著降低模型定制门槛,开箱即用。内置Qwen2.5-7B-Instruct和alpaca_zh供测试
LLaMAFactory镜像提供一站式开源大语言模型微调框架,支持全参数/部分参数/QLoRA等高效微调方法,兼容LLaMA、BLOOM等主流架构,通过无需代码的Web界面简化训练流程,显著降低模型定制门槛,开箱即用。内置Qwen2.5-7B-Instruct和alpaca_zh供测试
0
元/小时
部署实例
推理框架
ollama-0.4.1
0
@苍耳阿猫
26
0H
更新时间:
2025-07-11
Ollama-0.4.1镜像提供轻量级本地大语言模型运行框架,支持一键拉取与运行Llama2、CodeLlama、Mistral等开源模型(GGUF格式),通过类Docker的CLI实现零配置本地部署与交互式对话,开箱即用。
Ollama-0.4.1镜像提供轻量级本地大语言模型运行框架,支持一键拉取与运行Llama2、CodeLlama、Mistral等开源模型(GGUF格式),通过类Docker的CLI实现零配置本地部署与交互式对话,开箱即用。
0
元/小时
部署实例
数字人
AniTalker
0
@O_O
39
2H
更新时间:
2025-07-11
AniTalker镜像集成清华大学开源的2D动画角色口型同步工具,通过轻量级模型实现实时语音驱动口型生成与表情控制,支持静态图/动态视频输入,提供高精度唇形匹配与低延迟渲染,适用于动画制作及虚拟主播场景,开箱即用。
AniTalker镜像集成清华大学开源的2D动画角色口型同步工具,通过轻量级模型实现实时语音驱动口型生成与表情控制,支持静态图/动态视频输入,提供高精度唇形匹配与低延迟渲染,适用于动画制作及虚拟主播场景,开箱即用。
0
元/小时
部署实例
目标监测
YOLOv8
0
@狼哥
53
4H
更新时间:
2025-07-02
这是一个基于 YOLOv8 构建的 YOLO Docker 镜像,适用于 YOLOv8 及以上版本的 AI 视觉处理任务。通过该镜像,用户可以轻松进行 图像分类、目标检测、目标跟踪、姿态识别、图像分割 等任务,该镜像支持以下操作: 模型训练(train):在自定义数据集上训练 YOLOv8 模型。 模型验证(val):验证模型性能,获得关键指标。 模型推理(inf):对图像、视频流进行目标检测和分类。 部署优化(opt):通过 TensorRT 等工具,优化 GPU 加速推理。
这是一个基于 YOLOv8 构建的 YOLO Docker 镜像,适用于 YOLOv8 及以上版本的 AI 视觉处理任务。通过该镜像,用户可以轻松进行 图像分类、目标检测、目标跟踪、姿态识别、图像分割 等任务,该镜像支持以下操作: 模型训练(train):在自定义数据集上训练 YOLOv8 模型。 模型验证(val):验证模型性能,获得关键指标。 模型推理(inf):对图像、视频流进行目标检测和分类。 部署优化(opt):通过 TensorRT 等工具,优化 GPU 加速推理。
0
元/小时
部署实例
模型训练
DeepSpeed
0
@苍耳阿猫
5
0H
更新时间:
2025-07-11
DeepSpeed 只需单击一下即可实现类似 ChatGPT 的模型训练,与 SOTA RLHF 系统相比,其速度提高了 15 倍,并且在各个规模上都实现了前所未有的成本降低
DeepSpeed 只需单击一下即可实现类似 ChatGPT 的模型训练,与 SOTA RLHF 系统相比,其速度提高了 15 倍,并且在各个规模上都实现了前所未有的成本降低
0
元/小时
部署实例
Qwen
Qwen2-VL
0
@O_O
29
2H
更新时间:
2025-07-21
Qwen2.5-VL镜像集成通义千问开源多模态大语言模型,支持高精度图文理解、文档解析与多图推理,具备128K长上下文能力与增强OCR技术,在跨模态任务中达到业界前沿水平,提供高效开源部署方案及商用友好授权。
Qwen2.5-VL镜像集成通义千问开源多模态大语言模型,支持高精度图文理解、文档解析与多图推理,具备128K长上下文能力与增强OCR技术,在跨模态任务中达到业界前沿水平,提供高效开源部署方案及商用友好授权。
0
元/小时
部署实例
TTS
ChatTTS
0
@Faych
44
32H
更新时间:
2025-07-11
ChatTTS镜像集成开源对话式文本转语音模型,支持中英双语自然语音合成与细粒度韵律控制(笑声/停顿/情感调节),针对对话场景优化,具备高保真音质与低延迟特性,提供零依赖部署及API服务。
ChatTTS镜像集成开源对话式文本转语音模型,支持中英双语自然语音合成与细粒度韵律控制(笑声/停顿/情感调节),针对对话场景优化,具备高保真音质与低延迟特性,提供零依赖部署及API服务。
0
元/小时
部署实例
ComfyUI
ComfyUI-V2
0
@🎉Astro
358
702H
更新时间:
2025-07-11
ComfyUI-V2镜像集成Flux工作流与Stable Diffusion 3.5模型,预装六大核心插件:汉化支持、ControlNet预处理、IP适配增强、图像浏览工具、节点管理器及工作流增强组件(开关/图像对比),提供开箱即用的高级AI绘画与图像处理环境。
ComfyUI-V2镜像集成Flux工作流与Stable Diffusion 3.5模型,预装六大核心插件:汉化支持、ControlNet预处理、IP适配增强、图像浏览工具、节点管理器及工作流增强组件(开关/图像对比),提供开箱即用的高级AI绘画与图像处理环境。
0
元/小时
部署实例
Flux
ComfyUI
ComfyUI-Flux.1-dev
0
@O_O
133
78H
更新时间:
2025-07-11
ComfyUI-Flux.1-dev 镜像预装 Flux.1 开发版工作流套件,集成 ComfyUI 核心环境与常用节点依赖,支持 Stable Diffusion 高级图像生成与处理任务,开箱即用。
ComfyUI-Flux.1-dev 镜像预装 Flux.1 开发版工作流套件,集成 ComfyUI 核心环境与常用节点依赖,支持 Stable Diffusion 高级图像生成与处理任务,开箱即用。
0
元/小时
部署实例
语音克隆
GPT-SoVITS-V2
0
@39c5bb
257
26H
更新时间:
2025-07-11
GPT-SoVITS-V2镜像提供高效零样本语音克隆与文本转语音工具,所需训练素材少、耗时短且情绪控制更精准,集成完整API接口及环境依赖,开箱即用。相比V1版本显著优化音色还原度与合成自然度,并增强跨语言支持与长音频稳定性,支持一键式本地部署。
GPT-SoVITS-V2镜像提供高效零样本语音克隆与文本转语音工具,所需训练素材少、耗时短且情绪控制更精准,集成完整API接口及环境依赖,开箱即用。相比V1版本显著优化音色还原度与合成自然度,并增强跨语言支持与长音频稳定性,支持一键式本地部署。
0
元/小时
部署实例
Qwen
Qwen
0
@敢敢のwings
16
0H
更新时间:
2025-07-11
Qwen镜像集成通义千问开源大语言模型系列,提供Qwen-7B基础对话模型与Qwen-VL多模态模型,支持中英双语128K长上下文、代码生成及图像理解,基于高质量预训练与对齐优化实现强任务泛化能力,兼顾高性能与开源友好部署特性。
Qwen镜像集成通义千问开源大语言模型系列,提供Qwen-7B基础对话模型与Qwen-VL多模态模型,支持中英双语128K长上下文、代码生成及图像理解,基于高质量预训练与对齐优化实现强任务泛化能力,兼顾高性能与开源友好部署特性。
0
元/小时
部署实例
文本生成
VisualGLM
0
@敢敢のwings
7
0H
更新时间:
2025-07-11
VisualGLM-6B 是一个开源的,支持图像、中文和英文的多模态对话语言模型,语言模型基于 ChatGLM-6B,具有 62 亿参数;图像部分通过训练 BLIP2-Qformer 构建起视觉模型与语言模型的桥梁,整体模型共78亿参数。
VisualGLM-6B 是一个开源的,支持图像、中文和英文的多模态对话语言模型,语言模型基于 ChatGLM-6B,具有 62 亿参数;图像部分通过训练 BLIP2-Qformer 构建起视觉模型与语言模型的桥梁,整体模型共78亿参数。
0
元/小时
部署实例
Baichuan
Baichuan-13B
0
@敢敢のwings
11
0H
更新时间:
2025-07-11
Baichuan-13B镜像集成开源双语大语言模型,基于2.6万亿高质量中英双语训练数据构建,支持4096上下文长度与ALiBi位置编码,在通用问答、代码生成及多任务处理中表现优异,兼顾性能与计算效率,提供免费商用授权的高性价比开源模型部署方案。
Baichuan-13B镜像集成开源双语大语言模型,基于2.6万亿高质量中英双语训练数据构建,支持4096上下文长度与ALiBi位置编码,在通用问答、代码生成及多任务处理中表现优异,兼顾性能与计算效率,提供免费商用授权的高性价比开源模型部署方案。
0
元/小时
部署实例
其他
MiniMind
0
@敢敢のwings
16
0H
更新时间:
2025-07-11
MiniMind镜像提供轻量级开源知识库增强框架,专为小型语言模型设计,通过高效向量检索与生成优化实现低成本知识注入,显著提升小模型在专业领域的问答准确性与上下文理解能力,支持本地快速部署。
MiniMind镜像提供轻量级开源知识库增强框架,专为小型语言模型设计,通过高效向量检索与生成优化实现低成本知识注入,显著提升小模型在专业领域的问答准确性与上下文理解能力,支持本地快速部署。
0
元/小时
部署实例
GLM
GLM4
0
@敢敢のwings
13
0H
更新时间:
2025-07-28
GLM-4是由清华大学推出的新一代开源大语言模型,具备 320 亿参数,性能对标 GPT 系列与 DeepSeek-V3/R1 系列。
GLM-4是由清华大学推出的新一代开源大语言模型,具备 320 亿参数,性能对标 GPT 系列与 DeepSeek-V3/R1 系列。
0
元/小时
部署实例
其他
SimpleRAG可视化
0
@敢敢のwings
20
18H
更新时间:
2025-07-11
SimpleRAG可视化镜像集成Gradio界面与Milvus向量库,提供直观的检索增强生成(RAG)流程演示,支持文档上传、文本切片、向量检索及生成结果可视化,助力用户快速理解RAG技术原理与应用部署。
SimpleRAG可视化镜像集成Gradio界面与Milvus向量库,提供直观的检索增强生成(RAG)流程演示,支持文档上传、文本切片、向量检索及生成结果可视化,助力用户快速理解RAG技术原理与应用部署。
0
元/小时
部署实例
推理框架
llama.cpp
0
@敢敢のwings
20
2H
更新时间:
2025-07-24
llama.cpp镜像提供纯C++实现的轻量级大语言模型推理框架,通过高效量化技术显著降低硬件门槛,支持CPU/GPU异构计算,实现跨平台零依赖部署,适用于边缘设备及本地环境的高速LLM推理任务。
llama.cpp镜像提供纯C++实现的轻量级大语言模型推理框架,通过高效量化技术显著降低硬件门槛,支持CPU/GPU异构计算,实现跨平台零依赖部署,适用于边缘设备及本地环境的高速LLM推理任务。
0
元/小时
部署实例
推理框架
Ollama-WebUI
0
@优云智算
官方
51
0H
更新时间:
-
Ollama是一个开源的大型语言模型服务工具,它允许用户在自己的硬件环境中轻松部署和使用大规模预训练模型。Ollama 的主要功能是在Docker容器内部署和管理大型语言模型(LLM),使得用户能够快速地在本地运行这些模型。它简化了部署过程,通过简单的安装指令,用户可以执行一条命令就在本地运行开源大型语言模型,例如Llama 3。
Ollama是一个开源的大型语言模型服务工具,它允许用户在自己的硬件环境中轻松部署和使用大规模预训练模型。Ollama 的主要功能是在Docker容器内部署和管理大型语言模型(LLM),使得用户能够快速地在本地运行这些模型。它简化了部署过程,通过简单的安装指令,用户可以执行一条命令就在本地运行开源大型语言模型,例如Llama 3。
0
元/小时
部署实例
官方镜像
LLaMAFactory-WebUI
0
@优云智算
官方
126
704H
更新时间:
-
LLaMA-Factory镜像提供一站式大语言模型微调框架,支持全参数、部分参数及高效QLoRA等多种微调方法,兼容LLaMA、BLOOM等主流架构,内置Web界面简化训练流程,显著提升模型定制效率与易用性。多模型支持,LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Qwen2-VL等。
LLaMA-Factory镜像提供一站式大语言模型微调框架,支持全参数、部分参数及高效QLoRA等多种微调方法,兼容LLaMA、BLOOM等主流架构,内置Web界面简化训练流程,显著提升模型定制效率与易用性。多模型支持,LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Qwen2-VL等。
0
元/小时
部署实例
推理框架
vllm-0.6.3.post1-1
1
@苍耳阿猫
39
20H
更新时间:
2025-07-29
基于vLLM项目构建,提供高效的大语言模型推理加速服务,通过创新的PagedAttention技术优化内存管理和并行计算,显著提升模型吞吐量并降低延迟,支持多种主流Transformer架构的LLM部署
基于vLLM项目构建,提供高效的大语言模型推理加速服务,通过创新的PagedAttention技术优化内存管理和并行计算,显著提升模型吞吐量并降低延迟,支持多种主流Transformer架构的LLM部署
0
元/小时
部署实例