控制台

立即注册

FireRedASR语音识别、语音转文字构建by科哥

FireRedASR语音识别系统语音转文字语音转文本千问开源构建by科哥

0元/小时

v1.0

FireRedASR语音识别、语音转文字

模型介绍

FireRedASR是FireRedTeam推出的开源工业级语音识别框架，支持普通话、中文方言及英语识别，在多项ASR基准测试中刷新SOTA记录。其核心创新在于双架构设计：

FireRedASR-LLM（8.3B参数）：采用Encoder-Adapter-LLM架构，结合大型语言模型实现端到端语音交互
FireRedASR-AED（1.1B参数）：基于注意力机制的编解码器结构，平衡性能与效率

模型镜像使用教程

1、选择镜像和版本

2、选择GPU进行部署，推荐选择4090

3、实例启动后，先进入jupyterlab，在jupyterlab中运行启动器

4、运行启动器

5、.返回控制面板打开sd-webui

打开sd-webui

6、sd-webui运行使用界面截图

7、更多高级指令，可以进入jupyterlab，自行操作，例如：

查看进程：

ps -ef |grep python

终止进程：

kill -9 pid

重启程序：

cd  /root && bash run.sh

官方更新源码在这里：
https://github.com/index-tts/index-tts

bug反馈可以加入科哥专属群交流！

有bug请微信科哥： 312088415

科哥在UCloud镜像列表【不断更新中】：

https://kege-aigc.feishu.cn/docx/L3FVdQl7kom8Ckx7QiicQj2VnEd
科哥已经借助ai工具【claude code cli】，在线云端和本地修复，重写很多ai开源应用
效率非常给力！
修复一般的开源应用简直就是开挂了一样，需要修复和搭建ai应用欢迎联系！

AI数字人直播卖货欢迎来了解： https://kege-aigc.feishu.cn/docx/G271dgZr1o8CvMx9KKrcRuuonDf

@鸡你太美

认证作者

镜像信息

已使用27 次

运行时长

15 H

支持自启动

镜像大小

90GB

最后更新时间

2026-04-27

支持卡型

RTX40系20803080Ti309048G RTX40系2080TiH20A800P40A100RTX50系V100SV100S

+13

框架版本

PyTorch-2.4

CUDA版本

12.4

应用

JupyterLab: 8888

版本

v1.0

2026-04-27

PyTorch:2.4 | CUDA:12.4 | 大小:90.00GB

隶属于优刻得科技股份有限公司

股票代码：688158

优刻得是中立、安全的云计算服务平台

友情链接 :

优刻得

产品

GPU实例 GPU镜像社区模型API服务 Coding Plan

快速入口

文档中心 API文档用户协议

镜像合集

AI4S 数字人 TTS语音 Wan2.2 视频超分