登录
FireRedASR语音识别、语音转文字 构建by科哥
FireRedASR语音识别系统语音转文字语音转文本千问开源 构建by科哥
2
0/小时
v1.0

FireRedASR语音识别、语音转文字

模型介绍:

FireRedASR是FireRedTeam推出的开源工业级语音识别框架,支持普通话、中文方言及英语识别,在多项ASR基准测试中刷新SOTA记录。其核心创新在于双架构设计:

  • FireRedASR-LLM(8.3B参数):采用Encoder-Adapter-LLM架构,结合大型语言模型实现端到端语音交互
  • FireRedASR-AED(1.1B参数):基于注意力机制的编解码器结构,平衡性能与效率

模型镜像使用教程

1、选择镜像和版本

image.png

2、选择GPU进行部署,推荐选择4090

image.png

3、实例启动后,先进入jupyterlab,在jupyterlab中运行启动器

image.png

4、运行 启动器

image.png image.png

5、.返回控制面板 打开sd-webui

image.png

打开sd-webui

image

6、sd-webui运行使用界面截图

image.png

7、更多高级指令,可以进入jupyterlab,自行操作,例如:

  • 查看进程:
ps -ef |grep python
  • 终止进程:
kill -9 pid
  • 重启程序:
cd  /root && bash run.sh

bug反馈可以加入科哥专属群交流!

描述图片内容

有bug请微信科哥: 312088415

科哥在UCloud镜像列表【不断更新中】:

image.png

镜像信息
@科哥AIGC
科哥AIGC认证作者
支持自启动
已使用3
运行时长
0 H
镜像大小
90GB
最后更新时间
2025-09-30
支持卡型
RTX40系20803080Ti309048G RTX40系2080TiH20A800P40A100RTX50系
+11
框架版本
PyTorch-2.4
CUDA版本
12.4
应用
JupyterLab: 8888
版本
v1.0
2025-09-30
PyTorch:2.4 | CUDA:12.4 | 大小:90.00GB