镜像社区
部署GPU实例
模型API
文档中心
常见问题(FAQ)
最好用的中文音频视频语音识别转文本字幕软件FunASR
将音频视频语音识别转为文本文件和SRT字幕文件
1
0/小时
v1.0

最好用的中文语音识别转文本字幕软件FunASR

软件可以批量将音频视频语音识别转换为文本文件和SRT字幕文件,中文识别效果优于其它同类软件,支持自定义热词,对于某些专业领域专有名词识别效果大大提升.

操作步骤

1、首先点击右侧蓝色按钮【使用该镜像创建实例】

2、选择合适的GPU型号,点击下方蓝色按钮【立即部署】

3、稍等一两分钟后实例便会运行,显示【运行中】后继续等待1分钟左右初始化,再点击右侧【SD-WebUI】按钮,即可打开WebUI操作界面

image.png

webui界面示例

image

注意

请尽量上传mp3,wav音频文件,上传mp4等视频文件可能会因为文件太大导致上传时间太长

镜像信息
@AI画师大阳
支持自启动
已使用2
运行时长
0 H
镜像大小
90GB
最后更新时间
2025-09-12
支持卡型
3080TiRTX40系3090208048G RTX40系
+5
框架版本
PyTorch-2.8.0
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v1.0
2025-09-12
PyTorch:2.8.0 | CUDA:12.8 | 大小:90.00GB