VSR-WebUI fork自YaoFANGUK的VSR项目,继承GPL v2协议
VSR-WebUI主要实现了以下功能:
PS:前端程序的预览图片渲染可能有点问题,但问题不大,不影响后端处理结果,就当是一个彩蛋咯
PS:我的小窝,欢迎来逛:拉菲的八二年酒窖
PS:一个官方测试参考
测试材料:5分钟1080p视频
显卡算力:3080ti负载拉满
a.字幕识别算法:(sttn算法可跳过该步骤)
paddleocr: 耗时20min:
目前只支持单帧画面依次识别,无法拉满显卡负载
未来可能支持多帧画面同时进行识别从而加快速度
b.画面填补算法
常规模式:耗时30分钟
快速模式:未测试耗时
准备好要去除字幕的mp4视频文件,尽量压缩成zip文件上传,因为视频文件本身比较大
2.1:上传mp4视频
实例启动后点jupyter-lab
然后进入vsr/input文件夹,将mp4视频文件直接上传,然后更名为方便输入的名字
当然,你也使用webui上传视频的功能,不过不推荐
jupyter中运行启动脚本
公网访问web服务
如果对模型去字幕的效果不满意,可以查看design文件夹里面的训练方法,利用backend/tools/train里面的代码进行训练,然后将训练的模型替换旧模型即可