VoxCPM是一款轻量高效的语音生成模型,以“小而美”为特点,支持高质量的语音合成、语音识别与语音克隆功能。该模型在保持出色音质与自然度的同时,具有更小的体积与更低的资源占用,能够快速完成从文本到语音的转换及目标音色的克隆,适用于嵌入式设备、实时交互及轻量化语音应用开发等场景。
打开jupyterlab
新建终端,执行如下命令
python main.py
出现IP:7860后,回到控制台,打开VoxCPM即可
WebUI页面展示
音频上传与下载