0B站开源的IndexTTS2.0整合包说明,把开源模型转换为生产力工具的强力整合包,功能支持非常丰富。
1.单个语音条创作,对应到UI的"单条数据模式"。
2.有声书、读小说等创作,对应到"单角色批量文本模式“。
3.AI短剧、创意视频,对应到"多角色剧本模式"。
4.如果想更加复杂的定制,也可以使用"批量Excel模式"。
另外还支持了两个常见的创作诉求:
1.从视频中提取音频。
2.转换音频格式。
首先在社区镜像中选择对应的镜像,在选择机器时需要保证显存大于8G,否则可能会让使用体验受损。
通常来说12G和16G是性价比比较高的选择,当然更高的配置肯定会更高啦。
目前来看3080Ti是一个还不错的选择,性价比比较高,12G显存够用且价格比较便宜。






虽然这个页面是很简单易用的,但是为了避免使用上的问题,我还是要做一个具体的说明。



注意: 为了防止意外情况,txt文件默认应该使用utf-8编码。
如果出现了乱码识别不了的情况,可以使用像Notepad++、UltraEditor、Sublime Text等文本编辑器,可以调整字符集格式。


Excel的模板地址: https://pan.quark.cn/s/107d36f1ed6f
特别注意的是,Excel中需要指定音色文件默认是没有存储的,这个时候就需要在实例列表页面中通过JupyterLab进行音色文件的上传了。

首先点击进入到resources,如下:
然后再点击进入到prompt_audio,如下:
最后点击这个按钮开始上传wav文件,如下:

答案: 是还在的,在JupyterLab里面的outputs里面。(前面已经讲过两次如何进入JupyterLab了,这里不再讲了)。 可以点击这里进入到outputs里面,如下:

然后就可以看到我们以前生成的文件了:

注意: 首先对于一般使用者来说,推荐按量计费。
使用完后一定要关机(不然可能会持续扣费),而且实例默认保持十天。

支持自启动