找回密码
 立即注册
首页 业界区 安全 音频克隆-Index-TTS进阶版(ComfyUI_IndexTTS)可以实现 ...

音频克隆-Index-TTS进阶版(ComfyUI_IndexTTS)可以实现多人对话

荪俗 5 小时前
 
之前介绍过Index-TTS,音频克隆,现在是他的ComfyUI版本,实现了多人对话版本。
单人音频克隆:https://www.cnblogs.com/cj8988/p/18973016
 
一:参考之前的文档,搭建ComfyUI工具。
https://www.cnblogs.com/cj8988/p/18949573
 
二:下载源码:
https://github.com/billwuhao/ComfyUI_IndexTTS
 
解压到文件夹ComfyUI\custom_nodes 中,修改文件夹名字为ComfyUI_IndexTTS
1.png

 
 
下载模型:如果之前下载过:https://www.cnblogs.com/cj8988/p/18973016  直接复制过来就行。
模型下载(下载最新的1.5):https://huggingface.co/IndexTeam/IndexTTS-1.5/tree/main
下载位置放到(没有文件夹,就新建): \ComfyUI\models\TTS\Index-TTS\
2.png

 三:修改一下配置:
修改一些配置文件中的配置:\ComfyUI\custom_nodes\ComfyUI_IndexTTS\checkpoints\config_v1_5.yaml
模型名字修改为什么下载的模型名字。
  1. 将文件中的 _v1_5 去掉:
  2. 比如:
  3. bpe_v1_5.model  修改为   bpe.model 。
  4. gpt_v1_5.pth 修改为 gpt.pth 。
  5. bigvgan_generator_v1_5.pth  修改为  bigvgan_generator.pth。
复制代码
 
 
 
四:安装
下载 pynini:   https://github.com/billwuhao/pynini-windows-wheels/releases/tag/v2.1.6.post1
根据你的python版本选择一个选择:
3.png

 
  1. 下载完成后,安装:
  2. pip install pynini-2.1.6.post1-cp3xx-cp3xx-win_amd64.whl
  3. pip install importlib_resources
  4. pip install WeTextProcessing>=1.0.4 --no-deps
复制代码
 
 
五:运行:
  1. #在 \ComfyUI\ 文件夹下:
  2. python .\main.py
复制代码
 
推拽文件: \ComfyUI\custom_nodes\ComfyUI_IndexTTS\workflow-examples\
4.png

5.png

 
推拽多人对话json:
6.png

 
上传的文件在文件夹:\ComfyUI\output
 
 
 
 
 
 

来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
您需要登录后才可以回帖 登录 | 立即注册