登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
博客
发1篇日志+1圆
记录
发1条记录+2圆币
发帖说明
VIP申请
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
VIP申请
VIP网盘
网盘
联系我们
道具
勋章
任务
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
安全
›
音频克隆-Index-TTS进阶版(ComfyUI_IndexTTS)可以实现 ...
音频克隆-Index-TTS进阶版(ComfyUI_IndexTTS)可以实现多人对话
[ 复制链接 ]
荪俗
2025-7-8 17:12:07
之前介绍过Index-TTS,音频克隆,现在是他的ComfyUI版本,实现了多人对话版本。
单人音频克隆:https://www.cnblogs.com/cj8988/p/18973016
一:参考之前的文档,搭建ComfyUI工具。
https://www.cnblogs.com/cj8988/p/18949573
二:下载源码:
https://github.com/billwuhao/ComfyUI_IndexTTS
解压到文件夹
ComfyUI\custom_nodes
中,修改文件夹名字为
ComfyUI_IndexTTS
下载模型:如果之前下载过:https://www.cnblogs.com/cj8988/p/18973016 直接复制过来就行。
模型下载(下载最新的1.5):https://huggingface.co/IndexTeam/IndexTTS-1.5/tree/main
下载位置放到(没有文件夹,就新建):
\ComfyUI\models\TTS\Index-TTS\
三:修改一下配置:
修改一些配置文件中的配置:\ComfyUI\custom_nodes\ComfyUI_IndexTTS\checkpoints\config_v1_5.yaml
模型名字修改为什么下载的模型名字。
将文件中的 _v1_5 去掉:
比如:
bpe_v1_5.model 修改为 bpe.model 。
gpt_v1_5.pth 修改为 gpt.pth 。
bigvgan_generator_v1_5.pth 修改为 bigvgan_generator.pth。
复制代码
四:安装
下载 pynini:
https://github.com/billwuhao/pynini-windows-wheels/releases/tag/v2.1.6.post1
根据你的python版本选择一个选择:
下载完成后,安装:
pip install pynini-2.1.6.post1-cp3xx-cp3xx-win_amd64.whl
pip install importlib_resources
pip install WeTextProcessing>=1.0.4 --no-deps
复制代码
五:运行:
#在 \ComfyUI\ 文件夹下:
python .\main.py
复制代码
推拽文件:
\ComfyUI\custom_nodes\ComfyUI_IndexTTS\workflow-examples\
推拽多人对话json:
上传的文件在文件夹:
\ComfyUI\output
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
音频
克隆
Index
TTS
进阶
相关帖子
高效查日志进阶指南:掌握grep命令的完整技巧
【Git进阶】基于文件(夹)拆分大PR
TTS-1技术报告:基于Transformer的文本转语音模型
【学习笔记】进阶算法——最近公共祖先 LCA
函数进阶与按键
【LeetCode 114】算法进阶:二叉树展开为链表
MediaCodec的使用(音频编码一)
多项式入门到进阶超详解
使用c#强大的SourceGenerator现对象的深克隆
《音频焦点管理》最佳实践:让鸿蒙应用中的每一段声音,都不被打扰
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
安全
高效查日志进阶指南:掌握grep命令的完整技巧
0
803
映各
2025-07-28
安全
【Git进阶】基于文件(夹)拆分大PR
0
546
恿深疏
2025-07-29
业界
TTS-1技术报告:基于Transformer的文本转语音模型
0
1038
圉棺
2025-07-30
安全
【学习笔记】进阶算法——最近公共祖先 LCA
0
111
撒阗奕
2025-08-02
安全
函数进阶与按键
0
210
纪晴丽
2025-08-03
科技
【LeetCode 114】算法进阶:二叉树展开为链表
0
676
辖瑁地
2025-08-15
安全
MediaCodec的使用(音频编码一)
0
258
晚能
2025-08-16
安全
多项式入门到进阶超详解
0
544
马璞玉
2025-08-22
业界
使用c#强大的SourceGenerator现对象的深克隆
0
844
雨角
2025-08-29
业界
《音频焦点管理》最佳实践:让鸿蒙应用中的每一段声音,都不被打扰
0
244
眩疝诺
2025-09-03
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
浏览过的版块
业界
签约作者
程序园优秀签约作者
发帖
荪俗
2025-7-8 17:12:07
关注
0
粉丝关注
21
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
敖可
9984
黎瑞芝
9990
杭环
9988
4
凶契帽
9988
5
氛疵
9988
6
猷咎
9986
7
里豳朝
9986
8
肿圬后
9986
9
段干叶农
9986
10
蝓俟佐
9984
查看更多