Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

参考音频文本也被合成进去了 #1270

Open
hadesfox opened this issue Jul 2, 2024 · 3 comments
Open

参考音频文本也被合成进去了 #1270

hadesfox opened this issue Jul 2, 2024 · 3 comments

Comments

@hadesfox
Copy link

hadesfox commented Jul 2, 2024

合成87字的短文本,出来结果参考音频被合成在了中间,并且会有一段很长的空白时间

@PMPBinZhang
Copy link

您好,这个问题解决了吗?我也经常碰见这个问题。

@TongFromSky
Copy link

我这边看到的现象是,如果是中英混合合成,切分的文本是,只有一个英文单词+一个数字(中间可以有空格),比如step1,就会出现合成参考文本的情况,单独合成的话,会出现合成不出声音或是合成为参考文本的情况。不知道如何解决。

@Separatee
Copy link

根据你所说的情况大概率是由于:

  • 训练语音时长较少
  • SoVITS和GPT模型训练epoch过大,使用训练音频作为参考音频

解决方法

  1. 重新训练,增加语音时长.在训练SoVITS GPT的epoch时保持默认设置
  2. 换参考音频,避免使用训练音频

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants