음성 모델 별 음성 파일 성능 비교

image.png

케로로

코난

짱구

<aside> 💡

최종 TTS 결과

기존 YourTTS 모델과 GPT-SoVITS의 2가지 모델을 비교 해본 결과

성능 순위는 YourTTS < GPT-SoVITS V2 Pro Plus < GPT-SoVITS V4 순으로 나타났다.

이는 YourTTS 모델을 사용할때는 한국어 지원이 되지 않아, 초기 학습 부터 진행 했을 때 학습이 잘 되지 않은 단어의 경우에는 노이즈가 발생하거나 이상한 말을 하는 결과 였지만,

GPT-SoVITS 모델은 한국어 지원이 되면서 이 모델을 파인 튜닝 했을때의 결과이기 때문에 학습되지 않은 말이더라도 더 안정적인 성능을 얻을 수 있었다.

GPT-SoVITS의 모델을 fine-tuning 할때는 기존 데이터에 캐릭터 별로 각 5 분정도의 추가적인 데이터를 더 수집하여 진행하였기 때문에 좀 더 뛰어난 성능을 보여주었다.

</aside>

YourTTS 세부 성능