음성 합성은 말소리의 음파를 기계가 자동으로 만들어 내는 기술로, 간단히 말하면 모델로 선정된 한 사람의 말소리를 녹음하여 일정한 음성 단위로 분할한 다음, 부호를 붙여 합성기에 입력하였다가 지시에 따라 필요한 음성 단위만을 다시 합쳐 말소리를 인위로 만들어내는 기술이다. 위키백과
- 고등학교 때 뻘짓의 일환으로 내 목소리를 녹음해 음성합성 모델을 학습시킨 적이 있다. icecream0910/taein-tts
- 이 블로그는 ElevenLabs의 Instant Voice Cloning을 이용해 학습된 TTS 모델을 이용해 음성으로 듣기 기능을 제공 중이다.
댓글