Клонирование голоса из 3-секундного образца
Нейронка VALL-E-X не просто позволяет клонировать любой голос, а способна захватит, тон, интонации голоса, выразительность, а также эмоции, которые сопровождают речь.
К примеру, если вы предоставите образец сонного голоса, нейросеть сможет воссоздать тот же сонный оттенок. VALL-E-X https://github.com/Plachtaa/VALL-E-X#-installation способна создавать речь и на других языках без акцента. Сейчас она поддерживает английский, китайский и японский языки, что уже неплохо.
Больше полезных нейросетей для бизнеса, работы и учебы в моем тг (ссылка в описании профиля)