Изменить голос нейросетьюСинтез речи и голос ИИ: полная книга

Изменить голос нейросетью

Изменить голос — поменять тембр, пол, возраст или «характер» голоса, сохранив сами слова и интонацию. На этом строят анонимность, персонажей для озвучки, развлекательный контент и стримы. В отличие от клонирования, здесь не нужен образец конкретного человека — вы просто превращаете один голос в другой.

Как это работает

Нейросеть разбирает запись на две части: что сказано (слова и интонация) и кто сказал (тембр, характер голоса). Первое она сохраняет, второе — заменяет на выбранный голос. Поэтому ваша речь, эмоции и ритм остаются, а звучит уже другой человек. Это называют voice conversion, «преобразование голоса».

Один и тот же текст можно произнести совсем другим голосом — вот, например, глубокий «киношный» рассказчик. Слова те же, а характер записи меняется полностью.

Загрузите запись (или наговорите) — выберите новый голос и послушайте результат. Первые генерации — бесплатно после регистрации.

Загрузка…

Что можно менять

  • Пол — мужской ↔ женский.
  • Возраст и характер — моложе/старше, мягче/жёстче.
  • Персонаж — голос робота, сказочного героя, диктора.
  • Анонимизация — скрыть свой голос, сохранив речь (например, для интервью).

Чтобы вышло чисто

  • Чистая запись без шума. Фон и эхо переходят в результат — пишите в тихом месте.
  • Естественная речь оригинала. Изменение сохраняет интонацию: говорите выразительно, и результат будет живым.
  • Близкий по диапазону целевой голос. Превращение очень низкого в очень высокий звучит менее естественно, чем умеренная смена.

Изменение голоса против клонирования

Частая путаница. Изменить голос — превратить речь в какой-то другой голос (готовый пресет или абстрактный). Клонировать голос — воспроизвести конкретный голос реального человека по образцу. Первое — про стиль и анонимность, второе — про точную копию (и куда более чувствительно этически).

Важно: этика

Менять собственный голос или использовать абстрактные пресеты — безобидно. А вот превращать свою речь в голос конкретного реального человека без его согласия — уже территория клонирования и связанных рисков (об этом в следующей главе). Не используйте изменение голоса для обмана, выдавая себя за другого.

Что дальше

Если нужно не «другой голос вообще», а точная копия конкретного голоса — это клонирование. Самая мощная и самая чувствительная функция в руководстве.


В чате Twelver можно загрузить запись и изменить голос прямо в переписке. Несколько генераций бесплатно после регистрации.

Попробуйте сами

Всё из этого руководства работает в Twelver

Один чат для текста, картинок, видео, музыки и озвучки — без отдельных сервисов и подписок.

Открыть чат Twelver
Оцените свой опыт