Argil - нейросеть для создания качественных дипфейков, которая способна скопировать стиль общения, язык тела и голос, плюс очень хорошо имитирует движение губ
Для создания дипфейков достаточно загрузить пару минут видео с аудио и добавить текст, чтобы получить дипфейк, как вверху - Цукерберг, Андриссен и Обама полностью сгенерированы, хоть в это и сложно поверить.
Вообще, изначально это сервис для создания своего AI клона, просто процедура такая же - загружаете видеоролик, где вы четко смотрите в камеру и говорите, на этом видео натренируют ии, чтоб вы могли уже без своего участия делать Shorts, Reels и другие видео с собой, просто написав текст. В случае с дипфейком нужно тогда загрузить короткое видео с персонажем в качестве референса. Озвучку так же можно сделать в сервисе
Короче, всем сервис хорош, кроме того, что нужно записаться в лист ожидания. Я уже записалась, там вообще коротенькая анкетка - имя, почта, зачем хотите потестить, где увидели - в основном, надо выбрать да/нет, у меня пол минуты, наверное, заняло
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса.
Open AI опять решили подразнить обычных пользователей и предоставили ограниченный доступ к своей новой нейросети для преобразования текста в голос - Voice Engine. Она позволяет скопировать голос человека из 15-секундной аудиозаписи:
Технология как и ElevenLabs поможет компаниям, преподавателям и инфлюенсерам обращаться к аудитории на любом языке собственным голосом, причем сохранив родной акцент.
Доступ к ней получили пока только серьезные компании HeyGen, Age of Learning и Dimagi.
HeyGen вообще красавчики - используют технологии как ElevenLabs, так и OpenAI, чтобы предложить своим пользователям более широкие возможности при создании видео с искусственным интеллектом.
Так вот, тестирование Voice Engine показалокак можно использовать технологию во благо в различных отраслях. Вот несколько ранних примеров: перевод контента, помощь в чтении и поддержка лиц, не способных говорить, восстановление голоса людям с нарушениями речи, улучшение обслуживания в отдаленных районах.
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса.
Я в этой статье уже писала про HeyGen и его возможности. Вкратце, с помощью этой нейросети можно создать своего цифрового клона всего за 5 мин, который будет отличного качества и потребует минимум усилий от вас. А можно немного больше заморочиться и создать точную копию себя.
Нейросеть обновилась, что же доступно в HeyGen 5.0
Быстрый аватар — ваш цифровой клон, сделанный из двух минутного разговорного образца видео. Достаточно снять себя на смартфон или веб-камеру и отправить видео, обычно процедуду занимает 5 минут.
Finetune аватар — цифровой двойник более лучшего качества, над которым трудится команда сервиса, синхронизация губ улучшена. На создание уходит 8 часов.
Студийный аватар - самое высокое качество, студийное качество. Но и от вас потребуется 4-х минутное видео, снятое на зеленом фоне в студии с качественным освещением и звуком. Доступна круглосуточная поддержка. На создание потребуется 5 -7 дней.
Стриминговый аватар для интеграции в прямые трансляции и чаты.
Дубляж видео и перевод на другие языки с сохранением голоса и синхронизацией губ.
Словом, незаменимый инструмент для блоггеров, инфлюенсеров, преподавателей, да всех, кто хочет расширить свое присутствие в сети и держать связь с аудиторией, в том числе иностранной. Благодаря HeyGen можно значительно сократить затраты времени на создание контента и проведение стримов
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса.
Мы постарались сделать каждый город, с которого начинается еженедельный заед в нашей новой игре, по-настоящему уникальным. Оценить можно на странице совместной игры Torero и Пикабу.
В одном из прошлых постов я писала, что ElevenLabs анонсировали возможность заработать пользователям на клонировании голоса. И вот теперь все желающие могут загрузить свой голос и получать деньги за его использование.
Как работает:
Пользователь загружает 30 минут аудио голоса, добавляет описание, затем назначает цену и указывает реквизиты.
Голосом будет озвучиваться реклама и прочий контент, а взамен обещают пассивный доход.
Хотите быть в курсе полезных ии сервисов для работы, учебы и облегчения жизни? Подпишитесь на мой канал в Telegram НейроProfit, там я рассказываю о том, как зарабатывать с помощью нейросетей и использовать ии-сервисы для бизнеса 😉
ElevenLabs - Один из самых продвинутых сервисов – предоставляет библиотеку максимально реалистичных голосов, которые можно настраивать как угодно. Клонирование голоса, опция создания уникального синтетического голоса с нуля. Можно клонировать свой голос и заставить его говорить на любом из поддерживаемых языков.
Кому интересно, я писала серию постов про этот действительно лучший в своем роде сервис.
Free Text To Speech Online - Использует библиотеку Microsoft AI Speech для синтеза речи. Простые настройки темпа и тона, предусмотрено скачивание аудио в mp3.
PlayHT - Генерирует человеческие голоса, неотличимые от настоящих. Имеет редактор для создания уникальных голосов персонажей. Предоставляет огромный выбор голосов – более 800, поддерживает 130+ языков.
RHVoice - Голосовой синтезатор с качественными русскими голосами, поддерживает 13 других языков.
Mimic - Быстрый и легкий голосовой синтезатор, созданный на основе CMU Flite.а.
Murf - Предоставляет более 120 реалистичных мужских и женских голосов, которые можно настраивать и кастомизировать. Поддерживает 20+ языков.
Speechify - Озвучивает любой текстовый контент, быстро переводит видео.
Mozilla TTS - Включает большой набор обученных моделей. Поддерживает 20+ языков, генерирует нейтральную по эмоциональной окраске реалистичную речь.
Deepgram - Сервис использует 4 модели для синтеза реалистичной речи – Nova-2, Enhanced, Base, Whisper Large.
Tortoise TTS - Синтезирует речь с использованием множества реалистичных голосов, учитывает указания на эмоции в тексте, клонирует голос.
Wondercraft AI - Располагает библиотекой реалистичных голосов для озвучивания текста, есть опция клонирования голоса. Предусмотрено автоматическое создание транскрипта и заметок.
Coqui - Предоставляет 5 реалистичных голосов, поддерживает 7 языков.
Fluxon - 5 голосов на выбор, возможность клонировать любой голос по образцу, перевод аудио на другой язык.
Recast AI - Превращает лонгриды в сжатые интересные подкасты.
Хотите быть в курсе полезных ии сервисов для работы, учебы и облегчения жизни? Подпишитесь на мой канал в Telegram НейроProfit, там я рассказываю о том, как зарабатывать с помощью нейросетей и использовать ии-сервисы для бизнеса 😉
В одном из прошлых постов я показывала как я "украла голос Илона Маска" - результат получился крутой, но вот сервис был платный.
В этот раз я сделала обзор на бесплатный аналог с открытым кодом (к тому же можно попробовать на huggingface) и опять клонировала голос Илона Маска, и в качестве русского образца голос Вероники Степановой. Забегая вперед скажу, что все получилось очень похоже!
Whisper Speech - мощный синтезатор речи, а заодно он очень хорошо клонирует голоса, бесплатный и без впн. Но есть и минусы, которые я обнаружила, пока записывала этот обзор
Минусы
Он без проблем переводит на английский, но... Как я не старалась, русскую речь он не поддерживает. Но, Вы можете загрузить русский голос и написать промпт на английском - и ваш исходный голос зазвучит на английском, не смотря на то, что исходник на русском. Пробовала ставить <ru> - тоже бесполезно.
Сервис крутой, если вам надо клонировать голос, например, знаменитости и озвучить текстна английском языке. Сервис будет работать, даже если знаменитость русскоговорящая, когда вы загрузите образец голоса на русском и пропишете промпт на английском, сервис без проблем озвучит английский текст исходным голосом знаменитости.
Хотите быть в курсе полезных ии сервисов для работы, учебы и облегчения жизни? Подпишитесь на мой канал в Telegram НейроProfit, там я рассказываю о том, как зарабатывать с помощью нейросетей и использовать ии-сервисы для бизнеса 😉
Пользователи смогут продать голос, созданный или клонированный
Честно говоря, хотела ограничиться небольшим постом, но информация интересная, так что пока готовила пост, увлеклась и получился такой лонгрид.
С момента своего публичного запуска ElevenLabs лидирует в отрасли синтеза естественной речи, позволяя пользователям создавать и проектировать голоса искусственного интеллекта для огромного количества языков и акцентов, способные передавать широкий спектр эмоций и интонаций.
За это время ElevenLabs создали аудио за более чем 100 лет. Сегодня их технологию используют сотрудники 41% компаний из списка Fortune 500. Дальше они будут только развиваться еще больше:
Теперь можно перевести любое видео на один из 29 языков (в том числе русский) с учетом тона голоса говорящего, его акцента или фонового шума, сохраняя при этом голос и эмоции оригинального говорящего. Вот например этот ролик о себе самом перевел ElevenLabs с английского на русский с сохранением голоса.
В предыдущей версии, ролик, который вы видите наверху, перевелся бы с кучей искажений, голосовых артефактов, и искаженным переводом. Язык вывода я указала Английский, хотя в видео присутствует несколько языков. Не смотря на это, сервис без проблем перевел мне видос на русский, не теряя смысл.
Каждый месяц в ElevenLabsбесплатно дается 10 000 знаков, которые можно использовать по своему усмотрению - перевести видео с сохранением голоса в разделе Dubbing, или сделать реалистичную озвучку текста, или и то, и то.
Новые продукты
Сегодня компания также представляет ряд новых продуктов, включая Dubbing Studio , торговую площадку Voice Library , раннюю предварительную версию приложения Mobile Reader , а также новые модели с улучшенной скоростью и языковым охватом. А еще они пошли по пути OpenAI и дадут возможность пользователям заработать, загружая созданные или клонированные голоса.
Подробнее о каждом продукте
ElevenLabs также представляет несколько новых разработок продуктов, которые будут запущены в эксплуатацию в ближайшие недели:
Dubbing Studio
Теперь мощности нейросети позволят пользователям дублировать фильмы целиком, а также создавать и редактировать их расшифровки, переводы и тайм-коды, обеспечивая дополнительный контроль над созданием контента. Эти возможности дополняют уже существующую функцию искусственного дубляжа, которая обеспечивает автоматическую комплексную локализацию видео на 29 языках.
Voice Library (голосовая библиотека)
ElevenLabsпредоставит пользователям безопасную платформу для заработка на версиях собственных голосов, созданных искусственным интеллектом. Пользователи могут создать свою профессиональную реплику голоса AI, проверить ее и поделиться ею через голосовую библиотеку. Когда другие используют эти проверенные голоса, оригинальные создатели получают компенсацию. Пользователи всегда сохраняют контроль над доступностью своего голоса и условиями компенсации. Маркетплейс уже приносит доход небольшой группе альфа-пользователей. Кстати, у них сервиса есть классификатор речи с использованием искусственного интеллекта, который может проверить, содержит ли аудиосэмпл контент, созданный ElevenLabs. Кстати, это они тоже улучшат - включат и другие голосовые модели в свой классификатор.
Приложение Mobile Reader
Ранняя предварительная версия мобильного приложения для чтения, которая позволяет мгновенно преобразовывать текст и URL-адреса в аудио, упрощая пользователям доступ к контенту на другом носителе во время движения. В качестве ознакомительной пробной версии приложение будет доступно бесплатно в течение первых трех месяцев, и пользователи смогут зарегистрироваться для получения раннего доступа через список ожидания.
ElevenLabs реально молодцы, пока это мой топ из синтеза речи - самая натуральная озвучка получается, с паузами, придыханиями, эмоциями. Если бы они еще в клонирование голоса (который Professional Voice Cloning) добавили бы русский голос - им бы вообще цены не было. Пока эта опция доступна только на английском, я записала 40 минут своего голоса на английском и через 3 недели должны сделать мой голосовой клон, поделюсь впечатлениями. Но лучшие они в переводе видео с сохранением голоса, даже Heygen пользуются их технологией, если кто не знал. То, что они принимают дополнительные меры для повышения безопасности голосовых данных дает им еще плюсик в карму.
Хотите быть в курсе полезных ии сервисов для работы, учебы и облегчения жизни? Подпишитесь на мой канал в Telegram НейроProfit, там я рассказываю о том, как зарабатывать с помощью нейросетей и использовать ии-сервисы для бизнеса 😉
Появился мощный синтезатор речи OpenVoice. Клонировать голос можно из нескольких секунд речи, а затем озвучить им текст на любом языке (даже на русском) бесплатно!
Отличить почти невозможно. Доступно много настроек — от эмоций и акцента до интонаций и пауз. Хороший бесплатный аналог Elevenlabs