Мы опросили Сергея Пахандрина, эксперта по нейросетям и владельца Telegram-канала «ИИволюция». Он поделился своим стеком ИИ-инструментов, которые использует для работы.
Google Veo 3 — один из самых продвинутых генераторов видео по тексту. Делает ролики в 4K, сам добавляет свет, физику и звук — включая диалоги и шумы прямо внутри видео. Понимает длинные описания, умеет превращать картинку в видео (image-to-video), так что можно четко задать, что и как будет происходить. Результат — почти как кино. Недешевый инструмент, но если нужен вау-эффект или делаешь видео на охваты — идеальный вариант.
HeyGen — сервис для создания AI-аватаров и перевода видео. Можно выбрать готового 3D- или видеоаватара или собрать своего, использовать в записи или подключить в реальном времени. Платформа также умеет автоматически переводить видео на другие языки с точной синхронизацией губ (lip-sync) и сохранением тембра голоса. Поддерживает 70+ языков и 175+ диалектов. Многие блогеры уже давно поставили генерацию видео в соц сети на поток через хейген. Есть API для интеграции в любые процессы.
ElevenLabs — нейросеть для озвучки текста (TTS, text-to-speech) и автоматического дубляжа. Голоса звучат максимально реалистично, можно управлять интонацией, эмоциями и даже «клонировать» свой голос (voice cloning). Работает на 70+ языках, поддерживает диалоги, эмоции. Подходит для фильмов, игр, перевода и локализации всего подряд.
Suno — нейросеть, которая пишет музыку с вокалом и текстом. Работает стабильно, звучит хорошо, умеет делать треки до 8 минут. Последние версии улучшили тексты, звук и скорость генерации. Отлично подходит, если нужно быстро сделать песню под видео, рекламу или просто по фану. На музыкальных площадках много AI музыки, созданной как раз в Suno.