Очень незаметно искусственный интеллект и нейросети, созданные на его основе, стали неотъемлемой частью нашей жизни. Сейчас уже практически не осталось такой области, где они бы не применялись. Если генерацией картинок, текстов и рекламных материалов по описанию уже никого не удивишь, то как насчет редактирования видео и аудио контента с преобразованием его в текст без необходимости перезаписи? Звучит, как минимум, неплохо. Как максимум – необычно и интересно.
Сегодня рассказываем про нейросеть Descript AI: что это такое, что умеет, как скачать и зарегистрироваться, и, конечно, как ей пользоваться.
Что такое Descript
Descript – это нейросеть для редактирования видео и аудио с помощью искусственного интеллекта. После того, как вы импортировали файл, программа автоматически расшифрует его в текст благодаря алгоритмам распознавания речи. Полученный текст можно редактировать, а все изменения будут экспортированы в исходный файл.
Заявлено, что точность обработки составляет целых 95%. Вообще, создатели программы были первыми, кто совместил возможность одновременной работы с видео, аудио и текстом на таком уровне.
Descript построен на основе двух основных технологий:
- обработка естественного языка (Natural Language Processing/NLP);
- клонирование голоса на основе модели от Lyrebird AI (была куплена в 2019 году и перешла под бренд Descript).
Среди клиентов сервиса заявлены такие гиганты как Google, Microsoft, Shopify и ESPN.
А сейчас давайте посмотрим, какие функции есть у нейросети. Спойлер: у нее есть, чем вас удивить.
Какие функции есть в нейросети Descript
Все доступные функции перечислены на главном экране. Есть и обзорный тур для новичков. Сейчас мы вам про все расскажем.
Первое и самое важное: Descript позволяет удалять из текста ненужные блоки и слова-паразиты, оговорки, всякие “ums, uhs, likes, you knows” и повторы одним кликом. Это позволяет сократить продолжительность видео на 10%. Если в масштабах Stories, Reels, Shorts или Клипа это не так критично, то в длинные ролики можно добавить массу полезного контента.
Всего же на сайте нейросети заявлено четыре группы функций.
Первая их них – “Ключевые”. Сюда относятся:
- Редактирование видео. Здесь вы можете редактировать видео и расшифровывать с него текст. Работать просто – как в любом текстовом документе. То есть, вы просто добавляете или удаляете необходимые слова, а программа автоматически добавляет их. Фрагменты видео здесь же можно поменять местами или сделать нарезку, как из слайдов в презентации.
- Подкасты. Эта функция создана для того, чтобы избавить подкастеров от головной боли при работе со сложными инструментами. Принцип использования точно такой же как и с видео. Звук с видеофайла транскрибируется в текст, текст редактируется, изменения вносятся в аудиофайл.
- Транскрипция. Инструмент для транскрибирования контента. “Лидер в нише по скорости и точности” – заявление достаточно смелое, но ни у одной другой нейросети с подобным функционалом нет такого количества фанатов. Здесь же есть решение для профессионалов – White Glove: 99% точность и в среднем $2 доллара за минуту, если брать в расчет 24 часа обработки.
- Запись экрана. Еще одна полезная функция, которая позволяет быстро и легко делать такие записи, редактировать их и делиться ими. То есть, можно коммуницировать посредством видео, не теряя гибкости текстового общения.
- Удаленная запись. Благодаря сервису записывать контент можно откуда угода и делиться им за считанные секунды.
Второй блок функций – AI Voices – позволяет работать непосредственно со звуком.
- Overdub. Это клонирование вашего голоса или выбор “ультра реалистичного варианта” из библиотеки. По ощущениям голоса из стока говорят, как персонажи из RPG, которые вот-вот выдадут вам какой-нибудь квест.
Overdub доступен на всех тарифных планах (о них мы расскажем чуть позже) – даже на бесплатном. Кроме этого, клонировать вы можете только свой голос – Descript заботится о безопасности и конфиденциальности.
После редактирования новые вписанные слова вольются в речь максимально органично, потому что сохранятся тон и интонация говорящего.
- Регенерация. Еще одна очень крутая функция, которая позволяет скорректировать несоответствующий тон, придать яркости не самому яркому диалогу или убрать раздражающий фоновый шум – и все это одним кликом. Как? Очень просто. Генеративная аудио-технология на базе ИИ постоянно воссоздает и полностью подгоняет голос под окружение, что делает итоговый результат по-настоящему естественным.
Третья часть функций – AI Effects.
- Eye contact. Для укрепления связей с аудиторией психологи рекомендуют смотреть в камеру. Это не всегда просто, потому что можно отвлечься на что-то или посмотреть на сценарий. Теперь это не проблема, потому что благодаря функции Eye Contact вы всегда будете смотреть, куда нужно.
- Удаление филлеров. Достичь 100% чистоты речи очень сложно, потому что этому нужно долго и упорно учиться. Однако Descript позволяет убрать всех паразитов простым выделением их в тексте.
- Studio Sound. Эта функция позволяет добиться студийного звучания для любого файла через избавления от акустического эхо и улучшения аудио ряда. И да, тоже за один клик. Решение стало доступно благодаря приобретению компании SquadCast.
- Зеленый экран. Технология в представлении не нуждается – просто убираете фон и потом накладываете нужные эффекты и анимации для последующего редактирования видео. Более того, здесь есть и хромакей.
Есть и несколько менее примечательных, но не менее важных функций, которые вынесены в отдельную вкладку. Это добавление субтитров, видео для социальных сетей, создание страниц под ваши видео, которыми можно поделиться. Все работает точно так же, как и другие инструменты из функционала.
Как зарегистрироваться в Descript
Для регистрации нужно нажать черную кнопку “Sign Up” в верхнем правом углу сайта. После этого перед вами появится такое окно:
Если есть аккаунт в Google то все просто, если нет, то придется заполнить кое-какие свои данные.
После этого вы попадете в личный кабинет, который тоже нужно настроить. В частности, добавить данные о размере вашей команды, о целях использования сервиса, о типе контента, который вы будет редактировать.
Выбираете ваши варианты и все.
Языков здесь достаточно много, но русский не поддерживается.
И это далеко не все.
Как бесплатно скачать и установить Descript
Descript – один из немногих сервисов, у которого есть приложение для десктопа. скачивается с официального сайта. Без VPN загрузка не началась. Функционал браузерной версии находится в режиме тестирования.
Для работы в любом случае требуется подключение к интернету. Есть версии для Windows и MacOS.
Как пользоваться нейросетью Descript
Принцип работы редактора похож на текстовый документ, а вся работа происходит в личном кабинете. Для нормального функционирования вам потребуется не менее 20 Гб свободного места.
Здесь есть вкладки с проектами, быстрыми записями, голосами и шаблонами. Возможна фильтрация по личным проектами и тем, в которые вас пригласили.
Есть и ряд ограничений: новый голос можно создать только на десктопе и использовать для записи не более 1001 слова в бесплатном тарифе. Также есть ограничение по времени – всего 1 час записей для обработки.
Рабочий процесс простой. Выбираете тип контента для обработки. После этого или добавляете новый файл, записываете свой, пишете текст или выбираете из шаблона. Последних действительно много.
Весь интерфейс реализован в одном окне:
Здесь вы производите все действия с контентом. Навигация в программе удобная и интуитивно понятная.
Тарифы и цены Descript
Тарифных планов несколько. Они отличаются функционалом и количеством ограничений. Подробное описание со всеми сравнениями доступно по ссылке.
Во всех планах есть доступ к редактированию, транскрибированию, записи экрана, шаблонам и стоковым медиа.
Заключение
Если вы работаете с видео и аудиозаписями в большом объеме, то на программу определенно стоит обратить внимание из-за ее качества. Инструмент действительно одновременно и простой, и мощный. А богатый функционал, который постоянно пополняется новыми функциями, позволит не тратить время на ненужные процессы.
Краткое резюме по статье
Нейросеть подходит практически для любых задач, которые связаны с редактированием одновременно видео и аудио, а также с транскрибированием.
Несмотря на поддержку большого количества языков, нейросеть прежде всего ориентирована на англоязычный сегмент.
Да, есть, но с рядом ограничений по количеству редактируемых слов в тексте и одним часом звука или видео.
Да, такая функция есть. Как и любые другие, где нужно совместить видео и текст.
Нейросеть работает достаточно быстро. Час обрабатывается за несколько минут.
Читайте также:
-
«Это не преступление, если нет такой статьи»: откровения схемщика
-
Как создать лид-форму в Facebook и Вконтакте
-
Где взять уникальный креатив бесплатно
-
❄️ На что залить под Новый год: вертикали, офферы, примеры крео
-
Бот для массовой рассылки личных сообщений в Телеграм
-
Как безопасно набрать подписчиков в Instagram? Сравнение 4 сервисов