Что такое OpenAI Sora? Умопомопомрачительный искусственный интелект от разработчика ChatGPT!

Okan Güleş
Okan Güleş Bilim ve Teknoloji editörü
Компания OpenAI, насчитывающая более 100 миллионов ежемесячных активных пользователей только благодаря ChatGPT, недавно добилась очередного успеха и запустила еще одну невероятную модель: На этот раз на сцену вышла "Сора".

Компания OpenAI, оставившая свой след в мире технологий благодаря ChatGPT, объединила искусственный интеллект с людьми и открыла новую страницу в этой сфере.

ЧТО ЭТО ЗА СОРА?

Разрабатывая более интеллектуальную модель искусственного интеллекта на основе моделей GPT-4 от ChatGPT, OpenAI представила свою новую модель искусственного интеллекта, сделав сюрприз в своем очередном плане. Так что же такое Sora, и что можно сделать с помощью искусственного интеллекта Sora?

Мы уже знаем, что чат-боты OpenAI могут сдать экзамен на адвоката, не посещая юридическую школу. Теперь новый инструмент искусственного интеллекта под названием Sora показывает, что он является мастером кино, не посещая школу и не проходя никакого обучения. Давайте посмотрим поближе, на что способен Sora.

Во-первых, Sora, разработанная OpenAI, может создавать изображения из текста, как и некоторые ее конкуренты. Sora, чьим основным направлением является создание изображений, идет гораздо дальше благодаря решимости OpenAI.

Многие компании, от гигантов вроде Google до стартапов вроде Runway, недавно анонсировали инструменты искусственного интеллекта для преобразования текста в видео. Однако OpenAI в очередной раз доказал, что лидирует в этой области, показав себя так же, как ChatGPT.

Sora отличается поразительной фотореалистичностью и способностью создавать ролики длиной до минуты, что больше, чем короткие фрагменты, которые обычно делают другие модели. На данный момент нет данных о том, сколько времени требуется для создания видео, но предполагается, что на 1-минутный ролик уйдет больше нескольких минут.

Сцены, конечно, впечатляют, но больше всего удивляют нетренированные способности Соры.

Используя версию модели диффузии, применяемую в рендере Dall-E 3 от OpenAI, и опираясь на движок GPT-4, основанный на трансформации, Сора не только создает видео, отвечающее требованиям подсказок, но и делает это на основе кинематографической грамматики. Это настолько важно, что позволяет рассказать историю. Еще одна важная особенность Sora заключается в том, что она не генерирует подсказки по частям, а затем комбинирует их; она создает всю сцену за один раз.

КАК РАБОТАЕТ SORA?

Sora, создающая невероятные изображения из текста, в плане использования похожа на другие известные нам модели.

Мы часто видели старые, шумные, иногда размытые телевизоры и спутниковые антенны.

Тонкой настройки блюда может быть достаточно для повышения резкости изображения. Искусственный интеллект Sora от OpenAI работает в основном так. Сначала он анализирует и осмысливает запрос, то есть команду, которую вы вводите. После этого на основе анализа создается сценарий.

С другой стороны, сцены создаются в соответствии со сценарием и делаются за один раз. Как уже говорилось выше, Sora не использует подход «создай сцену и доведи ее до совершенства», как другие. Она может оценить и интерпретировать всю сцену вместе со всеми обучающими данными (текстами, видео, аудио, рассказами, исследованиями, фильмами, сериалами и т. д.) и создать всю сцену за один раз.

А что вы думаете о Соре? Не забудьте указать в комментариях…

Источник: OpenAI
Компиляция: ANN Turkey

TAGS: