OpenAI представляє A.I. Це миттєво створює приголомшливі відео

 Стартап ділиться новою технологією під назвою Sora з невеликою групою перших тестувальників, намагаючись зрозуміти потенційні небезпеки.


Це відео є A.I. підказка: «Кілька гігантських шерстистих мамонтів наближаються, ступаючи через засніжену галявину, їхнє довге шерстисте хутро злегка розвівається на вітрі, коли вони йдуть, вкриті снігом дерева та вражаючі снігові вершини гір удалині, полуденне світло з тонкими хмарами та сонце високо відстань створює тепле світіння, низький огляд камери приголомшливий, захоплюючи великого пухнастого ссавця чудовою фотографією, глибиною різкості».CreditCredit...Відео OpenAI

У квітні нью-йоркський стартап під назвою Runway AI представив технологію, яка дозволяє людям створювати відео, як корова на святкуванні дня народження або собака, що спілкується на смартфоні, просто вводячи речення в поле на екрані комп’ютера, пише nytimes.com.

Чотирисекундні відео були розмитими, уривчастими, спотвореними та викликали занепокоєння. Але вони були чіткою ознакою того, що технології штучного інтелекту будуть створювати все більш переконливі відео в найближчі місяці та роки.

Всього через 10 місяців стартап OpenAI з Сан-Франциско представив подібну систему, яка створює відео, які виглядають так, ніби їх узяли з голлівудського фільму. Демонстрація включала короткі відео — створені за лічені хвилини — шерстистих мамонтів, що бігають засніженим лугом, монстра, який дивиться на танучу свічку, і вуличну сцену Токіо, яка, здавалося, була знята камерою, що летить по всьому місту.

OpenAI, компанія, що розробила чат-бот ChatGPT і генератор нерухомих зображень DALL-E, є однією з багатьох компаній, які змагаються за вдосконалення цього типу генератора миттєвого відео, включаючи такі стартапи, як Runway, і технологічні гіганти, такі як Google і Meta, власник Facebook та Instagram. Технологія може пришвидшити роботу досвідчених кінематографістів, повністю замінивши менш досвідчених цифрових художників.

Це також може стати швидким і недорогим способом створення онлайн-дезінформації, що ускладнить визначення реальності в Інтернеті.

«Я абсолютно наляканий, що подібні речі можуть вплинути на вибори з вузькою конкуренцією», — сказав Орен Етціоні, професор Вашингтонського університету, який спеціалізується на штучному інтелекті. Він також є засновником некомерційної організації True Media, яка займається виявленням дезінформації в Інтернеті під час політичних кампаній.

OpenAI називає свою нову систему Sora, після японського слова «небо». Команда, яка розробила цю технологію, включно з дослідниками Тімом Бруксом і Біллом Піблзом, вибрала назву, оскільки вона «нагадує про безмежний творчий потенціал».

В інтерв’ю вони також сказали, що компанія ще не випускає Sora для громадськості, оскільки все ще працює над усвідомленням небезпек системи. Натомість OpenAI ділиться технологією з невеликою групою науковців та інших сторонніх дослідників, які створять для неї «червону команду» — термін, що означає пошук способів її неправильного використання.

«Намір полягає в тому, щоб дати попередній огляд того, що є на горизонті, щоб люди могли побачити можливості цієї технології — і ми могли отримати відгук», — сказав доктор Брукс.

OpenAI вже позначає відео, створені системою, водяними знаками, які ідентифікують їх як згенеровані штучним інтелектом. Але компанія визнає, що їх можна видалити. Їх також важко помітити. (The New York Times додала водяні знаки «Generated by A.I.» до відео з цією історією.)

Система є прикладом генеративного штучного інтелекту, який може миттєво створювати текст, зображення та звуки. Як і інші генеративні А.І. технології, система OpenAI навчається, аналізуючи цифрові дані — у цьому випадку відео та підписи, що описують, що ці відео містять.

OpenAI відмовився повідомити, скільки відео система навчилася або звідки вони взялися, за винятком того, що навчання включало як загальнодоступні відео, так і відео, які були ліцензовані власниками авторських прав. Компанія мало говорить про дані, які використовуються для навчання її технологіям, швидше за все, тому, що вона хоче зберегти перевагу над конкурентами — і на неї неодноразово притягували до суду за використання матеріалів, захищених авторським правом.

(У грудні New York Times подала до суду на OpenAI та його партнера Microsoft, стверджуючи, що вони порушують авторські права на вміст новин, пов’язаний із системами штучного інтелекту.)

Sora створює відео у відповідь на короткі описи, як-от «розкішно відтворений паперовий світ коралового рифу, рясніючи різнокольоровими рибами та морськими істотами». Хоча відео можуть бути вражаючими, вони не завжди ідеальні та можуть містити дивні та нелогічні зображення. Система, наприклад, нещодавно згенерувала відео, на якому хтось їсть печиво, але печиво ніколи не ставало меншим.

DALL-E, Midjourney та інші генератори нерухомих зображень настільки швидко вдосконалилися за останні кілька років, що тепер створюють зображення, які майже не відрізняються від фотографій. Це ускладнило виявлення дезінформації в Інтернеті, і багато цифрових художників скаржаться, що це ускладнило їм пошук роботи.

«Ми всі сміялися у 2022 році, коли Midjourney вперше вийшов і сказав: «О, це мило», — сказав Рейд Саутен, концептуальний художник кіно з Мічигану. «Тепер люди втрачають роботу через Midjourney».

Коментарі

Популярні дописи з цього блогу

У Нікополі відбулася онлайн-олімпіада з географії серед школярів: результати

Що насправді означає слово нівроку в українській мові: пояснення значення та використання

Бойко почав "виборчу кампанію" з тезами про "радикалів" і "заборону рідної мови"

Історія про те, як був знайдений золотий гребінь скіфів

Каріна чи Карина: який варіант правильний за правилами української мови

Таксистка висадила сім’ю загиблого воїна через прохання говорити українською: їй загрожує штраф