Лондонская AI Lab Odyssey запустила исследовательский предварительный просмотр модели, превращающего видео в интерактивные миры. Первоначально сосредоточившись на мировых моделях для кинопроизводства, команда Odyssey наткнулась на совершенно новое отвлечение.
Интерактивное видео, сгенерированное моделью Odyssey AI, отвечает на входы в режиме реального времени. Вы можете взаимодействовать с ним с клавиатурой, телефоном, контроллером или, возможно, даже голосовыми командами. Люди в Odyssey считают его «ранней версией голодека».
Нижний ИИ может генерировать реалистичные видео каждые 40 миллионеродов. Это означает, что когда вы нажимаете кнопку или делаете жест, видео отвечает почти мгновенно – создавая иллюзию, которую вы фактически влияете на этот цифровой мир.
«Сегодня опыт изучает скользкую мечту – сырую, нестабильную, но определенно новую», – говорит Одиссея. Мы не говорим о полированных, AAA Game Heallings здесь, по крайней мере, пока.
Не ваша стандартная видео -техника
Мы на мгновение небольшая техника. Что отличает эту технологию видео-взаимодействия AI-AI от, например, стандартной видеоигры или CGI? Все приходит к чему -то, что Одиссея называет «мировой моделью».
В отличие от традиционных видео-моделей, которые генерируют целые клипы за один раз, World Models работают в рамке, чтобы предсказать, что должно произойти позже в зависимости от текущего состояния и некоторых, использующих входные данные. Это похоже на то, как крупные языковые модели предсказывают следующее слово в последовательности, но бесконечно более сложны, потому что мы говорим о видео с высоким разрешением вместо слов.
«Мировая модель, по своей сути, является динамической моделью, поддерживаемой действием», как говорит Odyssey. Всякий раз, когда вы взаимодействуете, модель принимает текущее состояние, ваше действие и историю о том, что произошло, затем генерирует следующую видеозамму.
Результат – это то, что кажется более органичным и непредсказуемым, чем традиционная игра. Не существует предварительно запрограммированной логики, в которой говорится: «Если игрок делает X, то вы случаетесь»-ИИ, ИИ делает все возможное, что должно произойти позже, исходя из того, что он узнал из просмотра бесчисленных видео.
Odyssey имеет дело с историческими проблемами с помощью видео, сгенерированного AI
Создание чего -то подобного не совсем прогулка в парке. Одним из самых больших препятствий с интерактивным видео, сгенерированным AI, является со временем сохранить его стабильным. Когда вы генерируете каждый кадр на основе предыдущего, небольшие ошибки могут быстро собраться (явление AI -Researchers называется «дрифт».)
Чтобы справиться с этим, Odyssey использовал то, что они называют «узкой моделью распределения» -предварительно обучение их ИИ в общих видеозаписи, а затем настраивает ее в меньший набор сред. Этот обмен означает меньше разнообразия, но лучше стабильности, поэтому все не становится странным салатом.
Компания говорит, что они уже делают «быстрый прогресс» в своей модели следующего гена, которая, похоже, показывает «более богатый диапазон пикселей, динамики и действий».
Запуск всей этой технологии искусственного интеллекта в реальном времени не дешево. В настоящее время инфраструктура, работающая на этом опыте, стоит 0,80–1,60 (1-2 фунта стерлингов) за час, полагаясь на массы графических процессоров H100, разбросанных по всей территории Соединенных Штатов и ЕС.
Это может выглядеть дорого для потоковых видеороликов, но это заметно дешево по сравнению с производством традиционного игры или контента фильма. И Odyssey ожидает, что эти затраты упадут дальше по мере того, как модели станут более эффективными.
Интерактивное видео: Следующая история?
На протяжении всей истории новые технологии родили новые формы рассказывания историй – от картин пещер до книг, фотографии, радио, кино и видеоигр. Odyssey считает, что интерактивное видео, сгенерированное AI, является следующим шагом в этой разработке.
Если они правы, мы можем посмотреть на прототип чего -то, что изменит развлечения, образование, рекламу и многое другое. Представьте себе обучение видео, где вы можете практиковать навыки, преподаваемые, или путешествия, где вы можете изучить места назначения вашего дивана.
Доступный предварительный просмотр исследования теперь является лишь небольшим шагом к этому видению и больше доказательств концепции, чем готовый продукт. Тем не менее, это интригующий проблеск того, что может быть возможно, когда сгенерированные AI миры становятся интерактивными игровыми площадками, а не только пассивными опытами.
Вы можете попробовать предварительный просмотр исследования здесьПолем
Смотрите также: Telegram и Xai Forge Grok AI Deal
Вы хотите узнать больше об искусственном интеллекте и больших данных промышленными лидерами? Посмотреть AI & Big Data Expo, проходящую в Амстердаме, Калифорнии и Лондоне. Комплексное мероприятие связано с другими основными событиями, включая Smart Automatic Conference, Blockx, неделю цифровой трансформации и кибербезопасность и Cloud Expo.
Исследуйте другие предстоящие корпоративные технологические мероприятия и веб -страницы, управляемые Techforge здесь.