Открыть инструмент для AI -видео -оснований для всех

Alibaba раскрыл Wan2.1-Vace, модель ИИ с открытым исходным кодом, предназначенную для того, чтобы встряхнуть, когда мы создаем и редактируем видео.

Вейс не появляется из воздуха; Это часть более широкой семьи Wan2.1 из моделей Alibaba de Video AI. И они делают довольно смелое утверждение об этом, заявив, что это «первая модель с открытым исходным кодом в отрасли, чтобы предоставить единое решение для различных видео и редактирования задач».

Если Alibaba удастся убрать пользователей от необходимости судить о нескольких, отдельных инструментах для одного оптимизированного концентратора-это может быть реальным изменением игры.

Так что на самом деле это может сделать? Что ж, для начинающих он может снимать видео с всевозможными обещаниями, включая текстовые команды, неподвижные картинки и даже фрагменты других видео.

Но речь идет не только о том, чтобы снять видео с царапиной. Редактирование Gear поддерживает эталонные изображения или конкретные кадры для руководства AI, расширенного видео «Repintment» (подробнее об этом в SEC), ретуширование вновь выбранных битов из существующего видео и даже расширить видео. Алибаба считает, что эти функции «обеспечивают гибкую комбинацию различных задач для улучшения творчества».

Представьте, что вы хотите создать видео с конкретными персонажами, взаимодействующими, возможно, на основе некоторых фотографий, которые у вас есть. Вейс утверждает, что может это сделать. У вас есть изображение, которое вы хотите, была динамичной? Вступительный сбор средств Alibaba может добавить естественное движение, чтобы воплотить его в жизнь.

Для тех, кто любит настраивать, это те расширенные «повторные видео», которые я упоминал ранее. Это включает в себя такие вещи, как передача позиций от одного субъекта другому, точный контроль над движением, регулировка глубокого восприятия и даже изменение цвета.

Одной из особенностей, которая захватила мой взгляд, является его способность «поддерживать добавление, модификацию или удаление в селективные конкретные области видео, не влияя на окружающую область». Это огромный профицит для подробных изменений – больше не вставляя фон, когда вы просто пытаетесь установить один маленький элемент. Кроме того, он может расширить ваш видео -холст и даже заполнить новое пространство важным контентом, чтобы все выглядело более богаче и обширнее.

Вы можете сделать плоскую фотографию, преобразовать его в видео и сказать в нем объекты, как двигаться, вытягивая путь. Вам нужно обменять роль или предмет с чем -то еще, что вы предоставляете в качестве ссылки? Без проблем. Оживить эти ссылочные знаки? Сделанный. Чтобы точно проверить их положение? Ты получил это.

Alibaba даже приводит пример своей модели искусственного интеллекта с открытым исходным кодом, который снимает высокое, тонкое вертикальное изображение и умно расширяя его в широкое экрановое видео, автоматически добавляя новые кусочки и части, ссылаясь на другие изображения или обещания. Это довольно хорошо.

Конечно, Вейс – это не просто волшебство. Есть какой -то умный Te Techniko, предназначенный для того, чтобы справиться с часто ужиной реальности редактирования видео. Ключевой частью является то, что Alibaba вызывает видео -кондиционирование (VCU), которая «поддерживает единую обработку мультимодальных входов, таких как текст, изображения, видео и маски».

Тогда это то, что они называют «контекстуальной адаптивной структурой». Это умное инженерное «инженерное” вводит различные концепции задач с использованием формализованных представлений о времени и пространственных измерениях ». В основном подумайте об этом, как дать ИИ действительно хорошее понимание времени и пространства в видео.

Со всей этой умной технологией Alibaba считает, что Вэйс будет успешным в очень немногих областях. Подумайте о быстрых социальных сетях, поразительных рекламных объявлениях и контенте рынка, тяжелых пост -спецэффектах для кино и телевидения, а также для создания пользовательских образовательных и обучающих видео.

Alibaba делает WAN2.1-Vace открытым исходным кодом, чтобы распространить AI-AMO

Создание моделей ИИ Эта мощность обычно стоит удачи и нуждается в огромной компьютерной мощности и тоннах данных. Итак, Alibaba делает Wan2.1-Vace с открытым исходным кодом? Это большая вещь.

«Открытый доступ помогает снизить планку для большего количества компаний для использования ИИ, что позволяет им создавать высококачественный визуальный контент, адаптированный к их потребностям, быстро и эффективно затрат», -объясняет Алибаба.

По сути, Alibaba надеется позволить большему количеству людей, особенно более мелких предприятий и отдельных создателей, которые дают свои руки на самый высокий ИИ, не нарушая банк. Эта демократизация мощных инструментов всегда является долгожданным взглядом.

И они не просто бросают одну версию. Существует высокая модель параметров 14 миллиардов для тех, у кого есть серьезная мощность, и более приятный параметр 1,3 миллиарда параметров для более легких договоренностей. Теперь вы можете поймать их бесплатно, обнимая лицо и GitHub, или собственным открытым фондом Alibaba Cloud, Modelcope.

(Источник: www.alibabagroup.com)

Смотрите также: Тормоза США сдерживают правило AI -диспарическое

Вы хотите узнать больше об искусственном интеллекте и больших данных промышленными лидерами? Посмотреть AI & Big Data Expo, проходящую в Амстердаме, Калифорнии и Лондоне. Комплексное мероприятие связано с другими основными событиями, включая Smart Automatic Conference, Blockx, неделю цифровой трансформации и кибербезопасность и Cloud Expo.

Исследуйте другие предстоящие корпоративные технологические мероприятия и веб -страницы, управляемые Techforge здесь.

Source link

Scroll to Top