Apple делает крупный AI Advance с соперничеством технологии генерации изображений Dall-E и Midjourney


Присоединяйтесь к событию, надежно со стороны корпоративных лидеров в течение почти двух десятилетий. VB Transform собирает людей, строящих настоящую корпоративную стратегию ИИ. Узнать больше


Исследовательская группа Apple Machine Learning разработала предыдущую систему ИИ для генерации изображений с высоким разрешением, которые могут бросить вызов контролю диффузионных моделей, технологии, использующих популярные генераторы изображений, такие как Dall-E и Midjourney.

Прогрессия, подробно описанная в исследовательской статье, опубликованной на прошлой неделе, представляет «Starflow», систему, разработанную исследователями Apple в сотрудничестве с академическими партнерами, которая сочетает в себе токи нормализации с автоматическими трансформаторами для достижения того, что команда называет «конкурентоспособными показателями» с государственными моделями распространения.

Аванс наступает в критический момент для Apple, которая столкнулась с критикой своей борьбы с искусственным интеллектом. На Всемирной конференции мировых застройщиков в понедельник компания раскрыла лишь скромные обновления ИИ на своей платформе Apple Intelligence, подчеркивая конкурентное давление, с которой сталкиваются компания, которую многие считают отсталым в гонке оружия ИИ.

«Насколько нам известно, эта работа является первым успешным доказательством стандартизации токов, действующих в этом масштабе и разрешении», – написали исследовательскую группу, в которую входят исследователи из Apple Machine Learning Jiatao Gu, Джошуа М. Сусскинд и Шуангфей Чжай, а также академические коллабораторы, включая Калифорнийский университет, Беркели и Георджия.

Поскольку Apple борется с Openai и Google в войнах ИИ

Исследования Starflow представляют собой более широкие усилия Apple по разработке отличительных навыков искусственного интеллекта, которые могут отличить его продукты от конкурентов. В то время как такие компании, как Google и Openai, доминировали в названиях с их генеративным прогрессом искусственного интеллекта, Apple работала над альтернативными подходами, которые могут предложить уникальные преимущества.

Исследовательская группа справилась с фундаментальной проблемой в генерации AI-Image: скализование токов нормализации для эффективной работы с изображениями с высоким разрешением. Нормализация токов, своего рода генеративная модель, которая учится трансформировать простые распределения в комплексные, традиционно были затенены диффузионными моделями и генеративными противоположными сетями в синтетических приложениях изображений.

«Starflow достигает конкурентной работы как в классах, так и в задачах генерации изображений на основе текста, приближаясь к большинству современных диффузионных моделей в качестве образца», -написали исследователи, показывая универсальность системы с помощью различных типов синтетических задач изображений.

В рамках математического открытия, которое Эмпании новой системы ИИ в Apple

Исследовательская группа Apple представила несколько ключевых инноваций, чтобы преодолеть границы существующих подходов к потоку нормализации. Система использует то, что исследователи называют «глубоким дизайном», используя «блок глубокого преобразования (который) отражает большую часть модели репрезентативной способности, дополненной некоторыми мелкими блоками преобразования, которые являются компьютерными, но существенно полезными».

Аванс также включает в себя работу в «скрытом пространстве обработанных автомобильных кодеров, что оказывается более эффективным, чем прямое моделирование на уровне пикселей», согласно документу. Этот подход позволяет модели работать с сжатыми изображениями, а не с необработанными пиксельными данными, значительно повышая эффективность.

В отличие от диффузионных моделей, которые зависят от итеративных нечестных процессов, Starflow поддерживает математические свойства токов нормализации, что позволяет «правильному максимальному обучению вероятности в непрерывных пространствах без дискретизации».

Что означает Starflow для будущих продуктов iPhone и Mac от Apple

Исследование поступает, когда Apple сталкивается с растущим давлением, чтобы доказать значительный прогресс в искусственном интеллекте. Недавний анализ Bloomberg подчеркнул, как Apple Intelligence и Siri изо всех сил пытались конкурировать с конкурентами. Скромные объявления Apple в WWDC на этой неделе подчеркнули проблемы компании в AI-пространстве.

Для Apple правая вероятность Starflow может предложить преимущества в приложениях, требующих точного контроля сгенерированного контента или в сценариях, где понимание неопределенности модели имеет решающее значение для принятия решений, которые это возможно для корпоративных приложений и возможностей искусственного интеллекта, которые подчеркнул Apple.

Исследование демонстрирует, что альтернативные подходы к диффузионным моделям могут достичь сопоставимых результатов, возможно, открывая новые возможности для инноваций, которые могут воспроизводить силы Apple в интеграции аппаратного программного обеспечения и обработки на устройстве.

Почему Apple делает ставки на университетские партнерские отношения, чтобы решить их AI -проклятие

Исследование иллюстрирует стратегию Apple по сотрудничеству с крупными академическими учреждениями для продвижения их навыков искусственного интеллекта. Соавтор Тяньронг Чен, докторская студентка из Georgia Tech, которая усваивается в исследовательскую группу Apple по машинному обучению, привносит опыт в области стохастического оптимального контроля и генеративного моделирования.

Сотрудничество также включает в себя Руиксан Чжан из математического раздела UC Berkeley и Laurent Dinh, исследователя машинного обучения, известного своей новаторской работой над моделями, основанными на потоках в Google Brain и Deepmind.

«В свою очередь, наша модель остается сквозной нормализацией»,-подчеркнули исследователи, отличая свой доступ от гибридных методов, которые предлагают математическую обработку для повышения производительности.

Полный исследовательский документ доступен в ARXIV, предоставляя технические детали для исследователей и инженеров, стремящихся построить эту работу в конкурентной области генеративного искусственного интеллекта. В то время как Starflow представляет собой значительное техническое достижение, фактическим тестом будет то, может ли Apple перевести такие успехи в исследованиях в виды функций AI потребителя, которые сделали конкурентов, таких как имена HATGPT. Для компании, которая когда -то революционизировала целые отрасли с такими продуктами, как iPhone, вопрос не в том, может ли Apple инновация в области искусственного интеллекта – это может ли они сделать это достаточно быстро.


Source link
Scroll to Top