Google DeepMind в ICML 2024

Исследовать

Опубликовано

Изучение AGI, проблемы масштабирования и будущее мультимодального генеративного ИИ

На следующей неделе сообщество искусственного интеллекта (ИИ) объединится для Международной конференции по машинному обучению 2024 года (ICML). Конференция, работающая с 21 по 27 июля в Вене, Австрия, является международной платформой для демонстрации последних достижений, обмена идеями и формирования будущего исследований ИИ.

В этом году команды со всего Google DeepMind представит более 80 исследовательских работ. На нашем стенде мы также продемонстрируем нашу мультимодальную модель на Device, Gemini Nano, нашу новую семью моделей искусственного интеллекта для образования под названием Learnlm, и мы демонстрируем Tacticai, помощник искусственного интеллекта, который может помочь с футбольной тактикой.

Здесь мы представляем некоторые из наших устных, прожекторов и плакатов:

Определение пути к Agi

Что такое искусственный общий интеллект (AGI)? Фраза описывает систему ИИ, которая, по крайней мере, так же способна, как человек, в большинстве задач. Поскольку модели ИИ продолжают продвигаться, определение того, как AGI может выглядеть на практике, станет все более важным.

Мы представим основу для классификации возможностей и поведения моделей AGI. В зависимости от их производительности, общности и автономии наша статья классифицирует системы, от неай-калькуляторов до появляющихся моделей ИИ и других новых технологий.

Мы также покажем, что открытость имеет решающее значение для создания генерализованного искусственного интеллекта, которое выходит за рамки человеческих возможностей. В то время как многие недавние достижения в области ИИ были обусловлены существующими данными интернет-масштаба, открытые системы могут генерировать новые открытия, которые расширяют человеческие знания.

В ICML мы будем демонстрировать Genie, модель, которая может генерировать диапазон воспроизводимых сред на основе текстовых подсказок, изображений, фотографий или эскизов.

Масштабирование систем ИИ эффективно и ответственно

Разработка более крупных, более способных моделей ИИ требует более эффективных методов обучения, более близкого выравнивания с предпочтениями человека и лучшими гарантиями конфиденциальности.

Мы покажем, как использование классификации вместо методов регрессии облегчает масштабирование систем обучения глубоким подкреплением и обеспечить современную производительность в разных областях. Кроме того, мы предлагаем новый подход, который предсказывает распределение последствий действий подкрепляющего учебного агента, помогая быстро оценить новые сценарии.

Наши исследователи представляют подход, поддерживающий выравнивание, который снижает потребность в человеческом надзоре, и новый подход к тонкой настройке больших языковых моделей (LLMS), основанный на теории игр, лучше выравнивает результаты LLM с человеческими предпочтениями.

Мы критикуем подход моделей обучения на публичных данных и только точную настройку с «дифференциально частным» обучением, и утверждают, что этот подход может не предложить конфиденциальность или утилиту, которая часто утверждается.

VideoPoet-это большая языковая модель для генерации видео с нулевым выстрелом.

Новые подходы в генеративном ИИ и мультимодальности

Генеративные технологии ИИ и мультимодальные возможности расширяют творческие возможности цифровых медиа.

Мы представим VideoPoet, который использует LLM для создания современного видео и аудио из мультимодальных входов, включая изображения, текст, аудио и другое видео.

И делиться джином (генеративные интерактивные среды), которые могут генерировать диапазон игровых сред для обучения агентов ИИ, основанных на текстовых подсказках, изображениях, фотографиях или эскизах.

Наконец, мы вводим Magiclens, новую систему поиска изображений, которая использует текстовые инструкции для извлечения изображений с более богатыми отношениями за пределами визуального сходства.

Поддержка сообщества ИИ

Мы гордимся спонсором ICML и развиваем разнообразное сообщество в области ИИ и машинного обучения, поддерживая инициативы, возглавляемые инвалидностью в искусственном интеллекте, квира в области искусственного интеллекта, латинькс в области искусственного интеллекта и женщин в машинном обучении.

Если вы на конференции, посетите Google DeepMind и Google Research Swoods, чтобы встретиться с нашими командами, увидеть живые демонстрации и узнать больше о наших исследованиях.

Узнать больше

Source link

Scroll to Top