Google DeepMind на ICLR 2024

Исследовать

Опубликовано

Разработка агентов ИИ следующего поколения, изучение новых методов и новаторское обучение.

На следующей неделе исследователи ИИ со всего мира будут сходятся на 12-й Международной конференции по обучению представлений (ICLR), которая состоится 7-11 мая в Вене, Австрия.

Райя Хэдселл, вице -президент по исследованиям в Google DeepMind, предоставит основной доклад, размышляя о последних 20 лет в этой области, подчеркивая, как извлеченные уроки формируют будущее ИИ на благо человечества.

Мы также предложим живые демонстрации, демонстрирующие, как мы приведем наши основополагающие исследования в реальность, от развития трансформеров робототехники до создания инструментов и моделей с открытым исходным кодом, таких как Gemma.

В этом году команды со всего Google DeepMind представит более 70 статей. Некоторые исследования подчеркивают:

Агенты по решению проблем и подходы, вдохновленные человеком

Крупные языковые модели (LLMS) уже революционизируют передовые инструменты ИИ, однако их полный потенциал остается неиспользованным. Например, агенты искусственного интеллекта на основе LLM, способные предпринять эффективные действия, могут превратить цифровые помощники в более полезные и интуитивно понятные инструменты искусственного интеллекта.

Помощники искусственного интеллекта, которые следуют инструкциям по естественному языку для выполнения веб-задач от имени людей, были бы огромными временами. В устной презентации мы представляем Webagent, управляемого LLM агентом, который учится от самооценки для навигации и управления сложными задачами на веб-сайтах реального мира.

Чтобы дополнительно повысить общую полезность LLMS, мы сосредоточились на повышении их навыков решения проблем. Мы демонстрируем, как мы достигли этого, оснастив систему на основе LLM традиционно человеческим подходом: создание и использование «инструментов». Отдельно мы представляем метод обучения, которая гарантирует, что языковые модели производят более последовательно социально приемлемые результаты. В нашем подходе используется репетиционное пространство песочницы, которое представляет ценности общества.

Раздвигать границы в зрения и кодирования

Наша модель динамического трансформатора сцены (DYST) использует реальные видео с одной камерой для извлечения трехмерных представлений объектов в сцене и их движений.

До недавнего времени крупные модели ИИ в основном были сосредоточены на текстах и ​​изображениях, закладывая основу для крупномасштабного распознавания шаблонов и интерпретации данных. Теперь поле продвигается за пределами этих статических сфер, чтобы охватить динамику реальных визуальных сред. По мере того, как вычислительные достижения по всему совету становится все более важным, чтобы его базовый код генерировался и оптимизирован с максимальной эффективностью.

Когда вы смотрите видео на плоском экране, вы интуитивно понимаете трехмерный характер сцены. Машины, однако, изо всех сил пытаются подражать этой способности без явного надзора. Мы демонстрируем нашу динамическую модель трансформатора сцены (DYST), которая использует реальные видео с одной камерой для извлечения трехмерных представлений объектов в сцене и их движений. Более того, Dyst также позволяет генерацию новых версий одного и того же видео, с пользовательским управлением углами камеры и контентом.

Эмуляция человеческих когнитивных стратегий также делает лучшие генераторы кодов ИИ. Когда программисты пишут сложный код, они обычно «разлагают» задачу на более простые подзадачи. С Exedec мы вводим новый подход, генерирующий код, который использует подход разложения для повышения производительности программирования и обобщения систем ИИ.

В параллельной бумаге для прожектора мы исследуем новое использование машинного обучения, чтобы не только генерировать код, но и оптимизировать его, внедряя набор данных для надежного сравнительного анализа производительности кода. Оптимизация кода является сложной задачей, требуя сложных рассуждений, а наш набор данных позволяет исследовать ряд методов ML. Мы демонстрируем, что полученные стратегии обучения превосходят оптимизацию кода, созданные человеком.

Exedec представляет новый подход, генерирующий код, который использует подход разложения для повышения производительности программирования и обобщения систем ИИ

Продвигая основополагающее обучение

Наши исследовательские группы решают большие вопросы ИИ – от изучения сущности машинного познания до понимания того, как обобщают продвинутые модели ИИ – а также для преодоления ключевых теоретических проблем.

Как для людей, так и для машин, причинно -следственные мышления и способность прогнозировать события являются тесно связанными понятиями. В презентации в центре внимания мы исследуем, как подкрепляющее обучение влияет на основанные на прогнозировании цели обучения, и проводим параллели с изменениями в мозговой активности, также связанных с прогнозом.

Когда агенты искусственного интеллекта могут хорошо обобщать новые сценарии, это потому, что они, как и люди, выучили основную причинную модель своего мира? Это критический вопрос в Advanced AI. В устной презентации мы показываем, что такие модели действительно изучили приблизительную причинную модель процессов, которые привели к их обучению, и обсуждают глубокие последствия.

Другим критическим вопросом в ИИ является доверие, которое частично зависит от того, насколько точно модели могут оценить неопределенность их результатов – важный фактор для надежного принятия решений. Мы добились значительных успехов в оценке неопределенности в байесовском глубоком обучении, используя простой и по существу бесплатный метод.

Наконец, мы исследуем равновесие теории игры NASH (NE) – состояние, в котором ни один игрок не выигрывает от изменения своей стратегии, если другие поддерживают свою. Помимо простых игр с двумя игроками, даже аппроксимирование равновесия Нэша является вычислительно неразрешимым, но в устной презентации мы раскрываем новые современные подходы при переговорах с сделками от покера на аукционы.

Объединение сообщества ИИ

Мы рады спонсировать ICLR и инициативы по поддержке, в том числе странные в области искусственного интеллекта и женщин в машинном обучении. Такое партнерство не только поддерживает сотрудничество в области исследования, но и способствует оживленному, разнообразному сообществу в области ИИ и машинного обучения.

Если вы в ICLR, обязательно посетите наш стенд и наших коллег по исследованию Google по соседству. Откройте для себя наши новаторские исследования, познакомьтесь с нашими командами, проводимыми семинарами, и взаимодействуйте с нашими экспертами, представляющими на протяжении всей конференции. Мы с нетерпением ждем связи с вами!

Source link

Scroll to Top