Google DeepMind представляет Alphaevolve: AI-агент кодирования, способствующий Близнецам для обнаружения алгоритма и научной оптимизации

Дизайн алгоритма и научные открытия часто требуют дотошного цикла исследований, тестирования гипотез, уточнения и валидации. Традиционно эти процессы в значительной степени зависят от экспертной интуиции и ручной итерации, особенно для проблем, основанных на комбинаторике, оптимизации и математической конструкции. В то время как крупные языковые модели (LLMS) недавно продемонстрировали перспективу при ускорении генерации кода и решения проблем, их способность автономно генерировать доказуемо правильные и вычислительно превосходные алгоритмы остается ограниченной, особенно когда решения должны обобщать различные варианты использования или обеспечить производительность производственного уровня.

Google DeepMind представляет alphaevolve

Для решения этих ограничений, Google DeepMind представила Alphaevolveагент кодирования следующего поколения, основанный на Gemini 2.0 LLMS. AlphaEvolve разработана для автоматизации процесса обнаружения алгоритма с использованием нового слияния крупномасштабных языковых моделей, автоматической оценки программ и эволюционных вычислений. В отличие от обычных помощников по коде, Alphaevolve автономно переписывает и улучшает алгоритмический код, изучая структурированную петлю обратной связи, атеративно предлагая, оценивая и развивая новые решения для кандидатов с течением времени.

Alphaevolve организует трубопровод, в котором LLMS генерирует программные мутации, информированные по предыдущим высокопроизводительным решениям, в то время как автоматизированные оценщики назначают оценки производительности. Эти оценки способствуют постоянному процессу уточнения. Alphaevolve опирается на предыдущие системы, такие как Funsearch, но значительно расширяет свои возможности – отдавая полные кодовые базы на нескольких языках и одновременно оптимизация для нескольких целей.

Архитектура системы и технические преимущества

Архитектура AlphaEvolve сочетает несколько компонентов в асинхронную и распределенную систему:

  • Быстрое строительство: Сэмплер собирает подсказки с использованием предыдущих решений с высокой оценкой, математического контекста или структуры кода.
  • LLM ансамбль: Гибрид Gemini 2.0 Pro и Gemini 2.0 Flash обеспечивает баланс между высококачественным пониманием и быстрым исследованием идеи.
  • Оценка структура: Пользовательские функции оценки используются для систематической оценки алгоритмической производительности на основе предопределенных метрик, что обеспечивает прозрачное и масштабируемое сравнение.
  • Эволюционная петля: Alphaevolve поддерживает базу данных предыдущих программ и данных о производительности, которые она использует для информирования новых поколений кода, балансировки исследования и эксплуатации.

Ключевая техническая сила заключается в гибкости Alphaevolve. Он может развивать полные программы, поддерживать многообъективную оптимизацию и адаптироваться к различным абстракциям проблем-будь то развивающиеся функции конструктора, поиск эвристики или целые трубопроводы оптимизации. Эта возможность особенно полезна для проблем, когда прогресс используется в машине, например, умножение матрицы или планирование центров обработки данных.

Результаты и реальные приложения

Alphaevolve продемонстрировала надежную производительность в теоретических и прикладных доменах:

  • Умножение матрицы: Alphaevolve обнаружил 14 новых алгоритмов с низким рейтингом для умножения матрицы. В частности, он обнаружил метод для умножения комплексных матриц 4 × 4 с использованием 48 скалярных умножений-просмотра давней связанной с 49-мультиплинацией, установленным алгоритмом Страссена в 1969 году.
  • Математическое открытие: Применяется к более чем 50 математическим задачам, включая минимальную проблему перекрытия ERDS и задачу поцелуя в 11 измерениях,-альфа-эволюция соответствовала существующим современным конструкциям в ~ 75% случаев и превзошел их в ~ 20%, и все это требует минимального экспертного ручного краната.
  • Оптимизация инфраструктуры в Google:
    • Планирование центров обработки данных: Alphaevolve сгенерировал эвристику планирования, которая повысила эффективность ресурсов на глобальном вычислительном флоте Google, восстанавливая 0,7% вычислительной пропускной способности, эквивалентной сотням тысяч машин.
    • Инженерия ядра для Близнецов: Оптимизированная эвристика для плитки дала 23% ускорение для ядра умножения матрицы, сократив общее время обучения Близнецов на 1%.
    • Аппаратный дизайн: Alphaevolve предложила оптимизации на уровне версии в арифметические схемы TPU, способствуя снижению площади и мощности без ущерба для правильности.
    • Оптимизация на уровне компилятора: Изменение сгенерированных компиляторами XLA-промежуточных представлений для ядер внимания AlphaEvolve обеспечила 32% улучшение производительности в выполнении вспышки.

Эти результаты подчеркивают общность и воздействие Alphaevolve-возможно, обнаруживая новые алгоритмы и развертывая их в условиях производственного уровня.

Заключение

Alphaevolve представляет собой значительный скачок вперед в научном и алгоритмическом открытии A-A-Assisted. Интегрируя LLM с мощностью Близнецов с эволюционным поиском и автоматической оценкой, Alphaevolve выходит за рамки ограничений предыдущих систем, предлагая масштабируемый двигатель общего назначения, способный раскрыть высокопроизводительные, проверенные правильные алгоритмы в разных доменах.

Его развертывание в инфраструктуре Google-и его способность улучшать как теоретические границы, так и в реальных системах-предполагает будущее, когда агенты искусственного интеллекта не просто помогают в разработке программного обеспечения, но и активно способствуют научному прогрессу и оптимизации системы.


Проверьте Бумажный и официальный релиз. Весь кредит на это исследование направлено на исследователей этого проекта. Кроме того, не стесняйтесь следить за нами Twitter И не забудьте присоединиться к нашему 90K+ ML SubredditПолем


ASIF Razzaq является генеральным директором Marktechpost Media Inc. как дальновидного предпринимателя и инженера, ASIF стремится использовать потенциал искусственного интеллекта для социального блага. Его последнее усилие-запуск медиа-платформы искусственного интеллекта, Marktechpost, которая выделяется благодаря глубокому освещению машинного обучения и новостей о глубоком обучении, которое является технически обоснованным и легко понятным для широкой аудитории. Платформа может похвастаться более чем 2 миллионами ежемесячных просмотров, иллюстрируя свою популярность среди зрителей.

Source link

Scroll to Top