Arc Award запустила Hardcore Arc-Agi-2, в сопровождении объявления об их конкурсе 2025 года с наградами в размере 1 миллиона долларов.
По мере того, как ИИ прогрессирует от выполнения узких задач до доказательства общего адаптивного интеллекта, проблемы дуговых аги-2 направлены на обнаружение способных недостатков и активно руководить инновациями.
«Хорошая актерская деятельность действует как полезные показатели прогресса. Лучшие действия -ссылки четко реализуют навыки. Лучшие слова -все это делают и активно вдохновляют исследования и направляют инновации», -говорится в команде ARC Award.
Arc-Agi-2 стремится охватить «лучшую» категорию.
Помимо напоминания
С момента своей вспышки в 2019 году награда ARC послужила «северной звездой» для исследователей, стремящихся действовать, создавая текущие ссылки.
Бесценыец как дуговой аги-1 склонялись к измерению интеллекта жидкости (то есть способность адаптировать обучение к новым невидимым задачам.) Это представляло собой четкий отход от баз данных, которые вознаграждают только напоминание.
Миссия Arc Award также продвигается вперед, направленная на ускорение сроков для научных достижений. Его ссылки приводятся не только для измерения прогресса, но и для того, чтобы вдохновлять новые идеи.
Исследователи наблюдали критическое изменение с дебютом O3 O3 O3 O3 в конце 2024 года, оцененному с использованием ARC-AGI-1. Объединяя глубокие модели на основе глубокого обучения (LLMS) с рассуждением синтетических двигателей, O3, отмеченный прогресс, где ИИ пересекался за пределы вращающегося напоминания.
Однако, несмотря на прогресс, такие системы, как O3, остаются неэффективными и требуют значительного обзора человека во время учебных процессов. Чтобы оспорить эти системы для истинной адаптации и эффективности, награда ARC представила ARC-AI-2.
Arc-Agi-2: закройте разрыв в человеке-машине
Ссылка Arc-Agi-2 труднее сохранить его доступность для людей. В то время как системы рассуждений по границе ИИ продолжают зарабатывать на однозначный процент на ARC-AI-2, люди могут решить каждую задачу в двух тестах.
Так что же отделяет дуговые аги? Его философия рисования выбирает задачи, которые «относительно просты для людей, но жесткие или невозможные для ИИ».
Ссылка включает данные с видимостью переменной и следующие функции:
- Символическая интерпретация: ИИ пытается приписать семантическое значение символам, вместо этого сосредотачивая мелкие сравнения как симметричные проверки.
- Составные рассуждения: ИИ падает, когда ему нужно применять несколько интерактивных правил одновременно.
- Контекст регулярного приложения: Системы не могут применять правила по -разному в зависимости от сложных контекстов, часто устанавливая на поверхности шаблоны.
Большинство существующих ссылок посвящены сверхчеловеческим навыкам, тестированию продвинутых, специальных навыков в масштабах, недоступных для большинства людей.
Arc-Agi бросает сценарий и подчеркивает, что ИИ еще не может сделать; В частности, адаптация, которая определяет человеческий интеллект. Когда разрыв между задачами легко для людей, но трудно иметь возможность достичь нуля, действие может быть объявлено.
Однако достижение действий не ограничивается способностью решать задачи; Эффективность – стоимость и ресурсы, необходимые для поиска решений – появляются как основной определенный фактор.
Роль эффективности
Измерение производительности по цене по задаче имеет важное значение для оценки интеллекта как не только способности решать проблемы, но и способность делать это эффективно.
Примеры реального мира уже показывают эффективные недостатки между людьми и системами пограничного искусственного интеллекта:
- Эффективность панели человека: Задачи Arc-Agi-2 с 100% точностью в 17 долларов США/задача.
- Openai O3: Ранние оценки предполагают, что 4% успешная ставка на глазное уделяние 200 долларов за задачу.
Эти метрики подчеркивают неравенство в адаптации и ресурсном потреблении между людьми и ИИ. Arc Award была привержена сообщению о результатах, а также счетами в будущих членах совета директоров.
Основное внимание на эффективности предотвращает использование неразумных решений «истинным интеллектом».
Интеллект, согласно премии ARC, охватывает решения для поиска решений с минимальными ресурсами – качество, особенно человеческое, но все еще сложно для ИИ.
Arch Award 2025
ARC Award 2025 запускается на Kaggle на этой неделе, обещая общую награду в 1 миллион долларов и продемонстрировав живой совет по авансам с открытым исходным кодом. Конкурс направлен на содействие успехам в системах, которые могут эффективно решать проблемы Arc-Agi-2.
Среди премиальных категорий, которые увеличились к 2024 году, общие данные:
- Гран При: 700 000 долл. США на достижение 85% успеха в пределах границ каггл -эффективности.
- Лучшая награда: 75 000 долларов за самую высокую регистрацию.
- Бумажный приз: 50 000 долл. США на преобразующие идеи, способствующие решению задач ARC-AGI.
- Дополнительные награды: 175 000 долл. США, с подробностями, ожидающими рекламы во время конкурса.
Эти мотивы обеспечивают справедливый и значительный прогресс при кормлении сотрудничества между исследователями, лабораториями и независимыми командами.
В прошлом году награда ARC 2024 показала 1500 конкурирующих команд, что привело к 40 статьям от известного промышленного влияния. Повышенные ставки направлены на развитие еще большего успеха.
Arc Award считает, что прогресс влияет на новые идеи, а не просто масштабировать существующие системы. Следующий прогресс в эффективных общих системах может возникнуть не из современных технологических гигантов, а от смелых, креативных исследователей, охватывающих сложность и любопытные эксперименты.
(Изображение предоставлено: приз арки)
Смотрите также: DeepSeek v3-0324 лучшие незданные модели искусственного интеллекта в первую очередь в открытом исходном коде
Вы хотите узнать больше об искусственном интеллекте и больших данных промышленными лидерами? Посмотреть AI & Big Data Expo, проходящую в Амстердаме, Калифорнии и Лондоне. Комплексное мероприятие связано с другими основными событиями, включая Smart Automatic Conference, Blockx, неделю цифровой трансформации и кибербезопасность и Cloud Expo.
Исследуйте другие предстоящие корпоративные технологические мероприятия и веб -страницы, управляемые Techforge здесь.