Amazon представила новый акт, модель искусственного интеллекта с высоким уровнем уровня, созданную для умных агентов, которые могут выполнять задачи в браузерах.
В то время как модели крупных языков популяризировали концепцию «агентов», таких как инструменты, которые отвечают на вопросы или восстанавливают информацию, с помощью таких методов, как поколение, поколение (RAG), Amazon предусматривает что-то более сильное. Компания определяет агентов не только как респонденты, но и как организации, способные выполнять осязаемые, многоэтапные задачи в различных цифровых и физических средах.
«Мы мечтаем, что агенты выполняют обширные, сложные, многоэтапные задачи, такие как организация свадьбы или выполнение сложных задач для повышения производительности бизнеса», -сказал Амазон.
Текущий рынок часто снижается, и многие агенты, требующие непрерывного обзора человека, и их функциональность зависит от обширного API – интеграции – чего -то невозможного для всех задач. Новое действие – это ответ Amazon на эти ограничения.
В дополнение к модели Amazon публикует исследование предварительного просмотра Amazon New Act SDK. Используя SDK, разработчики могут создавать агенты, способные автоматизировать онлайн-задачи, такие как отправка уведомлений о офисе, заинтересованности плана или автоматические ответы по электронной почте.
SDK стремится уничтожить сложные рабочие процессы в надежные «ядерные команды», такие как поиск, проверка или взаимодействие с конкретными элементами интерфейса, такими как Drop -Offs или Pop -Up Windows. Подробные инструкции могут быть добавлены для уточнения этих команд, что позволяет разработчикам, например, обучая агента обходить страховку во время оплаты.
Для дальнейшего повышения точности SDK поддерживает манипулирование браузером с помощью драматурга, вызовов API, Python -Integrations и параллельной ветки, чтобы выиграть задержки веб -страницы.
Новый акт: исключительное действие по ссылкам
В отличие от других генеративных моделей, которые показывают среднюю точность в сложных задачах, новый акт приоритет надежности. Amazon подчеркивает впечатляющие точки более чем 90% на внутренних оценках конкретных навыков, которые обычно бросают вызов конкурентам.
Новое действие достигло почти идеального 0,939 на экране веб-сайта Screenspot, который измеряет инструкции по естественному языку для текстовых взаимодействий, таких как набор шрифтов. Конкурентные модели, такие как Claude 3,7 Сонет (0,900) и CUA Openai (0,883) за значительными краями.
Аналогичным образом, новый акт выиграл 0,879 в онлайн -значке Screenspot, который проверяет взаимодействие с визуальными элементами, такими как рейтинговые звезды или значки. В то время как тест Teredui, предназначенный для оценки навыков ИИ в навигации по различным элементам пользовательского интерфейса, показал новый акт, слегка передающий конкурентов, Amazon рассматривает это как область, зрелую для улучшения по мере развития модели.
Амазонка подчеркивает свое внимание на обеспечении практической надежности. После того, как агент, созданный с использованием нового акта, работает, как и ожидалось, разработчики могут развернуть его обезглавливание, интегрировать его как API или даже планировать его для организации задач назначения. В одном доказанном случае использование агент автоматически заказывает салат на доставку каждый вторник вечером, не требуя постоянного вмешательства пользователя.
Amazon демонстрирует свое видение масштабируемых и умных агентов ИИ
Одной из выдающихся особенностей нового акта является его способность передавать понимание своего пользовательского интерфейса в новые среды с минимальным дополнительным обучением. Amazon поделился приложением, где новый акт отлично действовал в браузерах, хотя его обучение не включало опыт видеоигр. Эта адаптация ставит новый акт в качестве агента звания для различных приложений.
Эта способность уже используется в собственной экосистеме Amazon. В Alexa+новый акт позволяет самостоятельно направленную онлайн-навигацию для выполнения задач для пользователей, даже если доступ API недостаточно большой. Это представляет собой шаг к более умным помощникам искусственного интеллекта, которые могут работать самостоятельно, используя свои навыки более динамичными способами.
Amazon очевидно, что новый акт представляет собой первый этап на более крупной миссии по созданию умных, надежных агентов искусственного интеллекта, способных выполнять все более сложные многоэтапные задачи.
Расширяясь за пределы простых инструкций, Amazon сосредоточено на тренировочных агентах путем укрепления обучения через различные, реальные сцены вместо слишком упрощенных проявлений. Эта фундаментальная модель служит контрольной точкой в долгосрочной учебной программе для новых моделей, что указывает на амбиции компании по ремонту ландшафта агента искусственного интеллекта.
«Наиболее ценные варианты использования для агентов все еще построены», – отметил Амазон. «Лучшие разработчики и дизайнеры узнают их. Это исследование предварительного просмотра нашего нового ACT SDK позволяет нам повторяться вместе с этими строителями с помощью быстрых прототипов и итеративной обратной связи».
Новое действие – это шаг к тому, чтобы стать агентами ИИ, действительно полезными для сложных цифровых задач. Переосмысливая ссылки на акцент на надежности, ее философия проекта сосредоточена на разрешении разработчиков выходить за рамки того, что возможно с помощью инструментов текущего поколения.
Смотрите также: Antropic дает представление о «ай -биологии» Клода
Вы хотите узнать больше об искусственном интеллекте и больших данных промышленными лидерами? Посмотреть AI & Big Data Expo, проходящую в Амстердаме, Калифорнии и Лондоне. Комплексное мероприятие связано с другими основными событиями, включая Smart Automatic Conference, Blockx, неделю цифровой трансформации и кибербезопасность и Cloud Expo.
Исследуйте другие предстоящие корпоративные технологические мероприятия и веб -страницы, управляемые Techforge здесь.