В сегодняшнем цифровом ландшафте автоматизация взаимодействия с веб -контентом остается нюансированной задачей. Многие существующие решения являются ресурсными и адаптированы для узко определенных задач, что ограничивает их более широкую применимость. Разработчики часто сталкиваются с двойной проблемой баланса вычислительной эффективности с необходимостью в модели, которая может хорошо обобщать на разных веб -сайтах. Традиционным системам, в значительной степени зависящей от быстрого прогнозирования, часто не хватает рефлексивных рассуждений, необходимых для непредсказуемого характера веб-сред. Кроме того, проприетарные модели обычно ограничивают доступ к подробной внутренней работе, что затрудняет исследователям и практикующим лицам в сообществе с открытым исходным кодом для развития современных методов. Эти постоянные проблемы подчеркивают важность разработки инструмента автоматизации, который является как эффективным, так и доступным.
Конвергенция ввела Proxy Lite: Mini, открытая версия их уважаемого помощника по доверенности. Эта модель 1B параметров зрения предназначена для расширения сложных возможностей веб-автоматизации до сообщества с открытым исходным кодом. Вместо того, чтобы многообещать необычайные подвиги, Proxy Lite стремится предложить сбалансированный подход, который женится на эффективности с надежностью. Его архитектура основана на прочной основе, позволяя ему выполнять различные веб-задачи, не предъявляя тяжелых вычислительных требований.
Что делает Proxy Lite заметным, так это его прозрачный дизайн и подход к открытому весу. Это побуждает сообщество исследовать, изменять и улучшать свою структуру. Благодаря интегрированной системе для модели зрения (VLM) и браузера, Proxy Lite позволяет контролировать задачи браузера. Конфигурация модели поддерживает практические приложения, начиная от обычной извлечения данных до более сложных навигационных задач, при этом контролируя использование ресурсов.
Технические аспекты и их преимущества
По своей сути Proxy Lite использует модель параметров 3B, построенная на основе QWEN2,5-VL-3B-Instruct. Этот выбор отражает приверженность сбалансированию производительности с эффективностью. Модель использует трехфазный процесс для генерации ответов:
- Наблюдение: Модель сначала рассматривает текущее состояние веб -страницы – например, подтверждает, что наложение или баннер конфиденциальности был отклонен.
- Мысль: Затем методично определяет следующий курс действия, взвешивая различные возможности, основанные на контексте.
- Инструментальный звонок: Наконец, он выдает точную команду для выполнения выбранного действия в браузере.
Этот структурированный подход не только повышает надежность задач, но и облегчает способность модели обобщать различные типы веб -взаимодействий. Проиграв человеческие процессы рассуждений, Proxy Lite удается найти баланс между простотой и изысканностью. Более того, его проект поддерживает прямую интеграцию как в интерфейсы командной строки, так и приложения для потоковой связи, что делает развертывание доступным даже для тех, кто имеет скромные технические ресурсы.
Понимание производительности и практические оценки
Proxy Lite тщательно оценивался с использованием The Webvoyager Benchmark, полного набора задач, предназначенных для тестирования возможностей веб -автоматизации. Модель достигла общего балла 72,4%, что является сильным показателем производительности, учитывая его открытый природу. Подробная статистика производительности на различных веб -сайтах раскрывает его вдумчивый дизайн:
- AllRecipes: Достижение уровня успеха 87,8% со средним значением 10,3 обмена сообщениями, он демонстрирует эффективность в богатых контентом средах.
- Amazon: Уровень успеха в 70,0% здесь подчеркивает способность модели ориентироваться в более сложных, динамических платформах электронной коммерции.
- Примечательные громкие сайты: С показателями успеха в 80 -х годах на таких платформах, как Apple и GitHub, Proxy Lite постоянно демонстрирует надежное поведение на различных сайтах.
- Google Services: В то время как некоторые области, такие как рейсы Google, приносят более низкие показатели успеха, общая производительность остается конкурентной, учитывая объем модели.

Эти результаты отражают сбалансированную производительность: Proxy Lite эффективно управляет задачами без накладных расходов, обычно связанных с более крупными, проприетарными моделями. Комплексная оценка не только подчеркивает свою текущую полезность, но и указывает на потенциальные улучшения благодаря усовершенствованиям, управляемым сообществом.
Заключение
Proxy Lite появляется как вдумчиво разработанный инструмент в области веб -автоматизации. Решая ключевые проблемы, такие как ограничения ресурсов, обобщение и прозрачность, – это практическое решение для автоматизации рутинных онлайн -задач. Его подход с открытым весом и модульный дизайн приглашают сотрудничество и постоянную разработку, предоставляя ценный ресурс как для академических исследований, так и для коммерческих проектов.
Проверить Технические детали и модель здесь. Весь кредит на это исследование направлено на исследователей этого проекта. Кроме того, не стесняйтесь следить за нами Twitter И не забудьте присоединиться к нашему 80K+ ML SubredditПолем
🚨 Рекомендуемое чтение AI Research выпускает Nexus: расширенная система интеграции системы ИИ и стандартов соответствия данными для решения юридических проблем в наборах данных AI

ASIF Razzaq является генеральным директором Marktechpost Media Inc. как дальновидного предпринимателя и инженера, ASIF стремится использовать потенциал искусственного интеллекта для социального блага. Его последнее усилие-запуск медиа-платформы искусственного интеллекта, Marktechpost, которая выделяется благодаря глубокому освещению машинного обучения и новостей о глубоком обучении, которое является технически обоснованным и легко понятным для широкой аудитории. Платформа может похвастаться более чем 2 миллионами ежемесячных просмотров, иллюстрируя свою популярность среди зрителей.
🚨 Рекомендуемая платформа искусственного интеллекта с открытым исходным кодом: «Intellagent-это многоагентная структура с открытым исходным кодом для оценки сложной разговорной системы ИИ» (PROMOTED)