New Age для умных агентов и кодировки ИИ

Antropic раскрыл свое новейшее семейство Claude 4 Model, и это выглядит как прыжок для любого здания, следующего помощниками или кодирования. Звезды шоу – Claude Opus 4, новая электростанция и Claude Sonnet 4, предназначенные для того, чтобы быть интеллектуальными всевозможными.

Antropic не боится своих амбиций, утверждая, что эти модели ориентированы на «продвижение стратегий наших клиентов по всем направлениям». Они позиционируют Opus 4 в качестве инструмента «раздвигать границы в кодировании, исследованиях, письме и научном открытии», в то время как Sonnet 4 объявляется как «мгновенное обновление сонета 3.7», готовое привлечь «пограничные результаты на события ежедневного использования».

Claude Opus 4: Новый чемпион по кодированию

Когда Antropic называет Claude Opus 4 своей «самой мощной моделью и лучшей моделью кодирования в мире», вы сидите и замечаете. И у них есть цифры, чтобы поддержать его, причем Opus 4 превышает навыки основных промышленных испытаний, достигнув 72,5% на SWE-Bench и 43,2% на терминале.

Но это не только о быстрых источниках. Opus 4 построен для длинной кожи, предназначенной для «постоянной работы в долгосрочных задачах, которые требуют фокусировки и тысяч шагов». Представьте, что ИИ, который может «работать постоянно в течение нескольких часов» – вот что утверждает Антропал.

Это должно быть массовым шагом от предыдущих моделей сонета и может расширить то, чего могут достичь агенты ИИ, обрабатывая проблемы, которые требуют реальной настойчивости.

Claude Sonnet 4: для ежедневной ИИ и реальной работы

В то время как Opus 4 является чемпионом в супертяжелом весе, Claude Sonnet 4 формируется, чтобы стать Verseded Horse, обещая значительное повышение для огромного диапазона применений. Ранние отзывы от тех, у кого был хитрый блеск.

Например, Github «говорит, что Claude Sonnet 4 возникает в сценах действий» и поэтому впечатляет, что они «планируют представить его как базовую модель для нового агента кодирования в Github Copilot». Это сильное одобрение.

Технический комментатор Манус также впечатляет, подчеркивая его «улучшения в последующих сложных инструкциях, четкие рассуждения и эстетические результаты».

Позитивные вибрации продолжаются с Igent, который «сообщает Sonnet 4, выделяется при разработке автономных приложений с несколькими приложениями, а также существенно улучшено решающее решение и навигационную навигацию на основе кода с 20% до почти нуля». Это игровой обменник для рабочих процессов разработки.

SourceGraph одинаково оптимистичен, рассматривая модель как «существенный скачок в разработке программного обеспечения – оставаясь дольше, понимание проблем глубже и обеспечивает более элегантное качество кода».

Код дополнения видел «более высокие успешные ставки, большее количество хирургических кодов и более тщательную работу со сложными задачами», что привело к тому, что они сделают сонета 4 своим «лучшим выбором для своей основной модели».

Гибридная мода и разработчики приятны

Одним из действительно умных кусочков о семействе Claude 4 является его гибридный характер. Как Opus 4, так и Sonnet 4 могут работать на двух передачах: один для тех почти инстинктивных ответов, которые нам часто нужны, и другой, который позволяет «расширенное мышление для более глубоких рассуждений».

Это более глубокое мышление является частью планов для максимального, команды и предприятия Клода. Хорошие новости для всех, хотя Sonnet 4, завершенные с этим расширенным мышлением, также будут доступны для бесплатных пользователей, что является отличным шагом, чтобы сделать более высокий ИИ более доступным.

Antropic также разрабатывает некоторые восхитительные новые инструменты для разработчиков в своем API, четко направленные на то, чтобы перегрузить создание более сложных агентов ИИ:

  • Инструмент кода выполнения: это позволяет моделям фактически управлять кодом, открывая все виды возможностей для интерактивных и проблем для решения проблем.
  • Connector MCP: представлен Antropa, MCP Стандарты контекстуального обмена между помощниками ИИ и программными средами.
  • API Files: Это позволит ИИ легко работать напрямую с файлами, что является большой вещью для многих реальных задач.
  • Обратное кэширование: разработчики смогут кэшировать до одного часа. Это может звучать мало, но это может иметь реальное значение для скорости и эффективности, особенно для часто используемых консультаций.

Ведущий пакет в реальной деятельности

Antropic стремится подчеркнуть, что его «модели Claude 4 приводят к Swe-Bench Controlsed, ссылку на действие по фактическим задачам разработки программного обеспечения». Помимо кодирования, они подчеркивают, что эти модели «обеспечивают сильную производительность посредством кодирования, рассуждений, мультимодальных возможностей и задач действия».

Несмотря на прыжки в качестве, Antropic удерживает линию ценообразования. Claude Opus 4 вернется вам в 15 долларов США за миллион токенов и 75 долларов США за миллион токенов. Claude Sonnet 4, более доступный вариант, составляет 3 долл. США за миллион токенов и 15 долл. США за миллион токенов. Эта последовательность будет приветствовать существующих пользователей.

И Claude Opus 4, и Sonnet 4 готовы пойти с API API, и они также появляются на коренной породе Amazon и вертикальном AI от Google Cloud. Эта широкая доступность означает, что компании и разработчики по всему миру могут довольно легко начать экспериментировать и интегрировать эти новые инструменты.

Antropic явно удваивается, чтобы сделать ИИ более способным, особенно в сложных царствах кодирования и автономного агента. С этими новыми моделями и разработчиками потенциал для инноваций недавно получил серьезное ускорение.

(Изображение предоставлено: антропический)

Смотрите также: Детали утечка со страницы Амбициозной Openai Джони Айв

Вы хотите узнать больше об искусственном интеллекте и больших данных промышленными лидерами? Посмотреть AI & Big Data Expo, проходящую в Амстердаме, Калифорнии и Лондоне. Комплексное мероприятие связано с другими основными событиями, включая Smart Automatic Conference, Blockx, неделю цифровой трансформации и кибербезопасность и Cloud Expo.

Исследуйте другие предстоящие корпоративные технологические мероприятия и веб -страницы, управляемые Techforge здесь.

Source link

Scroll to Top