Anpropic объявил о выпуске своих языковых моделей следующего поколения: Claude Opus 4 и Клод Сонет 4Полем Обновление знаменует собой значительную техническую уточнение в семействе моделей Claude, особенно в областях, включающих структурированные мышления, разработка программного обеспечения и поведение автономного агента.
Этот выпуск не является еще одним переосмыслением, а сфокусированным улучшением – повышение повышения последовательности, интерпретации и производительности в сложных задачах. Благодаря расширенной обработке контекста, планированию длинного хоризона и более эффективными возможностями кодирования, эти модели отражают созревающий сдвиг в сторону функциональных систем универсали, которые могут обслуживать широкий спектр применений с высокой компетенцией.
Claude Opus 4: масштабирование расширенных рассуждений и понимания многопрофильного кода
Расположенный в качестве флагманской модели, Claude Opus 4 был сравнен как самая способная модель Anpropic на сегодняшний день. Разработанный для обработки сложных рабочих процессов рассуждений и сценариев разработки программного обеспечения, Opus 4 достиг:
- Точность 72,5% на тесте SWE-Benchкоторый проверяет модели против реального решения выпуска GitHub.
- 43,2% на терминалекоторый оценивает правильность в задачах генерации кодов на основе терминалов, требующих многоэтапного планирования.
Примечательным аспектом Claude Opus 4 является его агентское поведение в программных средах. В практическом тестировании модель смогла автономно поддерживать почти семь часов непрерывной генерации кода и выполнения задач. Это заметное улучшение от Opus Claude 3, которое ранее выполняло такие задачи менее чем за час.
Эти улучшения связаны с расширенным управлением памятью, более широким контекстом и более надежным внутренним циклом планирования. С точки зрения разработчика, Opus 4 снижает необходимость частых вмешательств и демонстрирует более высокую последовательность в обращении с краями в программных стеке.

Claude Sonnet 4: Сбалансированная модель для общих рассуждений и задач кода
Claude Sonnet 4 заменяет своего предшественника, Claude 3.5 Sonnet, на более стабильную и сбалансированную архитектуру, которая приносит улучшения как скорости, так и качества без значительных увеличения вычислительных затрат.
Сонет 4 оптимизирован для развертывания среднего масштаба, где компромиссы эффективности затрат имеют решающее значение. Несмотря на то, что он не соответствует потолке рассуждений Opus 4, он унаследовал многие архитектурные обновления-поддерживающая многопрофильную навигацию кода, промежуточное использование инструмента и структурированную обработку текста с улучшенной задержкой.
Он служит новой моделью по умолчанию для бесплатных пользователей на Claude.ai, а также доступен через API. Это делает Sonnet 4 практическим вариантом для легких инструментов разработки, пользовательских помощников и аналитических трубопроводов, требующих постоянных, но менее интенсивных модельных вызовов.
Архитектурные основные моменты: гибридные рассуждения и расширенное мышление
Обе модели включают Гибридные возможности рассужденийпредставляя два различных режима ответа:
- Быстрый режим для ответов с низкой задержкой, подходящими для коротких подсказок и разговорных задач.
- Расширенный режим мышления Для вычислений интенсивных задач, требующих более глубокого вывода, более длинных цепочек памяти или многообразительного агента.
Эта стратегия рассуждений с двумя режимами позволяет пользователям динамически распределять бюджеты вычислительных и задержек на основе сложности задач. Это особенно актуально в агентских рамках, где LLM должны сбалансировать быстрое время реакции с совещательным планированием.
Развертывание и интеграция
Claude Opus 4 и Sonnet 4 доступны через несколько облачных платформ:
- Клод API Антропа
- Amazon Bedrock
- Google Cloud Vertex AI
Эта кроссплатформенная доступность упрощает развертывание модели в различные корпоративные среды, поддерживая варианты использования, от автономных агентов до анализа кода, поддержки принятия решений и конвейеров по поиску генерации (RAG).
Заключение
Серия Claude 4 не вводит радикальные изменения конструкции, а вместо этого демонстрирует измеренные улучшения в надежности, интерпретации и обобщении задач. С Claude Opus 4, антропический позиционирует себя в верхнем уровне поставщиков моделей ИИ для рассуждения и автоматизации кодирования. Между тем, Claude Sonnet 4 предлагает технически обоснованную, экономичную точку входа для разработчиков и исследователей, работающих над приложениями AI в среднем масштабе.
Для инженерных групп, оценивающих LLMS для планирования с длинным контекстом, агентов программного обеспечения или структурированных рабочих процессов данных, модели Claude 4 представляют конкурентную, технически способную альтернативу.
Проверьте технические данные и начните сегодня на Claude, Claude Code или на платформе по вашему выборуПолем Весь кредит на это исследование направлено на исследователей этого проекта. Кроме того, не стесняйтесь следить за нами Twitter И не забудьте присоединиться к нашему 95K+ ML Subreddit и подписаться на Наша информационный бюллетеньПолем

ASIF Razzaq является генеральным директором Marktechpost Media Inc. как дальновидного предпринимателя и инженера, ASIF стремится использовать потенциал искусственного интеллекта для социального блага. Его последнее усилие-запуск медиа-платформы искусственного интеллекта, Marktechpost, которая выделяется благодаря глубокому освещению машинного обучения и новостей о глубоком обучении, которое является технически обоснованным и легко понятным для широкой аудитории. Платформа может похвастаться более чем 2 миллионами ежемесячных просмотров, иллюстрируя свою популярность среди зрителей.
