DeepSeek v3-0324 Beats Beats конкурирующие модели искусственного интеллекта в первую очередь в открытом исходном коде

DeepSeek V3-0324 стал самой высокой оценкой безрассудной модели по индексу искусственного аналитического интеллекта в достоверном достижении AI с открытым исходным кодом.

Новая модель предшествовала семи точкам в ссылке на превышение проприетарных коллег, таких как Gemini 2.0 Pro, Claude 3.7 Sonnet’s Sonnet и Lama 3.3 70b Meta.

Во время просмотров V3-0324 моделей рассуждения, в том числе предложения Deepseek’s собственные R1 и Openai и Alibaba, достижение подчеркивает растущую осуществимость решений с открытым исходным кодом в приложениях, чувствительных к задержке, где непосредственные ответы являются критическими.

DeepSeek V3-0324 представляет новую эру для AI с открытым исходным кодом

Нерезонансные модели, которые генерируют ответы мгновенно без бредового «мышления»,-это необходимы для вариантов использования в реальном времени, таких как Talkboots, автоматизация обслуживания клиентов и живой перевод. Последняя итерация DeepSeek в настоящее время устанавливает стандарт для этих приложений, затмевая даже основные проприетарные инструменты.

«Это первый раз, когда открытая модель является основной нереализацией, важнейшей для открытого исходного кода»,-заявляет искусственный анализ. Производительность модели идет ближе к моделям проприетарных рассуждений, хотя последняя остается превосходящей задачи, требующие сложного решения проблем.

DeepSeek V3-0324 сохраняет большинство спецификаций своего предшественника декабря 2024 года, включая:

  • Контекстное окно 128K (шляпа в 64 тыс. На DeepSeek API)
  • 671 млрд. Общих параметров, нуждающихся в более чем 700 ГБ воспоминаний графического процессора для FP8
  • 37 миллиардов активных параметров
  • Функциональность только для текста (без мультимодальной поддержки)
  • MIT -Lisense

“Вы еще не можете бежать домой!” Искусственный анализ тихий, подчеркивая его корпоративные требования к инфраструктуре.

ИИ с открытым исходным кодом приносит тепло

В то время как проприетарные модели рассуждений, такие как DeepSeek R1, продолжают доминировать в более широком интеллектуальном индексе, разрыв сужается.

Три месяца назад DeepSeek V3 почти соответствовал проприетарным моделям Antropic и Google, но больше не превышал их. Сегодня обновленный V3-0324 не только лидирует с открытым исходным кодом, но и превышает всех своих собственных нерезонансных конкурентов.

«Это издание, вероятно, даже более впечатляющее, чем R1», – говорит искусственный анализ.

Прогресс DeepSeek сигнализирует об изменении в секторе ИИ, где рамы с открытым исходным кодом все чаще конкурируют с закрытыми системами. Для разработчиков и предприятий MIT-лицензированный V3-0324 предлагает мощный, адаптируемый Ilo-Quenty, его затраты на компьютер могут ограничить доступность.

«В настоящее время DeepSeek путешествует по пределу нерезонансных открытых тяжелых моделей»,-говорится в искусственном анализе.

С R2 на горизонте сообщество ожидает еще одного возможного прыжка в деятельности ИИ.

(Фото Пола Ханаока)

Смотрите также: Объятие лица вызовов вызовы с открытым исходным кодом на плане действий искусственного интеллекта

Вы хотите узнать больше об искусственном интеллекте и больших данных промышленными лидерами? Посмотреть AI & Big Data Expo, проходящую в Амстердаме, Калифорнии и Лондоне. Комплексное мероприятие связано с другими основными событиями, включая Smart Automatic Conference, Blockx, неделю цифровой трансформации и кибербезопасность и Cloud Expo.

Исследуйте другие предстоящие корпоративные технологические мероприятия и веб -страницы, управляемые Techforge здесь.

Source link

Scroll to Top