LG Exaone Deep – это математика, наука и кодирование

LG AI Research выявила Exaone Deep, модель рассуждений, которая выделяется в сложной решении проблем математики, науки и кодирования.

Компания подчеркнула глобальную задачу в создании моделей передовых рассуждений, отметив, что в настоящее время только несколько организаций с фундаментальными моделями активно занимаются этой сложной областью. Exaone Deep стремится непосредственно конкурировать с этими основными моделями, демонстрируя конкурентный уровень способности рассуждения.

LG AI -Research сосредоточил свои усилия, чтобы кардинально улучшить навыки рассуждений Exaone Deep в основных областях. Модель также показывает сильную способность понимать и применять знания через более широкий спектр предметов.

Ссылки на действие, опубликованные LG AI Research, впечатляют:

  • Математика: Модель Deep 32B от Exaone превысила конкурентную модель, несмотря на то, что она составляла всего 5% от ее размера, в требовании математической ссылки. Кроме того, версии 7,8b и 2,4b достигли первого места во всех основных математических ссылках для своих соответствующих моделей.
  • Наука и кодирование: В этих областях модели Exaone Deep (7,8b и 2,4b) достигли верхней точки по всем основным ссылкам.
  • MMLU (массивное понимание многотаскального языка): Модель 32B достигла 83,0 на ссылку MMLU, что претензии LG AI -Research -это наилучшее показатели среди внутренних корейских моделей.

Способности модели Exaone Deep 32B уже получили международное признание.

Вскоре после его выпуска он был включен в список «замечательных моделей искусственного интеллекта» от американской некоммерческой исследовательской организации Epoch AI. Эти локации листинга глубоко изучают его предшественник Exaone 3.5, что делает LG единственным корейским объектом с моделями, представленными в этом престижном списке за последние два года.

Математическая неловкость

Exaone Deep продемонстрировала исключительные навыки математических рассуждений с помощью своих различных моделей (32B, 7,8B и 2,4B). В оценках, основанных на 2025 -м году -академический год математической программы, все три модели превысили глобальные модели рассуждений сопоставимых размеров.

Модель 32B достигла оценки 94,5 в общем тесте по математической компетенции и 90,0 в американском математическом экзамене США (AIME) 2024, квалификационном экзамене на Олимпийских играх США по математике.

В AIME 2025 модель 32B соответствовала производительности модели DeepSeek-R1-R1 больше 671B. Этот результат показывает эффективные навыки обучения и сильные логические рассуждения глубоко, особенно при решении сложных математических задач.

Меньшие модели 7,8b и 2,4b также достигли высших рейтингов в основных ссылках на световые и на вершине модели соответственно. Модель 7.8B выиграла 94,8 на ссылке Mathematics-500 и 59,6 на AIME 2025, в то время как модель 2,4B достигла точек 92,3 и 47,9 в тех же рейтингах.

Наука и превосходство кодирования

Exaone Deep также продемонстрировал замечательные навыки в профессиональных научных рассуждениях и программном кодировании.

Модель 32B выиграла 66,1 в тесте GPQA Diamond, который оценивает проблемы для решения проблем в области физики докторского уровня, химии и биологии. В оценке Livecodebench, которая измеряет способность кодирования, модель достигла 59,5 баллов, что указывает на его потенциал для передовых приложений в этих опытных доменах.

Модели 7.8b и 2.4b продолжали эту тенденцию сильной производительности, обеспечивая первое место в Diamond GPQA и LiveCodebench, ссылки в их категориях соответствующих размеров. Это достижение основано на успехе модели Exaone 3.5 2.4b, которая ранее возглавляла LLM, чтение объятия лиц в дивизии Edge.

Улучшенные общие знания

Помимо особых навыков рассуждений, Exaone Deep также оказался улучшенной активностью в общих знаниях.

Модель 32B достигла впечатляющей оценки 83,0 на ссылке MMLU, позиционируя ее в качестве ведущей модели дома в этой всеобъемлющей оценке. Это указывает на то, что улучшение рассуждений Exaone Deep выходит за рамки конкретных областей и способствует более широкому пониманию различных предметов.

LG AI Research считает, что рассуждения Exaone Deep представляют собой прыжок в будущее, когда ИИ может решать все более сложные проблемы и способствовать обогащению и упрощению жизни человека посредством непрерывных исследований и инноваций.

Смотрите также: Байду недооценивает конкурирующие модели ИИ с Эрни 4.5 и Эрни X1

Вы хотите узнать больше об искусственном интеллекте и больших данных промышленными лидерами? Посмотреть AI & Big Data Expo, проходящую в Амстердаме, Калифорнии и Лондоне. Комплексное событие связано с другими основными событиями, включая Smart Automatic Conference, Blockx, Цифровой неделе преобразования и кибербезопасность и Cloud Expo.

Исследуйте другие предстоящие корпоративные технологические мероприятия и веб -страницы, управляемые Techforge здесь.

Source link

Scroll to Top