Присоединяйтесь к нашим ежедневным и еженедельным информационным бюллетеням для последних обновлений и эксклюзивного контента в индустрии AI-лидирования. Узнать больше
Модели ИИ действуют только как данные, используемые для их обучения или установки.
Тегинские данные были фундаментальным элементом машинного обучения (ML) и генерально ИИ для большей части их истории. Тегированные данные представляют собой информацию, помеченную для помощи моделям искусственного интеллекта понять контекст во время обучения.
В то время как предприятия участвуют в внедрении приложений искусственного интеллекта, скрытое узкое место часто не является технологией-это много месяцев процесса сбора, лечения и тегации данных, специфичных для доменов. Эта «ставка тега данных» заставила технических лидеров выбора между задержкой развертывания или принятием неоптимальных действий гендерных моделей.
DataBricks придерживается прямой цели в этом вызове.
На этой неделе компания выпустила новое исследование подхода под названием «Адаптивная оптимизация времени» (TAO). Основная идея подхода заключается в том, чтобы включить конфигурацию крупных языковых моделей корпоративного уровня (LLM), используя только входные данные, которые у компаний уже имеют этикетки, не должны достичь результатов, которые превышают традиционные настройки тысяч маркированных примеров. DataBricks начиналась как продавец платформы Lakehouse и в последние годы все чаще сосредоточен на ИИ. DataBricks получил MosaICML за 1,3 миллиарда долларов и постоянно носит инструменты, которые помогают разработчикам создаватьЯ применяю быстро. Исследовательская группа Mosaic в DataBricks разработала новый метод TAO.
«Получение тегов данных – это сложные, а плохие теги будут непосредственно привести к плохим результатам, именно поэтому Frontier Labs использует продавцов данных для покупки дорогих рекламируемых человеческих данных», – сказал VentureBeat, Брэндон Куй, подкрепление и старший исследователь в DataBricks. «Мы хотим встретить клиентов там, где они есть, теги были препятствием для корпоративного внедрения искусственного интеллекта, а с Дао – нет».
Технические инновации: как Tao Revenvent LLM
По своей сути, Дао меняет парадигму того, как разработчики олицетворяют модели для конкретных областей.
Вместо традиционного подхода контролируемого настройки, который требует парных входных примеров, TAO использует укрепление обучения и систематические исследования для улучшения моделей с использованием только образцов вопросов.
Технический конвейер использует четыре отдельных механизмы, работающих согласованно:
Generation Generation: Система принимает примеры не избранных входных примеров и генерирует несколько возможных ответов для каждого, используя расширенные технологии инженерных приглашений, которые исследуют пространство решения.
Предприятие, калиброванное моделирование вознаграждения: Сгенерированные ответы оцениваются по модели вознаграждения DataBricks (DBRM), которая специально создана для оценки эффективности корпоративных задач с акцентом на правильность.
Укрепление Оптимизация модели на основе обучения: Параметры модели затем оптимизируются путем усиления обучения, которое в основном учит Модель для генерации ответов с высокой оценкой непосредственно.
Непрерывные данные: В то время как пользователи взаимодействуют с развернутой системой, новые входные данные собираются автоматически, создавая контур самообучения без дополнительной маркировки человека.
Вычисления времени тестирования-это не новая идея. OpenAI использовал компьютер времени тестирования для разработки модели рассуждений O1, а DeepSeek применял аналогичные методы для обучения модели R1. Что отличает TAO от других компьютерных методов тестирования, так это то, что при использовании дополнительного компьютера во время обучения окончательная настроенная модель имеет такую же стоимость вывода, как и исходная модель. Это предлагает критическое преимущество для развертывания производства, где затраты на вывод масштабируют с помощью.
«Дао использует дополнительный компьютер только в рамках учебного процесса; он не увеличивает стоимость вывода модели после обучения», – пояснил CUI. «В долгосрочной перспективе мы думаем, что подходы TAO и время тестирования, такие как O1 и R1, будут дополнением, вы можете сделать оба».
Тесты раскрывают неожиданное преимущество производительности по сравнению с традиционной тонкой настройкой
Исследование DataBricks показывает, что TAO не только соответствует традиционной конфигурации-это превышает ее. В нескольких корпоративных ссылках DataBricks утверждают, что этот подход лучше, несмотря на значительно меньше человеческих усилий.
На FinanceBench (справочник по вопросам и ответам финансового документа) TAO улучшил производительность LAMA 3.1 8B на 24,7 процента и хромой 3,3 70B на 13,4 балла. Для генерации SQL, используя ссылку на Bird-SQL, адаптированный к диалекту данных DataBricks, TAO обеспечил улучшения 19,1 и 8,7 баллов соответственно.
В частности, Tao-Tuned Llama 3.3 70b приблизился к производительности GPT-4O и O3-Mini через эти эталонные модели, которые обычно стоят на 10-20x дороже для работы в производственных средах.
Это представляет убедительное ценностное предложение для технических лиц, принимающих решения: способность развернуть более мелкие, более доступные модели, которые действуют по сравнению с их превосходными эквивалентами задач, специфичных для домена, без традиционно требуемых комплексных затрат на этикетку.
Дао обеспечивает преимущество рынка времени для предприятий
В то время как TAO обеспечивает четкие выгоды затрат, позволяя использовать более мелкие, более эффективные модели, его наибольшая ценность может быть на рынке ускорения времени для ИИ инициатив.
«Мы думаем, что Тао экономит предприятиям что -то более ценное, чем деньги: это экономит их время», – подчеркнул CUI. «Получите отмеченные данные, как правило, требуют пересечения организационных границ, настройки новых процессов, привлечь экспертов на тему для выполнения маркировки и проверки качества. У предприятий нет месяцев для выравнивания нескольких бизнес -единиц только для прототипа одного из вариантов использования искусственного интеллекта».
Это сжатие -это время создает стратегическое преимущество. Например, компания по финансовым услугам, внедряющая решение для анализа контрактов, может начать развертываться и повторять, используя только выборки контрактов, вместо того, чтобы ждать юридических групп на маркировке тысяч документов. Аналогичным образом, организации здравоохранения могут улучшить клинические системы решающей поддержки, используя только медицинские вопросы, не требуя парного опыта.
«Наши исследователи проводят много времени на разговоры с нашими клиентами, понимая фактические проблемы, с которыми они сталкиваются, при создании систем ИИ и разрабатывая новые технологии для преодоления этих проблем», – сказал Куй. «Мы уже применяем TAO через многие корпоративные приложения и помогаем клиентам постоянно повторять и улучшать их модели».
Что это значит для тех, кто принимает технические решения
Для предприятий, стремящихся направлять внедрение искусственного интеллекта, TAO представляет возможную точку перегиба в том, как развертываются специализированные системы ИИ. Достижение высокого качества, специфичной для дома деятельность без обширных обозначенных баз данных Удаляет один из наиболее значительных барьеров для широко распространенной реализации ИИ.
Этот подход особенно приносит пользу организациям с богатыми собственными данными и конкретными доменными требованиями, но ограниченными ресурсами для ручной маркировки именно той позиции, в которой многие предприятия оказываются.
По мере того, как ИИ становится все более важным в конкурентном преимуществе, технологии, которые сжимают время от концепции к развертыванию, в то же время улучшение урожайности будут отделять боссов от задержек. Тао, кажется, может быть такой технологией, возможно, позволяет предприятиям выполнять специальные сборы с ИИ через несколько недель вместо месяцев или кварталов.
В настоящее время TAO доступен только на платформе DataBricks и находится в частном прогнозе.
Ежедневное понимание коммерческих вариантов использования с VB Daily
Если вы хотите произвести впечатление на своего босса, VB Daily прикрыл вас. Мы даем вам внутреннюю руку о том, что компании делают с генеративным ИИ, от регулирующих ходов до практических развертываний, так что вы можете поделиться пониманием максимальной рентабельности инвестиций.
Прочитайте нашу политику конфиденциальности
Спасибо за подписку. Посмотрите на дополнительную информацию VB здесь.
Произошла ошибка.

Source link