Аналитики из чрезмерного аналитика: глубокие исследования LLMS Openai Daseing с тряпкой для автоматизации работы и замены рабочих мест


Присоединяйтесь к нашим ежедневным и еженедельным информационным бюллетеням для последних обновлений и эксклюзивного контента в индустрии AI-лидирования. Узнать больше


Бизнес -компании должны обратить внимание на глубокие исследования Openai. Он предоставляет мощный продукт, основанный на новых навыках, и настолько хорош, что может вывести много людей с работы.

Глубокие исследования находятся на краю растущей тенденции: интеграция больших языковых моделей (LLM) с поисковыми системами и другими инструментами для значительного расширения своих возможностей. (Как сообщалось, как сообщалось, например, XAI от Elon Musk выявил Grok 3, который претендует на схожие навыки, включая глубокий поисковый продукт. Однако еще слишком рано оценивать реальные результаты Grok 3, как и большинство подписчиков. На самом деле все еще не получила в свои руки.)

Deep Research’s Deep, выпущенное 3 февраля, требует профессиональной учетной записи OpenAI, стоимостью 200 долларов в месяц и в настоящее время доступно только для пользователей США. На сегодняшний день это ограничение может иметь ограниченную раннюю обратную связь от Global Developer -Compunity, которая обычно быстро разделяет новый прогресс AI.

В режиме глубоких исследований пользователи могут спросить основную модель O3 OpenAI. Результат? Отчет часто превосходит то, что производят человеческие аналитики, доставляется быстрее и на долю от стоимости.

Как работает глубокие исследования

Хотя глубокие исследования широко обсуждались, его более широкие последствия все еще должны зарегистрироваться полностью. Первоначальные реакции восхваляли его впечатляющие исследовательские навыки, несмотря на случайные галлюцинации в своих цитатах. Это был парень, который сказал, что использовал это, чтобы помочь своей жене, у которой рак молочной железы. Это обеспечило более глубокий анализ, чем то, что ее онкологи предоставили о том, как лучевая терапия была правильным курсом эффективности, сказал он. Согласие, обобщенное профессором AI Wharton Итаном Молликом, заключается в том, что его преимущества намного превышают случайные ошибки, поскольку фактический контроль занимает меньше времени, чем то, что ИИ вообще вообще. Это то, с чем я согласен, основываясь на моем собственном использовании.

Финансовые учреждения уже исследуют заявки. Например, BNY Mellon видит потенциал для использования глубоких исследований для кредитных рейтинговых ставок. Его влияние будет продлеваться через отрасли, от здравоохранения до розничной компании, производство и поставка управления струн – практически любую область, которая зависит от работы знаний.

Более умный исследовательский агент

В отличие от традиционных моделей искусственного интеллекта, которые пробуют ответы на один выстрел, Deep Research First задает объяснительные вопросы. Он может задать четыре или более вопросы, чтобы убедиться, что он точно понимает то, что вы хотите. Затем он разрабатывает структурированный план исследований, проводит несколько поисков, рассматривает свой план на основе новых пониманий и повторяется в цикле до тех пор, пока он не собирает полный отчет с форматом. Это может занять от нескольких с половиной часа. Отчеты варьируются от 1500 до 20 000 слов и обычно включают цитаты от 15 до 30 источников с правильными URL -адресами, по крайней мере, в моем использовании за последние полтора недели.

Технология, лежащая в основе глубоких исследований: рассуждения LLMS и агент Rag

Глубокие исследования делают это, объединяя две технологии так, как мы раньше не видели на массовом рынке.

Рассуждение LLMS: Первая-самая выгодная модель OpenAI, O3, которая ведет в логическом рассуждении и расширенных процессах размышлений цепи. Когда он был объявлен в декабре 2024 года, O3 выиграл беспрецедентные 87,5% на справочную справку Super Difficult Arc-Agi, предназначенную для проверки новых проблем для решения проблем. Интересно, что O3 не был выпущен в качестве автономной модели для использования разработчиками. Действительно, на прошлой неделе генеральный директор OpenAI Сэм Альтман объявил, что вместо этого модель будет завершена в «Объединенную интеллектуальную», которая присоединится к моделям с агентами, такими как поиск, агенты COD и многое другое. Глубокие исследования являются примером такого продукта. И хотя конкуренты, такие как Deepseek-R1, подошли к способностям O3 (одна из причин, по которой было так много волнения несколько недель назад), OpenaI все еще широко считается немного вперед.

Действие тряпка: Вторая, агентская тряпка, – это технология, которая длилась около года назад. Он использует агенты для автономного поиска информации и контекстов из других источников, включая поиск Интернета. Это может включать в себя другие агенты по вызову инструментов, чтобы найти информацию, не являющуюся сетью с API; Кодовые агенты, которые могут более эффективно выполнять сложные последовательности; и поиск в базе данных. Первоначально, глубокие исследования Openai в основном ищут открытый веб -сайт, но корпоративные боссы предположили, что с течением времени он сможет искать больше источников.

Конкурентный край Openai (и его пределы)

Хотя эти технологии не являются совершенно новыми, усовершенствования вещей с поддержкой OpenAI, такие как его прыжковой стартап на этих технологиях, массовое финансирование и модель разработки с замкнутым исходным кодом на новый уровень. Он может работать за закрытыми дверями и использовать обратную связь от более чем 300 миллионов активных пользователей популярного продукта CHATGPT OpenAI. OpenAI провел исследования в этих областях, например, о том, как сделать подтверждение шаг за шагом, чтобы получить лучшие результаты. И это явно внедрило поиск интересным образом, возможно, заимствовал у Bing и других технологий Microsoft.

Хотя он по -прежнему галлюцинирует некоторые результаты из своих поисков, он делает это меньше, чем конкуренты, возможно, отчасти потому, что сама модель нижней O3 установила низкую отрасль для этих галлюцинаций на 8%. И есть способы еще больше уменьшить ошибки, используя такие механизмы, как доверительные требования, цитируемые требования и другие сложные достоверные проверки.

В то же время есть ограничения на лидерство и способности Openai. В течение двух дней после запуска Deep Research Huggingface представила агента по исследованию ИИ с открытым исходным кодом под названием «Open Deep Research», который приобрел результаты, которые были не слишком далеко от Openai-подобных слияния основных моделей и свободно доступных действий. Есть несколько каналов. Открытые конкуренты, такие как DeepSeek, кажется, остаются близкими в области моделей рассуждений, и Microsoft Magentics-One предлагает структуру для большинства активных возможностей Openai, чтобы назвать всего два примера.

Кроме того, глубокие исследования имеют границы. Продукт действительно эффективен при изучении неясной информации, найденной в Интернете. Но в областях, где онлайн не так много и где доменная экспертиза в основном частная – будь то в главах народов или в частных базах данных – она ​​вообще не работает. Таким образом, это не будет угрожать рабочим местам высокоуровневых исследователей хедж-нижней, например, заплатить, чтобы поговорить с реальными экспертами в промышленности, чтобы выяснить, иначе очень сложная скучная информация, как утверждает Бен Томпсон на недавнем плакате (см. Графику ниже). В большинстве случаев глубокие исследования OpenAI будут влиять на более низкие рабочие места для анализа навыков.

Сначала ценность глубоких исследований увеличивается, когда информация в Интернете мало, а затем падает, когда она действительно мало. Источник: Стратезирование.

Самый умный продукт все еще

Когда вы объединяете топ -обоснование с действенным восстановлением, на самом деле не поражена, что вы получаете такой мощный продукт. Глубокие исследования Openai достигли 26,6% на последнем экзамене человечества, вероятно, лучшая ссылка для интеллекта. Это относительно новое ИИ -ссылка, предназначенное для того, чтобы быть самой сложной для любой модели ИИ, охватывающего 3000 вопросов по 100 различным темам. В этой ссылке глубокие исследования Openai значительно превышают глубокие исследования недоумения (20,5%) и более ранних моделей, таких как O3-Mini (13%) и Deepseek-R1 (9,4%), которые не были связаны с агентской тряпкой. Но ранние обзоры показывают, что Openai направляет как качество, так и глубину. Глубокое исследование Google по -прежнему необходимо протестировать с этой ссылки, но ранние обзоры показывают, что OpenaI возглавляет как качество, так и глубокое.

Поскольку это отличается: первый искусственный ИИ массового рынка, который мог бы перенести рабочие места

Что отличается от этого продукта, так это его потенциал для удаления заданий. Сэм Виттейн, соучредитель красного дракона и разработчик ИИ. Некоторые 4 лучших консалтинговых компаний, которые обойдется мне в 20 000 долларов. «Это, по его словам, приведет к некоторым реальным изменениям, в том числе может вывести людей с работы.

Кто возвращает меня к интервью на прошлой неделе с Сартаком Паттанаиком, руководителем инженерного искусства и искусственным интеллектом в BNY Mellon, крупном американском банке.

Безусловно, Паттанайк ничего не сказал о разведении продукта для реальной работы в его банке. Это будет особенно чувствительная тема, которую любой бизнес, вероятно, будет удален с публичной обработки. Но он сказал, что может увидеть глубокое использование Openai для отчетов о кредитной подписке и других «главных» действий, а также оказывает существенное влияние на различные рабочие места: «Теперь это не влияет на каждую работу, но это влияет на набор стратегии работы вокруг (и и ) Исследование, как администрирование продавца сравнения, сравнение продукта или с продуктом B. », добавил он:« Поэтому я думаю, что все, что больше о мышлении системы два – больше исследований, где это может быть Не имею правильного ответа, потому что правильный ответ может быть установлен после того, как вы получите определение этапа – я думаю, что это шанс.

Историческая перспектива: потеря труда и создание рабочих мест

Технологические революции в ближайшее время в долгосрочной перспективе в долгосрочной перемещении стали исторически перемещенными работниками. От автомобилей, заменяющих конные вагоны и до компьютеров, автоматизируя канцелярские работы, рынки вакансий развиваются. Новые возможности, созданные неодобрительными технологиями, имеют тенденцию создавать новую работу. Компании, которые не охватывают эти достижения, будут отставать от своих конкурентов.

Альтман Openai признал связь, даже если косвенная, между глубокими исследованиями и работой. На саммите ИИ в Париже на прошлой неделе его спросили о его видении искусственного общего интеллекта (ACT) или о стадии, на которой ИИ может выполнить практически любую задачу, которую может человек. Как он ответил, его первым упоминанием было глубокое исследование: «Это модель, которую, я думаю, может сделать как низкий процент всех задач в экономике мира сейчас, что является безумным утверждением, и год назад я Не думаю, что я думаю, что люди думали, что они придут. Он продолжил: «За 50 центов вычислений вы можете выполнять 500 или 5000 долларов США. Компании делают это, чтобы быть просто более эффективными».

Вывод: New Age для знания работы

Глубокие исследования представляют собой водный момент для ИИ в отраслях, основанных на знаниях. Благодаря интеграции наиболее выгодных рассуждений с автономными исследовательскими навыками, OpenAI создал умнее, более быстро и значительно более затрат, чем человеческие аналитики.

Последствия обширны, от финансовых услуг до здравоохранения до принятия решений предприятием. Организации, которые эффективно используют эту технологию, приобретут крупное конкурентное преимущество. Те, кто игнорирует это, делают это при их разрушении.

Для более глубокого обсуждения того, как работает глубокие исследования Openai и как оно реформирует знания, ознакомьтесь с моим тщательным разговором с Сэмом Виттевином в нашем последнем видео:

https://www.youtube.com/watch?v=3m3qcf_ptdc


Source link
Scroll to Top