У AI по -прежнему есть галлюцинаторная проблема: как MongoDB стремится решить его с помощью расширенных зарежментов и вставить модели


Присоединяйтесь к нашим ежедневным и еженедельным информационным бюллетеням для последних обновлений и эксклюзивного контента в индустрии AI-лидирования. Узнать больше


Чтобы получить наилучший возможный результат запроса ИИ, организациям нужны наилучшие возможные данные.

Ответ, что многие организации должны были превзойти эту проблему,-это восстановленное поколение (RAG). С RAG результаты основаны на данных базы данных. Поскольку это результаты, однако, не все тряпки одинаковы, и фактически оптимизировать базу данных для наилучших возможных результатов может быть трудным.

Продавец базы данных MongoDB не является странным для мира ИИ или тряпки. Та же самая база данных компании уже используется для RAG, и MongoDB также запустила инициативы по разработке применения ИИ. В то время как компания и ее пользователи – такой медицинский гигант Novo Nordisk – добились успеха в Gen AI, еще предстоит сделать еще больше.

В частности, галлюцинация и точность по -прежнему являются проблемой, которая удерживает некоторые организации от получения Gen AI в производстве. С этой целью MongoDB сегодня объявил о приобретении частного AI Voyage AI, который разрабатывает современные модели введения и восстановления. В октябре 2024 года Voyage собрало 20 миллионов долларов в круге, поддерживаемом облачным гигантом данных снегопада. Это приобретение принесет экспертизу AI Voyage в вставке генерации и реагирования критических компонентов для AI-оперативного поиска и восстановления прямо в платформу баз данных MongoDB.

“За последний год, и особенно после того, как организации пытались подумать о том, как они могут создавать приложения с помощью ИИ, становится все более ясно, что качество и уверенность в приложениях, которые они строят, или отсутствие их стало одним из Барьеры для применения ИИ к варианту критического использования миссии », – сказал VentureBeat Mongoodb CPO Sahir Azam.

Каковы проблемы галлюцинации? Разве тряпка их не решает?

Основная идея, лежащая в основе Rag, заключается в том, что вместо того, чтобы просто полагаться на знания -базу обученных данных, двигатель Gen AI может основывать данные из базы данных.

Создание очень точной тряпки довольно сложно, и все еще существует возможный риск для галлюцинаций – задача, с которой сталкиваются Mongodb и его пользователи. В то время как Азам отказался дать какой -либо конкретный пример или инцидент, когда Rag AI Rag не удалось пользователю, он понял, что точность всегда обеспокоена.

Повышение точности и уменьшение галлюцинации включает в себя несколько этапов. Первое – улучшить качество восстановления («R» в RAG).

«Во многих случаях качества восстановления недостаточно», – сказал VentureBeat Тенгю, основатель и генеральный директор Voyage AI. «На этапе восстановления, если они не поднимают соответствующую информацию, то восстановление не очень полезно, а отличная языковая модель (LLM) галлюцинает, потому что оно должно угадать некоторый контекст».

Модели AI Voyage теперь являются частью MongoDB, помогает улучшить тряпку несколькими ключевыми способами:

  • Специфичные для домена модели и повторные оранжеры: Они обучаются большим количествам неструктурированных данных из конкретных вертикалей, что позволяет им лучше понять терминологию и семантику этих областей.
  • Персонализация и хорошо -будьте: Пользователи могут установить устройство восстановления для уникальных баз данных и использования вариантов.

Соревнование Mongodb

MongoDB не является первым или единственным продавцом, который признает необходимость и ценность, чтобы иметь высоко оптимизированную вставку и повторную технологию. В конце концов, это одна из причин, по которой снегопад инвестировал в AI Voyage и использует модели компании.

Важно отметить, что даже после приобретения MongoDB модели Voyage AI все еще будут доступны для снегопадов и других пользователей AI Voyage. Большая разница в том, что AI Voyage теперь будет все более и более интегрирован в платформы баз данных MongoDB.

Непосредственная интеграция входных моделей высокого уровня в базу данных является подходом других поставщиков базы данных. Еще в июне 2024 года DataStax анонсировала свою собственную технологию RagStack, которая объединяет современные модели введения и восстановления.

Азам утверждал, что MongoDB немного отличается. С одной стороны, это оперативная база данных, в отличие от аналитической базы данных. Кроме того, в отличие от лишь предоставления понимания и анализа, MongoDB помогает мощным транзакциям и реальным операциям. MongoDB также является тем, что известно как «база данных модели документов», которая имеет другую структуру, чем традиционная связанная база данных. Эта структура не зависит от столбцов и таблиц, которые не очень хороши для представления информации о неструктурированных данных (критический элемент для приложений ИИ).

«Мы являемся единственной технологией базы данных, которая сочетает в себе управление метаданными клиентами, операциями и транзакциями, что является сердцебиением того, что происходит в бизнесе, а также основание для восстановления – все с одной системой», – сказал Азам.

Почему AI Voyage важна для рабочих процессов AI AI

Необходимость в очень точных моделях вставки и восстановления дополнительно ускоряется с помощью действенного ИИ.

«Агентом ИИ по -прежнему нужны методы восстановления, потому что агент не может принимать решения вне контекста», – сказал Ма. «Иногда на самом деле несколько компонентов восстановления используются даже в одном решении».

MA отметил, что AI Voyage AI в настоящее время работает над конкретными моделями, которые высоко настроены для вариантов использования агента. Он объяснил, что действенный ИИ может использовать различные типы вопросов, которые все еще могут извлечь выгоду из большей оптимизации.

Поскольку Gen AI все больше и больше движется в оперативных случаях использования, необходимость устранения риска галлюцинаций явно наиболее важна. В то время как MongoDB был успешным с Gen AI, Azam ожидает интеграции Voyage AI, чтобы открыть новые варианты критического использования миссии.

«Если мы сможем сказать сейчас:« Он, мы можем дать вам достоверную точность 90% для ваших приложений, что сегодня может, в некоторых случаях, достичь 30 или 60% точности для результатов », открытие расширяется. Типы возможностей, которые люди могут применять ИИ в своих программных приложениях », – сказал Азам.


Source link
Scroll to Top