Google запускает бесплатный агент по науке о данных с бесконечным операцией на своей платформе Python Colab Python


Присоединяйтесь к нашим ежедневным и еженедельным информационным бюллетеням для последних обновлений и эксклюзивного контента в индустрии AI-лидирования. Узнать больше


ИИ -агенты -все это бестселлера, но, как конкретно сфокусировано на анализе, упорядочении и извлечении выводов из обширных объемов данных?

Научный агент Google Data делает именно это: новый, бесплатный AI-помощник по ИИ с Gemini 2.0, который автоматизирует анализ данных, теперь доступен пользователям в возрасте 18 лет в отдельных странах и языках бесплатно.

Помощник доступен через Google Colab, восьмилетнюю услугу компании по эксплуатации кода Python Live в единицах обработки графики OPOP (графические процессоры), принадлежащие поисковому гиганту и их собственные внутренние тензоры (TPU).

Первоначально запущенный для доверенных тестеров в декабре 2024 года, научный агент данных предназначен для того, чтобы помочь исследователям, ученым и разработчикам данных и разработчикам рационализировать свои рабочие процессы, генерируя все функционирующие юбки из описаний естественного языка, все в браузере пользователя.

Это расширение соответствует текущим усилиям Google по интеграции научной функции кодирования и данных, основанных на ИИ, на основе прошлых обновлений в качестве помощи кодирования ИИ с кодированием, объявленной в мае 2023 года.

Он также выступает в качестве своего рода продвинутой и поздней радости для Advanced Data Analy Analy of Openai (ранее интерпретатор кода), который теперь встроен в CHATGPT при запуске GPT-4.

Что такое Google Colab?

Google Colab (Short для коллеги)-это облачная среда доски Jupyter, которая позволяет пользователям писать и выполнять код Python непосредственно в своем браузере.

Notebook Jupyter-это веб-приложение с открытым исходным кодом, которое позволяет пользователям создавать и обмениваться документами, содержащими живой код, уравнения, изображения и повествовательный текст. Первоначально из проекта IPTHON в 2014 году, теперь он поддерживает более 40 языков программирования, включая Python, R и Julia. Эта интерактивная платформа широко используется в науке о данных, исследованиях и образовании для таких задач, как анализ данных, рендеринг и преподавание концепций программного обеспечения.

С момента запуска в 2017 году Google Colab стал одной из наиболее широко используемых платформ для науки и образования данных и образования в области машинного обучения.

Как и Ори Абрамовский, руководства по науке о данных на Spectralops.io, подробно описанные в отличной середине 2023 года, простота использования Colab и бесплатный доступ к графическим процессорам и TPU делает его выдающимся вариантом для многих разработчиков и исследователей.

Он отметил, что низкий барьер для входа, сшивая интеграция с Google Drive и поддержка TPU позволила своей команде радикально сократить учебные циклы во время работы над моделями ИИ.

Тем не менее, Абрамовский также указал на пределы Колаба, как:

  • Сессионные ограничения (особенно для бесплатных пользователей).
  • Непредсказуемый ресурс Время вверху.
  • Отсутствие критических особенностейв качестве эффективного трубопровода и передового программирования.
  • Поддержать проблемыПотому что Google предоставляет ограниченные параметры для прямой помощи.

Несмотря на эти недостатки, Абрамовский подчеркнул, что Colab остается одним из лучших доступных решений для обслуживания, особенно на ранних стадиях ML и проектов анализа данных.

Упрощение анализа данных с помощью ИИ

Научный агент Data основан на ноутбуке Colab Server, удаляющей необходимость в ручном макете.

Используя ИИ Google Gemini, пользователи могут описать свои аналитические цели на простом английском (“Тенденции отображения” «Обучить прогностическую модель», «Чистые недостающие значения»), а агент генерирует все исполнительные булыжники в ответ.

Он поддерживает пользователей с:

  • Авто -анализ: Генерирует полные рабочие записные книжки вместо изолированных фрагментов кодирования.
  • Сэкономить время: Удаляет ручной макет и повторение кодирования.
  • Улучшение сотрудничества: Особенности встроенные функции совместного использования для командных проектов.
  • Предлагая модифицируемые решения: Пользователи могут настраивать и устанавливать сгенерированный код.

Агент по науке о данных уже ускоряет реальные научные исследования

По данным Google, ранние тестеры сообщили о значительной экономии от времени при использовании научного агента данных.

Например, ученый из Национальной лаборатории Лоуренса Беркли, работая над выбросами тропических водно -болотных угодий, подсчитал, что их обработка времени -даты снизилась с одной недели до пяти минут, используя агента.

Инструмент также хорошо показал промышленные ссылки, заняв 4-е место в Dabstep: Справочник по данным для многоэтапных рассуждений по обнимающему лицу, прежде чем агенты AI, такие как React (GPT-4.0), Deepseek, Claude 3.5 Haiku и Llam 3.3 70b.

Тем не менее, конкурент O3-Mini Operai O3-Mini, а также Claude 3.5 Antropic Soneto, оба превысили нового агента по науке о данных Близнецов.

Начинающий

Пользователи могут начать использование агента по науке о данных в Google Colab после этих шагов:

  1. Откройте новую колабиюПолем
  2. Загрузите базу данных (CSV, JSON и т. Д.).
  3. Опишите анализ на естественном языке Используя боковую панель Близнецов.
  4. Выполнить сгенерированную ноутбук Смотрите понимание и изображения.

Google предоставляет образцы данных и быстрые идеи, чтобы помочь пользователям исследовать свои возможности, в том числе:

  • Запрос от переполнения стека: «Покажите самые популярные языки программирования».
  • База данных видов радужной оболочки: «Считайте и посмотрите корреляции Пирсона, Спирмена и Кендалла».
  • База данных классификации стекла: «Тренируйте повседневный лесной классификатор».

Всякий раз, когда пользователь хочет использовать нового агента, ему придется перейти в Colab и нажимать на «Файл», а затем «Новая ноутбук на дисков», и полученный ноутбук будет храниться в их учетной записи Google Drive.

Мое собственное короткое демо -было более смешанным

Конечно, я с низкой техникой, а не ученый для данных, но мое собственное использование нового научного агента Data Data Data Data Data Data Data Data в Колабе до сих пор было меньше, чем сшито.

Я загрузил пять файлов CSV (разделенные запяты “Сколько я трачу каждый месяц и четверть на свои коммунальные услуги?”Полем

Агент продвинулся и выполнил следующие операции:

  • Объединенные базы данныхДата манипуляции и счета -Несовершеннолетние несоответствия.
  • Просочился и очистил данныеобеспечение только соответствующих расходов.
  • Сгруппированные транзакции Месяц назад и четвертый для расчета расходов.
  • Сгенерированные изображениякак линейные буквы для тренда -нализ.
  • Суммированные результаты В ясном, структурированном отчете.

До выполнения Колаб вызвал подтверждение, напомнив мне, что оно может взаимодействовать с внешними API.

Он сделал все это очень быстро и плавно в браузере, за несколько секунд. И было впечатляюще наблюдать, как он работал с анализом и программированием с видимым шагом -шагом описания того, что он сделал.

Тем не менее, в конечном итоге он сгенерировал неправильный график, показывающий только полезные расходы на месяц, неспособность признать листы включали ценность на весь год, разбитый на месяцы. Когда я попросил, чтобы это просмотрел, он сыграл, но в конечном итоге не смог создать правильную цепочку кода, чтобы ответить на мое обещание.

Я пытался с нуля с той же подсказкой на новой ноутбуке в Google Colab, и он дал гораздо лучший, но все же странный результат.

Мне придется попробовать проблемы с этим немного больше, и, как я уже сказал, начальный результат ошибки может быть связан с моим собственным отсутствием опыта с помощью научных инструментов данных.

Цены на булыжники и функции искусственного интеллекта

В то время как Google Colab остается бесплатным, пользователи, которым нужна дополнительная компьютерная питание, могут перейти на платные планы:

  • Colab Pro ($ 9,99 в месяц): 100 компьютерных единиц, более быстрые графические процессоры, больше памяти, окончательный доступ.
  • Colab Pro+ (49,99 долл. США в месяц): 500 Компьютерных единиц, приоритетные обновления графических процессоров, выполнение фона.
  • Колаб Энтерпрайз: Google Cloud Integration, генерация кодов на основе AI.
  • Зарплата как-ты: 9,99 долл. США за 100 компьютерных единиц, 49,99 долл. США за 500 компьютерных единиц.

В дополнение к научному агенту данных Google расширил возможности ИИ в Колаба.

Google собирает обещания, сгенерированные коды и используя обратную связь для улучшения его моделей ИИ. Хотя данные хранятся до 18 месяцев, они анонимны, и запросы на удаление не всегда могут выполняться. Пользователи советуют не отправлять конфиденциальную или личную информацию, потому что рецензенты могут обрабатывать обещания. Кроме того, сгенерированный AI код должен быть тщательно просмотрен, поскольку он может содержать ошибки.

Добро пожаловать

Google призывает пользователей предоставлять отзывы через сообщество Google Labs на канале #Data Science Agent.

Поскольку AI-управляемая автоматизацией становится ключевой тенденцией в науке о данных, научный агент Google Data в Колабе может помочь исследователям и разработчикам сосредоточиться больше на понимании и меньше на макете кодирования. По мере того, как инструмент расширяется до большего количества пользователей и регионов, будет интересно посмотреть, как он формирует будущее анализа, связанного с AI-A-Assist.


Source link
Scroll to Top