Помощь машинам понять визуальный контент с помощью ИИ | MIT News

Данные должны стимулировать каждое решение, которое делает современный бизнес. Но у большинства предприятий есть огромная слепая пятно: они не знают, что происходит в их визуальных данных.

Coactive работает, чтобы изменить это. Компания, основанная Коди Коулман ’13, Мэн ’15 и Уильям Гавирия Рохас ’13, создал платформу для искусственного интеллекта, которая может разобраться с такими данными, как изображения, аудио и видео, чтобы разблокировать новые идеи.

Платформа Coactive может мгновенно искать, организовать и анализировать неструктурированный визуальный контент, чтобы помочь предприятиям принимать более быстрые, лучшие решения.

«В первой революции больших данных предприятия стали лучше, получая ценность из своих структурированных данных», – говорит Коулман, ссылаясь на данные из таблиц и электронных таблиц. «Но теперь, примерно от 80 до 90 процентов данных в мире неструктурировано. В следующей главе больших данных компании должны будут обрабатывать такие данные, как изображения, видео и аудио в масштабе, а ИИ – ключевая часть разблокировки этой возможности».

Coactive уже работает с несколькими крупными компаниями из СМИ и розничной торговли, чтобы помочь им понять свой визуальный контент, не полагаясь на ручную сортировку и теги. Это помогает им быстрее получить правильный контент для пользователей, удалять явный контент со своих платформ и раскрыть, как конкретный контент влияет на поведение пользователей.

В более широком смысле, основатели считают, что Coactive служит примером того, как ИИ может дать людям возможность работать более эффективно и решать новые проблемы.

«Слово« Коактивное »означает работать вместе одновременно, и это наше грандиозное видение: помощь людям и машинах работать вместе», – говорит Коулман. «Мы считаем, что видение сейчас важнее, чем когда -либо, потому что ИИ может либо развести нас, либо собрать нас вместе. Мы хотим, чтобы он был агентом, который собирает нас вместе и дает людям новый набор сверхспособностей».

Предоставление компьютерам видения

Коулман встретил Гавирию Рохас летом перед первым годом программы MIT Interfhase Edge. Оба будут специализироваться в области электротехники и компьютерных наук и работают над тем, чтобы донести контент Opencoursware в мексиканские университеты в мексиканские университеты.

«Это был отличный пример предпринимательства», – вспоминает Коулман о проекте Opencoursware. «Это действительно дало возможность нести ответственность за бизнес и разработку программного обеспечения. Это заставило меня начать свой собственный небольшой веб-разработчик впоследствии и отправиться в путешествие основателя (курс MIT)».

Коулман сначала исследовал власть ИИ в MIT, работая в качестве исследователя выпускника в офисе цифрового обучения (ныне MIT Open Learning), где он использовал машинное обучение, чтобы изучить, как люди учатся на MITX, в котором проводятся огромные, открытые онлайн -курсы, созданные преподавателями MIT и преподавателями.

«Для меня было действительно удивительно, что вы могли бы демократизировать это трансформационное путешествие, которое я прошел в MIT с цифровым обучением – и что вы могли бы применить ИИ и машинное обучение для создания адаптивных систем, которые не только помогают нам понять, как люди учатся, но и доставлять более персонализированный опыт обучения людям во всем мире», – говорит Коулман из MITX. «Это был также первый раз, когда я должен был исследовать видеоконтент и применять ИИ».

После MIT Коулман пошел в Стэнфордский университет для своего доктора философии, где он работал над снижением барьеров для использования ИИ. Исследование привело его к работе с такими компаниями, как Pinterest и Meta по приложениям для искусственного интеллекта и машинного обучения.

«Вот где я смог увидеть за углом в будущем того, что люди хотели делать с ИИ и их содержанием», – вспоминает Коулман. «Я видел, как ведущие компании использовали ИИ для повышения ценности для бизнеса, и именно откуда появилась первоначальная искра для Coacte. Я подумал:« Что если мы создадим операционную систему корпоративного класса для контента и мультимодального искусственного интеллекта, чтобы сделать это легко? »

Тем временем Гавирия Рохас переехал в район залива в 2020 году и начал работать как Ученый из данных на eBay. В рамках шага ему нужна была помощь в перевозке своего дивана, а Коулман был счастливчиком, которого он позвонил.

«Во время поездки на машине мы поняли, что оба видели взрыв, происходящий вокруг данных и ИИ», – говорит Гавирия Рохас. «В MIT мы получили место в первом ряду для революции больших данных, и мы увидели, как люди изобретают технологии, чтобы разблокировать значение из этих данных в масштабе. Коди и я поняли, что у нас есть еще один порошок, который собирался взорваться с предприятиями, собирающими огромное количество данных, но на этот раз это были мультимодальные данные, такие как изображения, видео, аудио и текст. Не хватает технологии, чтобы разблокировать в масштабе.

Платформа, которую основатели продолжали строить – то, что Коулман описывает как «операционная система ИИ», – является модельной агностикой, что означает, что компания может поменять системы ИИ под капотом, поскольку модели продолжают улучшаться. Платформа Coactive включает в себя предварительные приложения, которые бизнес -клиенты могут использовать для выполнения таких вещей, как поиск через их контент, генерировать метаданные и проведение аналитики для извлечения понимания.

«До ИИ компьютеры будут видеть мир через байты, тогда как люди увидят мир через видение», – говорит Коулман. «Теперь с ИИ машины, наконец, могут увидеть мир, как и мы, и это приведет к размытию цифровых и физических миров».

Улучшение интерфейса человека-компьютера

База данных изображений Reuters предоставляет мировым журналистам миллионы фотографий. Перед контактом компания полагалась на журналистам вручную вводив теги с каждой фотографией, чтобы правильные изображения были отображаться, когда журналисты искали определенные предметы.

«Было невероятно медленно и дорого проходить все эти необработанные активы, поэтому люди просто не добавляли метки», – говорит Коулман. «Это означало, что когда вы искали вещи, были ограниченные результаты, даже если соответствующие фотографии были в базе данных».

Теперь, когда журналисты на веб -сайте Reuters выбирают «Включить поиск искусственного интеллекта», Coactive может поддерживать соответствующий контент на основе понимания своей системы ИИ деталей в каждом изображении и видео.

«Это значительно улучшает качество результатов для журналистов, что позволяет им рассказывать лучшие, более точные истории, чем когда -либо прежде», – говорит Коулман.

Reuters не одинока в борьбе за управление всем своим содержанием. Digital Asset Management является огромным компонентом многих медиа и розничных компаний, которые сегодня часто полагаются на вручную введенные метаданные для сортировки и поиска по этому контенту.

Другим популярным клиентом является фэндом, который является одной из крупнейших в мире платформ для информации о телешоу, видеоиграх и фильмах с более чем 300 миллионами активных пользователей в месяц. Фэндом использует Coactive для понимания визуальных данных в своих онлайн -сообществах и помогает удалить чрезмерный кровь и сексуализированный контент.

«Раньше для фэндома потребовалось от 24 до 48 часов, чтобы просмотреть каждый новый контент», – говорит Коулман. «Сейчас с Coactive они кодифицировали свои руководящие принципы сообщества и могут генерировать более тонкую информацию в среднем в 500 миллисекундах».

С каждым вариантом использования основатели считают, что он позволяет новой парадигме так, как люди работают с машинами.

«На протяжении всей истории взаимодействия человека с компьютером нам пришлось наклониться над клавиатурой и мышью, чтобы вводить информацию так, чтобы машины могли понять»,-говорит Коулман. «Теперь, впервые, мы можем просто говорить естественно, мы можем поделиться изображениями и видео с ИИ, и это может понять этот контент. Это фундаментальное изменение в том, как мы думаем о взаимодействиях с человеческим компьютером. Основное видение Coactive заключается в этом изменении, нам нужна новая операционная система и новый способ работы с контентом и ИИ».

Source link

Scroll to Top