Роботы прошли долгий путь со времен комнаты. Сегодня беспилотники начинают доставлять дверь к двери, автомобили с самостоятельным вождением навигают на некоторых дорогах, робо-доги помогают первым реагирующим, и еще больше ботов делают обратные флипсы и помогают на заводе. Тем не менее, Лука Карлоне думает, что лучшее еще впереди.
Карлоне, который недавно получил пребывание в качестве доцента в Департаменте аэронавтики и астронавтики MIT (Aeroastro), руководит Lab Spark, где он и его ученики преодолевают ключевой разрыв между людьми и роботами: восприятие. Группа проводит теоретические и экспериментальные исследования, все в том, чтобы расширить осознание робота о своей среде таким образом, чтобы подходить к человеческому восприятию. И восприятие, как часто говорит Карлон, это больше, чем обнаружение.
В то время как роботы выросли на скачках и границах с точки зрения их способности обнаруживать и выявлять объекты в своем окружении, им все еще есть чему поучиться, когда речь заходит о том, чтобы понять чувство окружающей среды более высокого уровня. Как люди, мы воспринимаем объекты с интуитивным чувством не только их форм и ярлыков, но и их физики – как их можно манипулировать и перемещать – и как они относятся друг к другу, их большую среду и самих себя.
Такое восприятие на уровне человека-это то, что Карлон и его группа надеются передать роботам, что позволит им безопасно и плавно взаимодействовать с людьми в своих домах, рабочих местах и других неструктурированных средах.
С момента присоединения к преподаванию MIT в 2017 году, Карлон привел свою команду в разработке и применении алгоритмов восприятия и понимания сцен Автомобили с самостоятельным вождением. Они также могут быть полезны для домашних роботов, которые следуют за командами естественного языка и потенциально предвидят потребности человека на основе контекстных подсказок более высокого уровня.
«Восприятие – это большое узкое место для получения роботов, чтобы помочь нам в реальном мире», – говорит Карлоне. «Если мы сможем добавить элементы познания и рассуждения к восприятию роботов, я считаю, что они могут сделать много хорошего».
Расширение горизонтов
Карлоне родился и вырос недалеко от Салерно, Италия, недалеко от живописного побережья Амальфи, где он был самым младшим из трех мальчиков. Его мать – учитель начальной школы в отставке, который преподавал математику, а его отец – профессор и издатель в отставке, который всегда использовал аналитический подход к своим историческим исследованиям. Братья, возможно, неосознанно приняли мышление своих родителей, так как все трое стали инженерами – старшие два преследовали электронику и машиностроение, в то время как Карлон приземлялся на робототехнике или мехатронике, как это было известно в то время.
Однако он не пришел на поле до конца обучения в бакалавриате. Карлон учился в Политехническом университете Туринского университета, где первоначально сосредоточился на теоретической работе, в частности, на теории управления – поле, которое применяет математику для разработки алгоритмов, которые автоматически контролируют поведение физических систем, таких как энергосистемы, самолеты, автомобили и роботы. Затем, в старшем курсе, Карлоне подписался на курс по робототехнике, который исследовал достижения в области манипуляций и как роботы могут быть запрограммированы на перемещение и функционирование.
«Это была любовь с первого взгляда. Использование алгоритмов и математики для развития мозга робота и заставления его движения и взаимодействия с окружающей средой является одним из самых полезных впечатлений », – говорит Карлон. «Я сразу решил, что это то, что я хочу сделать в жизни».
Он продолжил программу двойной степени в Политехническом университете Туринского университета и Политехническом университете Милана, где он получил степень магистра в области мехатроники и автоматизации, соответственно. В рамках этой программы, называемой Alta Scuola Politecnica, Карлоне также проходил курсы по управлению, в которых он и студенты из различных академических прошлогов должны были объединиться, чтобы концептуализировать, создавать и создавать маркетинговое поле для нового дизайна продукта. Команда Carlone разработала настольную лампу без ощущения, предназначенную для выполнения ручных команд пользователя. Проект заставил его думать о технике с разных точек зрения.
«Это было похоже на то, чтобы говорить на разных языках», – говорит он. «Это было раннее воздействие необходимости выйти за рамки инженерного пузыря и подумать о том, как создать техническую работу, которая может повлиять на реальный мир».
Следующее поколение
Карлон остался в Турине, чтобы получить докторскую степень в области мехатроники. В течение этого времени ему дали свободу выбора тезисной темы, которую он, как он вспоминает, «немного наивно».
«Я изучал тему, которую сообщество считало понятным, и для которой многие исследователи полагали, что больше нечего сказать». Карлон говорит. «Я недооценил, насколько основана эта тема, и подумал, что я все еще могу внести в нее что -то новое, и мне посчастливилось просто сделать это».
Рассматриваемой темой была «одновременная локализация и картирование», или SLAM – проблема генерации и обновления карты среды робота при одновременном отслеживании того, где находится робот в этой среде. Карлоне придумал способ переосмыслить проблему, так что алгоритмы могли генерировать более точные карты без необходимости начинать с первоначального предположения, как это делало большинство методов сжатия. Его работа помогла открыть поле, где большинство роботистов думали, что нельзя добиться большего, чем существующие алгоритмы.
«Slam – это выяснение геометрии вещей и того, как робот движется среди этих вещей», – говорит Карлоне. «Теперь я являюсь частью сообщества, спрашивающего, какое это следующее поколение шлема?»
В поисках ответа он занял позицию постдока в Georgia Tech, где он погрузился в кодирование и компьютерное зрение – поле, которое, оглядываясь, возможно, была вдохновлена кистью со слепотой: когда он заканчивал свою докторскую степень в Италии Он перенес медицинское осложнение, которое сильно повлияло на его зрение.
«В течение одного года я мог легко потерять глаз», – говорит Карлоне. «Это было то, что заставило меня задуматься о важности видения и искусственного видения».
Он смог получить хорошее медицинское обслуживание, и это состояние полностью разрешилось, так что он мог продолжить свою работу. В Georgia Tech его советник, Фрэнк Делларт, показал ему способы кодировать компьютерное зрение и сформулировать элегантные математические представления сложных трехмерных проблем. Его консультант также был одним из первых, кто разработал библиотеку Slam с открытым исходным кодом под названием GTSAM, которую Карлон быстро признал бесценным ресурсом. В более широком смысле он увидел, что обеспечение программного обеспечения доступным для всех разблокировало огромный потенциал для прогресса в робототехнике в целом.
«Исторически прогресс в Slam был очень медленным, потому что люди держали свои кодексы, и каждая группа должна была по существу начать с нуля», – говорит Карлон. «Затем начали появляться трубопроводы с открытым исходным кодом, и это изменил правила игры, который в значительной степени способствовал прогрессу, который мы видели за последние 10 лет».
Пространственный ай
Следуя Georgia Tech, Карлоне приехал в MIT в 2015 году в качестве постдока в лаборатории для информации и систем принятия решений (крышки). В течение этого времени он сотрудничал с Сертаком Караманом, профессором аэронавтики и астронавтики, в разработке программного обеспечения, чтобы помочь беспилотникам размером с ладонь ориентироваться в их окружении, используя очень небольшую борту. Год спустя он был повышен до исследователя, а затем в 2017 году Карлон занял должность факультета в Аэроастро.
«Одна вещь, в которую я влюбился в MIT, было то, что все решения обусловлены такими вопросами: каковы наши ценности? Какова наша миссия? Это никогда не касается низкоуровневого роста. Мотивация на самом деле о том, как улучшить общество », – говорит Карлоне. «Как мышление, это было очень освежающим».
Сегодня группа Карлона разрабатывает способы представления окружения робота, помимо характеристики их геометрической формы и семантики. Он использует модели глубокого обучения и больших языков для разработки алгоритмов, которые позволяют роботам воспринимать их окружающую среду через объектив более высокого уровня, так сказать. За последние шесть лет его лаборатория выпустила более 60 репозиториев с открытым исходным кодом, которые используются тысячами исследователей и практиков по всему миру. Большая часть его работы вписывается в более широкое, появляющееся поле, известное как «пространственный ИИ».
«Пространственный ИИ похож на удар по стероидам», – говорит Карлоне. «В двух словах, это связано с тем, что роботы думают и понимают мир, как это делают люди, способами, которые могут быть полезными».
Это огромное мероприятие, которое может иметь широкие последствия, с точки зрения обеспечения более интуитивно понятных, интерактивных роботов, чтобы помочь дома, на рабочем месте, на дорогах и в отдаленных и потенциально опасных районах. Карлоне говорит, что впереди будет много работы, чтобы приблизиться к тому, как люди воспринимают мир.
«У меня есть 2-летние дочери-близнецы, и я вижу, как они манипулируют предметами, с 10 разными игрушками, с легкостью проходить по загроможденным комнатам и быстро адаптироваться к новой среде. Восприятие робота еще не может соответствовать тому, что может сделать малыш », – говорит Карлоне. «Но у нас есть новые инструменты в арсенале. И будущее яркое ».