Изображение Алана Уорбертона / © BBC / Лучшие изображения AI / Medicine / Licensed By CC-BY 4.0
Таня Петерсен
Шарлотта Банн, руководитель отдела искусственного интеллекта EPFL в группе молекулярной медицины, разрабатывает алгоритмы ИИ, чтобы лучше понять невероятно сложные и высокоразмерные данные, которые представляют сотни слоев тканевых слоев и белковых маркеров в отдельной клетке. Журнал EPFL Размеры Поговорила с Шарлоттой Банн о своей работе на передовой ИИ в области медицины и биологии.
Не могли бы вы описать центр вашего исследования?
Мы разрабатываем диагностические инструменты для клиник, которые обучаются технологиями ИИ. Это включает в себя прогнозирование наилучшего лечения, которое должен получить пациент, пытаясь понять состояние заболевания, в котором находится пациент, и расшифровку важных биомаркеров или потенциальных целей лекарств, которые мы должны исследовать. Важно отметить, что молекулярный профиль и, следовательно, в конечном итоге связанный фенотип заболевания каждого пациента, является уникальным для каждого человека. Анонтная терапия к молекулярному профилю человека требует как измерений, которые отражают клеточные и молекулярные факторы, которые влияют на реакцию на лечение, а также мощные технологии ИИ, которые надежно предсказывают из соответствующих больших и высокоразмерных биомедицинских наборов биомедицинских наборов, происходящих из различных экспериментов.
И хотя мы видим эти невероятные достижения ИИ в зрении и языке, биологические данные очень разные: измерения являются косвенными, скрытыми, мультимодальными и представляют собой только снимки динамической системы по своей сути, которая регулирует лежащие в основе биологические процессы. Мы не можем просто применить технологии ИИ, которые разработаны для языка в области биологии, нам необходимо адаптировать архитектуры и алгоритмы обучения к тонкостям биологических данных и систем.
Хотя эти модели больших нейронных сети, которые мы разрабатываем, часто являются черными ящиками с точки зрения их прогнозов, мы должны спроектировать их таким образом, что мы, по крайней мере, понимаем, какие биологические факторы способствовали прогнозу. Это понимание имеет решающее значение для обнаружения биомаркеров и лекарственных целей, поскольку оно подчеркивает конкретные биологические механизмы и пути, связанные с болезнью, выявляя новые терапевтические возможности.
Расскажите мне немного о своем прошлом-как вы начали работать в этой действительно передовой области, как это вызвало ваш интерес?
Я начал рано! В 14 лет я участвовал в стипендиальной программе старших классов в немецком исследовании рака, и я был очарован, работая над синтетической биологией, областью, которая сочетает в себе инженерию, информатику и биотехнологию. С тех пор я был убежден, что только действительно междисциплинарные подходы позволит нам достичь наших целей. Теперь, в моей профессоре, я совместно связан со школой наук о жизни EPFL и школой компьютерных наук.
Будучи учеником средней школы, мы модифицировали простые бактериальные клетки, чтобы выполнить новую функцию: это позволило нам использовать их как маленькие маленькие машины в продукте. Теперь меня интересует, как мы можем разработать клетки человека, чтобы они обладали диагностическими свойствами, как мы можем прогнозировать их поведение в методах лечения или как мы можем перепрограммировать их из болезни в здоровое состояние. Таким образом, даже несмотря на то, что цели, инструменты и, в частности, уровень сложности не могут отличаться от работы, которую я выполнял, когда мне было 14 лет, сущность остается прежней.
Очевидно, что эта область исследований является важной движущей силой персонализированной медицины. Как быстро он развивается, и действительно ли он вступит в свои собственные в последние несколько лет с достижениями в области искусственного интеллекта?
Я молодой исследователь, поэтому я присоединился к революции, которая происходила в течение некоторого времени. Поле в последнее время изменилось невероятно быстро из-за того, как мы теперь можем генерировать высокопроизводительные биологические данные в беспрецедентном разрешении. Организация массовых коллекций биомедицинских наборов данных является основой для обучения крупных нейронных сетей. Например, большая часть успеха новейшей Нобелевской премии за химию, присуждаемой по частям ученым, которые разработали инструмент прогнозирования белковой структуры Alphafold, является благодаря банку белка, большой коллекции белковых структур, свободно доступных для всех.
Наше исследование происходит на один уровень, когда мы пытаемся моделировать биологическую функцию и поведение клеток и тканей. Мы основываем наши модели ИИ на данных, которые измеряют сотни функций в отдельных клетках и дают представление о субклеточном расположении, наличии и обилие отдельных белков и молекул в клетке. Мы все чаще собираем эти очень богатые данные в базы данных, поэтому прогресс обусловлен сочетанием доступности большего количества образцов и получения очень богатых и очень высоких данных о клетках человека.
Часто, однако, мы все еще работаем в режимах с низкими данными и отсутствуют комплексные наборы данных, которые, например, захватывают динамические клеточные процессы с течением времени и по физическим масштабам: в частности, парные данные, связывающие молекулярные изменения с поведением на уровне ткани, мало, что означает, что означает Мы должны быть креативными при разработке систем ИИ для преодоления этих ограничений.
Полностью захватывающая сложность биологических систем, которые включают бесчисленные молекулярные взаимодействия, которые организуются для общей динамики системного уровня в масштабах времени, от пикосекунд до процессов, которые происходят в течение многих лет, является монументальной задачей.
– Шарлотта Банн
Вы упомянули сбор данных и базы данных, которые были фундаментальной основой для работы, которую вы сейчас выполняете. Очевидно, что существуют проблемы с конфиденциальностью и то, как данные пациентов могут использоваться для обучения алгоритмам машинного обучения. Как это работает и как Швейцария помещается в глобальный контекст?
Конечно, данные пациента требуют самой высокой чувствительности. Такие данные хранятся в безопасных вычислительных средах и правилах защиты данных устанавливают строгие требования для обработки и обработки таких данных. В Швейцарии несколько уникально, так это координация усилий по разработке совместимой инфраструктуры данных, которые обеспечивают общенациональную доступность и обмен данными, связанными со здоровьем. Это устанавливает основу для разработки алгоритмов ИИ, которые используют растущие базы данных разнообразных и репрезентативных данных о пациентах. Наша рабочая прибыль от этих огромных усилий и экосистем, которые были созданы в Швейцарии за последние годы.
Другим краеугольным камнем нашего исследования является тесный обмен с клиницистами и биологами. Для нас это означает, что мы разрабатываем наши решения в области искусственного интеллекта в тесном сотрудничестве и можем адаптировать их так, чтобы диагностические инструменты, которые мы строим легко интегрированы в клинические процедуры и процессы. В то же время эти тесные сотрудничества с клиницистами и биологами позволяют нам влиять и направлять будущее генерацию данных в областях, где данные находятся под выбором выборки или определять приоритеты измерений методов данных, которые дают более глубокое понимание молекулярного состава клеток и тканей. Мы ожидаем, что такой сбор данных с AI значительно улучшит возможности моделей ИИ, которые мы создаем.
Вы также участвуете в глобальном сообществе, которое направлено на разработку виртуальных ячеек с AI. Что это такое и как они проведут текущие исследования дальше?
Существует бесчисленное множество способов измерения биологии во многих различных физических масштабах, от молекулярных взаимодействий до тканевой архитектуры. Вопрос, на который мы стремимся ответить: как мы можем интегрировать все эти измерения, чтобы получить полную картину и полное понимание поведения и функции клеток? В частности, можем ли мы предсказать, как молекулярное состояние клеток изменится при внешнем возмущении, таком как лекарство, влияние на окружающую среду, болезнь, лечение? По сути, мы хотим понять, почему ячейка принимает определенное состояние, а не другое.
С достижениями в области методов измерения и все более мощных архитектур искусственного интеллекта у нас теперь начинаем иметь инструменты для решения таких проблем. Некоторые из этих моделей искусственного интеллекта построены на данных измерения с одним клетками, в то время как другие сосредоточены на декодировании языка ДНК или прогнозировании складывания белка. Видение состоит в том, чтобы создать мультимодальную многомасштабную модель фундамента-виртуальную ячейку с AI, которая интегрирует все эти усилия и измерения и представляет и имитирует поведение молекул, клеток и тканей в различных состояниях и условиях. Виртуальная клетка ИИ служит научным, универсальным симулятором, способным моделировать клеточные системы в различных сценариях, включая дифференцировку, болезненные состояния, стохастические колебания и воздействие на окружающую среду.
Это массовые, совместные усилия, связанные с глобальным исследовательским сообществом. Многие группы работают над различными компонентами этой головоломки, и наша задача и возможность заключаются в интеграции этих вкладов в сплоченное зрение, которое будет раздвинуть границы того, что возможно в биомедицинских исследованиях.
Если бы у вас был хрустальный шар, где бы вы увидели ИИ в биомедицине за десять лет? Что вы будете делать через десять лет?
Есть некоторые более простые задачи в биологии, которые мы могли бы решить, и для которых мы можем сделать точные прогнозы. Истории успеха, такие как Alphafold, демонстрируют, что мы можем решить конкретные изолированные проблемы, и я ожидаю больше прорывов такого рода в следующем десятилетии. Тем не менее, полностью захватывая сложность биологических систем, которые включают бесчисленные молекулярные взаимодействия, которые организуются для общей динамики на уровне системных уровней в масштабах времени, от пикосекунд до процессов, которые происходят в течение многих лет, является монументальной задачей. Я полагаю, что у нас будет бесчисленное количество проблем, чтобы решить и вопросы, чтобы ответить на много -много лет.
Эпфл