Исследователи MIT вводят BLTZ-1, полностью с открытым исходным кодом модель для прогнозирования биомолекулярных структур | MIT News

Ученые MIT выпустили мощную модель искусственного интеллекта с открытым исходным кодом, называемую BLTZ-1, которая может значительно ускорить биомедицинские исследования и разработку лекарств.

Разработано группой исследователей в клинике MIT Jameel для машинного обучения в области здравоохранения, BLTZ-1-первая модель с открытым исходным кодом, которая достигает современной производительности на уровне AlphaFold3, модели из Google DeepMind, которая Предсказает 3D -структуры белков и других биологических молекул.

Аспиранты MIT Джереми Уолвенд и Габриэле Корсо были ведущими разработчиками BLTZ-1, а также филиал исследований клиники MIT Jameel Saro Passaro и профессорами MIT электротехники и информатики Регина Барзилай и Томми Джааккола. Wohlwend и Corso представили модель на мероприятии 5 декабря в Stata Center MIT, где они сказали, что их конечная цель – способствовать глобальному сотрудничеству, ускорению открытий и обеспечению надежной платформы для продвижения биомолекулярного моделирования.

«Мы надеемся, что это станет отправной точкой для сообщества», – сказал Корсо. «Есть причина, по которой мы называем это Boltz-1, а не Boltz. Это не конец линии. Мы хотим столько вкладов от сообщества, сколько сможем ».

Белки играют важную роль почти во всех биологических процессах. Форма белка тесно связана с его функцией, поэтому понимание структуры белка имеет решающее значение для проектирования новых лекарств или инженеров новых белков со специфическими функциями. Но из -за чрезвычайно сложного процесса, посредством которого длинная цепь аминокислот белка складывается в трехмерную структуру, точно предсказав, что эта структура была серьезной проблемой на протяжении десятилетий.

DeepMind AlphaFold2, который заработал Демис Хассабис и Джона Джампера Нобелевскую премию 2024 года по химии, использует машинное обучение для быстрого прогнозирования трехмерных белковых структур, которые настолько точны, что они неотличимы от тех, кто экспериментально получен учеными. Эта модель с открытым исходным кодом использовалась академическими и коммерческими исследовательскими группами по всему миру, что стимулировало многие достижения в области разработки лекарств.

AlphaFold3 улучшает свои предшественники, включив генеративную модель ИИ, известную как диффузионная модель, которая может лучше справиться с количеством неопределенности, связанной с прогнозированием чрезвычайно сложных белковых структур. Однако, в отличие от AlphaFold2, AlphaFold3 не является полностью открытым исходным кодом, и он не доступен для коммерческого использования, что вызвало критику со стороны научного сообщества и начала глобальную гонку для создания коммерчески доступной версии модели.

Для своей работы над BLTZ-1 исследователи MIT следовали тому же первоначальному подходу, что и AlphaFold3, но после изучения основной диффузионной модели они изучили потенциальные улучшения. Они включали те, которые повышали точность модели больше всего, такие как новые алгоритмы, которые повышают эффективность прогнозирования.

Наряду с самой моделью, они открыли весь свой трубопровод для обучения и точной настройки, чтобы другие ученые могли опираться на болтц-1.

«Я очень горжусь Джереми, Габриэле, Саро и остальной частью команды клиники Джамила за то, что этот релиз произошел. Этот проект занял много дней и ночей работы, с непоколебимой решимостью добраться до этого момента. Есть много интересных идей для дальнейших улучшений, и мы с нетерпением ждем возможности поделиться ими в ближайшие месяцы », – говорит Барзилай.

Команде MIT потребовалось четыре месяца работы и много экспериментов, чтобы разработать BLTZ-1. Одной из их самых больших задач было преодоление двусмысленности и неоднородности, содержащейся в банке данных белка, набор всех биомолекулярных структур, которые тысячи биологов решили за последние 70 лет.

«У меня было много долгих ночей с этими данными. Многое из этого – это знание чистых областей, которые нужно приобрести. Там нет ярлыков », – говорит Вольвенд.

В конце концов, их эксперименты показывают, что болтц-1 достигает того же уровня точности, что и AlphaFold3 на разнообразном наборе сложных прогнозов биомолекулярной структуры.

«То, чего достигли Джереми, Габриэле и Саро, не что иное, как замечательное. Их тяжелая работа и настойчивость в этом проекте сделали прогноз биомолекулярной структуры более доступным для более широкого сообщества », – говорит Джаккола.

Исследователи планируют продолжать улучшать производительность болтца-1 и сократить количество времени, необходимого для прогнозирования. Они также приглашают исследователей попробовать Boltz-1 в своем репозитории GitHub и связаться с коллегами по пользователям BLTZ-1 на их канале Slack.

«Мы думаем, что для улучшения этих моделей еще много, много лет работы. Мы очень стремимся сотрудничать с другими и посмотреть, что делает сообщество с этим инструментом », – добавляет Wohlwend.

Маммен Маммен, генеральный директор и президент Parabilis Medicines, называет Beltz-1 моделью «прорыва». «Внедряя этот аванс, клиника MIT Jameel и сотрудники демократизируют доступ к передовым инструментам структурной биологии»,-говорит он. «Это знаковое усилие ускорит создание изменяющих жизнь лекарств. Спасибо команде Boltz-1 за то, что он запустил этот глубокий скачок вперед! »

«Boltz-1 будет чрезвычайно способен для моей лаборатории и всего сообщества»,-добавляет Джонатан Вайсман, профессор биологии MIT и член Института биомедицинской инженерии Уайтхеда, который не участвовал в исследовании. «Мы увидим целую волну открытий, которые стали возможными благодаря демократизации этого мощного инструмента». Вайсман добавляет, что он ожидает, что природа болтца-1 с открытым исходным кодом приведет к огромному количеству творческих новых приложений.

Эта работа также была поддержана грантом национального научного фонда США; Клиника Джамила; Агентство по снижению угроз защиты США обнаружение медицинских контрмеров против новой и возникающей (доменной) программы угроз; и проект Matchmakers, поддерживаемый партнерством Grand Challenge Cancer Grand Challenge, финансируемым Rack Research UK и Национальным институтом рака США.

Source link

Scroll to Top