Новые методы вычислительной химии ускоряют прогноз молекул и материалов | MIT News

В старые времена – действительно старые времена – задача проектирования материалов была трудоемкой. Следователи в течение 1000 с лишним лет пытались сделать золото, объединив такие вещи, как свинец, ртуть и сера, смешанные в том, что, как они надеялись, будут как раз правильные пропорции. Даже известные ученые, такие как Тихо Брахе, Роберт Бойл и Исаак Ньютон, попробовали свои руки в бесплодном начинании, которое мы называем алхимией.

Материаловая наука, конечно, прошла долгий путь. В течение последних 150 лет исследователи имели пользу от периодической таблицы элементов, на которую можно привлечь, что говорит им, что разные элементы обладают разными свойствами, и один не может волшебным образом превратиться в другое. Более того, в последнее десятилетие инструменты машинного обучения значительно повысили нашу способность определять структуру и физические свойства различных молекул и веществ. Новое исследование группы, возглавляемое Ju Li – профессором ядерной инженерии Tokyo Electric Power Company в MIT и профессором материаловедения и инженерии – дает обещание серьезного скачка в возможностях, которые могут облегчить разработку материалов. Результаты их расследования сообщаются в декабре 2024 года. Природная вычислительная наукаПолем

В настоящее время большинство моделей машинного обучения, которые используются для характеристики молекулярных систем, основаны на теории функционала плотности (DFT), которая предлагает квантовой механический подход к определению общей энергии молекулы или кристалла путем взгляда на распределение плотности электронов – который, в основном, среднее количество электронов, расположенных в объеме единицы вокруг каждой заданной точки в пространстве вблизи молекулы. (Уолтер Кон, который составлял соавторную теорию 60 лет назад, получил Нобелевскую премию по химии за ее равномерно великолепно. И, во -вторых, это говорит вам только одну вещь: самая низкая общая энергия молекулярной системы ».

«Терапия пар» на помощь

В настоящее время его команда полагается на другую технику вычислительной химии, также полученную из квантовой механики, известной как теория связанных кластеров, или CCSD (T). «Это золотой стандарт квантовой химии», – комментирует Ли. Результаты расчетов CCSD (T) гораздо более точны, чем то, что вы получаете из расчетов DFT, и они могут быть столь же заслуживающими доверия, как и результаты, которые в настоящее время получают в экспериментах. Проблема в том, что выполнение этих расчетов на компьютере очень медленное, говорит он: «И масштабирование плохое: если вы удвоите количество электронов в системе, вычисления становятся в 100 раз дороже». По этой причине расчеты CCSD (T) обычно ограничивались молекулами с небольшим количеством атомов – по порядку около 10. Все, что намного больше, это займет слишком много времени.

Вот где появляется машинное обучение. Расчеты CCSD (T) сначала выполняются на обычных компьютерах, и результаты затем используются для обучения нейронной сети с новой архитектурой, специально разработанной Ли и его коллегами. После обучения нейронная сеть может выполнять эти же расчеты намного быстрее, используя преимущества методов приближения. Более того, их модель нейронной сети может извлечь гораздо больше информации о молекуле, чем ее энергия. «В предыдущей работе люди использовали несколько разных моделей для оценки различных свойств», – говорит Хао Тан, аспирант MIT по материалости и технике. «Здесь мы используем только одну модель для оценки всех этих свойств, поэтому мы называем это« многозадачным »подходом».

«Многосторонняя электронная гамильтонианская сеть», или Mehnet, проливает свет на ряд электронных свойств, таких как дипольные и квадрупольные моменты, электронная поляризуемость и разрыв оптического возбуждения-количество энергии, необходимое для взять электрон из Основное состояние до самого низкого возбужденного состояния. «Разрыв возбуждения влияет на оптические свойства материалов, – объясняет Тан, – потому что он определяет частоту света, которая может быть поглощена молекулой». Еще одним преимуществом их модели, обученной CCSD, является то, что она может выявить свойства не только основных состояний, но и возбужденных состояний. Модель также может предсказать инфракрасный спектр поглощения молекулы, связанной с ее вибрационными свойствами, где вибрации атомов в молекуле связаны друг с другом, что приводит к различным коллективным поведению.

Сила их подхода очень обязана сетевой архитектуре. Опираясь на работу доцента профессора MIT Тесс Смидт, команда использует так называемую нейронную сеть Equivariant Graph, говорит Тан, «в которой узлы представляют атомы, и ребра, которые соединяют узлы, представляют связи между атомы. Мы также используем индивидуальные алгоритмы, которые включают принципы физики – связанные с тем, как люди рассчитывают молекулярные свойства в квантовой механике – непосредственно в нашей модели ».

Тестирование, 1, 2 3

При тестировании на анализ известных молекул углеводородов модель Li et al. Превзошли от DFT аналоги и тесно соответствовали экспериментальным результатам, полученным из опубликованной литературы.

Цян Чжу – специалист по поиску материалов в Университете Северной Каролины в Шарлотте (которая не была частью этого исследования) – впечатлен тем, что было достигнуто до сих пор. «Их метод обеспечивает эффективное обучение с небольшим набором данных, при этом достигая превосходной точности и вычислительной эффективности по сравнению с существующими моделями», – говорит он. «Это захватывающая работа, которая иллюстрирует мощную синергию между вычислительной химией и глубоким обучением, предлагая свежие идеи для разработки более точных и масштабируемых методов электронной структуры».

Группа на основе MIT применила свою модель в первую очередь к небольшим неметаллическим элементам-водороду, углероду, азоту, кислороду и фторину, из которых могут быть изготовлены органические соединения-и с тех пор перешел к изучению более тяжелых элементов: кремний, фосфор, серная хлор и даже платина. После обучения на малых молекулах модель может быть обобщена до более крупных и больших молекул. «Ранее большинство расчетов ограничивались анализом сотен атомов с DFT и всего лишь десятками атомов с расчетами CCSD (T)», – говорит Ли. «Теперь мы говорим о обработке тысяч атомов и, в конечном итоге, возможно, десятками тысяч».

На данный момент исследователи по -прежнему оценивают известные молекулы, но модель может использоваться для характеристики молекул, которые не видели ранее, а также для прогнозирования свойств гипотетических материалов, которые состоят из различных видов молекул. «Идея состоит в том, чтобы использовать наши теоретические инструменты, чтобы выбрать многообещающих кандидатов, которые удовлетворяют определенному набору критериев, прежде чем предложить им эксперименталиста, чтобы проверить», – говорит Тан.

Это все о приложениях

Заглядывая в будущее, Чжу с оптимизмом смотрит на возможные приложения. «Этот подход имеет потенциал для высокопроизводительного молекулярного скрининга»,-говорит он. «Это задача, когда достижение химической точности может быть важна для выявления новых молекул и материалов с желаемыми свойствами».

После того, как они продемонстрируют способность анализировать большие молекулы с, возможно, десятки тысяч атомов, Ли говорит: «Мы должны иметь возможность изобретать новые полимеры или материалы», которые могут использоваться в дизайне лекарств или в полупроводниковых устройствах. Исследование более тяжелых элементов переходного металла может привести к появлению новых материалов для батарей – в настоящее время область острой потребности.

Будущее, как это видит Ли, широко открыто. «Это больше не только одна область», – говорит он. «Наши амбиции, в конечном счете, состоит в том, чтобы охватить всю периодическую таблицу с точностью CCSD (T)-уровня, но при более низких вычислительных затратах, чем DFT. Это должно позволить нам решить широкий спектр проблем в области химии, биологии и материаловедения. В настоящее время трудно понять, насколько широким может быть этот диапазон ».

Эта работа была поддержана исследовательским институтом Honda. Хао Тан признает поддержку со стороны инженерного стипендии Mathworks. Расчеты в этой работе были выполнены, частично, на высокоскоростном универсальном атомистическом симуляторе Matlantis, в Техасском продвинутом компьютерном центре, MIT Supercloud и Национальных научных вычислениях.

Source link

Scroll to Top