Выборка без данных теперь масштабируется: Meta AI выпускает соответствующую выборку для генеративного моделирования, управляемого вознаграждением.

Дефицит данных при генеративном моделировании

Генеративные модели традиционно полагаются на крупные высококачественные наборы данных для производства образцов, которые повторяют основное распределение данных. Однако в таких областях, как молекулярное моделирование или физическое вывод, получение таких данных может быть вычислительно невозможным или даже невозможным. Вместо помеченных данных, только скалярное вознаграждение – типично полученное из сложной энергетической функции – доступно для оценки качества генерируемых образцов. Это представляет собой значительную проблему: как один поездок на генеративных моделях может эффективно эффективно без прямого контроля по данным?

Meta AI представляет соответствующую выборку, новый алгоритм обучения, основанный на скалярных вознаграждениях

Meta AI решает этот вызов с Соответствующая выборкановый алгоритм обучения, предназначенный для обучения генеративных моделей с использованием только скалярных сигналов вознаграждения. Построенный на теоретической структуре стохастического оптимального управления (SOC), приспособление отбора проб рефризует процесс обучения как задачу оптимизации над контролируемым процессом диффузии. В отличие от стандартных генеративных моделей, это не требует явных данных. Вместо этого он учится генерировать высококачественные образцы путем итеративного усовершенствования их с помощью функции вознаграждения-часто полученной из моделей физической или химической энергии.

Соответствующая выборка превосходит в сценариях, где доступна только недимализованная энергетическая функция. Он производит образцы, которые соответствуют целевому распределению, определяемому этой энергией, обходя необходимость в корректирующих методах, таких как выборка важности или MCMC, которые являются вычислительными интенсивными.

Источник: https://arxiv.org/abs/2504.11713

Технические детали

Основами в сопряженной выборке является стохастическое дифференциальное уравнение (SDE), которое моделирует, как развиваются траектории выборки. Алгоритм изучает управляющий дрейф u (x, t) u (x, t) u (x, t), так что окончательное состояние этих траекторий приближается к желаемому распределению (например, Больцманн). Ключевым инновацией является его использование Взаимное соблюдение соблюдения (ОЗУ)-Функция потерь, которая позволяет обновления на основе градиента, используя только начальные и конечные состояния траекторий выборки. Это обходит необходимость обработки пропагандирования по всему пути диффузии, значительно повышая вычислительную эффективность.

Отбирая выборку из известного базового процесса и кондиционирования на терминальных состояниях, приспособление для отбора проб конструкции буфера воспроизведения образцов и градиентов, позволяя множественным этапам оптимизации на выборку. Этот метод обучения на политике обеспечивает непревзойденную масштабируемость по предыдущим подходам, что делает его подходящим для высокомерных проблем, таких как генерация молекулярного конформера.

Более того, соответствующая выборка поддерживает геометрические симметрии и периодические граничные условия, что позволяет моделям уважать молекулярные инварианты, такие как вращение, трансляция и кручение. Эти особенности имеют решающее значение для физически значимых генеративных задач по химии и физике.

Постижение в производительности и контрольные результаты

Содровневая выборка достигает современных результатов как в синтетических, так и в реальных задачах. На синтетических критериях, таких как двойные сквозные (DW-4), Леннард-Джонс (LJ-13 и LJ-55), он значительно превосходит базовые линии, такие как DDS и PIS, особенно в энергоэффективности. Например, в тех случаях, когда DDS и PI требуют 1000 оценок на обновление градиента, соответствующая выборка использует только три, с аналогичной или лучшей производительностью на расстоянии Wasserstein и эффективном размере выборки (ESS).

В практической обстановке алгоритм оценивали на крупномасштабную молекулярную генерацию конформеров с использованием модели ESEN Energy, обученной набору данных OFCE Spice-Mace. Соответствующая выборка, особенно его картезианский вариант с предварительной подготовкой, достигнут до 96,4% отзыва и среднего уровня RMSD 0,60 Å, превзойдя rdkit etkdg-широко используемый базовый уровень на основе химии-по сравнению с всеми метриками. Метод хорошо обобщает набор данных Geom Drugs, демонстрируя существенные улучшения в отзыве при сохранении конкурентной точности.

Способность алгоритма широко изучать пространство конфигурации, способную его стохастической инициализации и обучению на основе вознаграждений, что приводит к большему разнообразию конформ-критическому для обнаружения лекарств и молекулярного дизайна.

Вывод: масштабируемый путь вперед для генеративных моделей, управляемых вознаграждением

Соответствующая выборка представляет собой большой шаг вперед в генеративном моделировании без данных. Используя скалярные сигналы вознаграждения и эффективный метод обучения на политике, основанный на стохастическом контроле, он позволяет масштабируемому обучению пробоотборников на основе диффузии с минимальными оценками энергии. Его интеграция геометрической симметрии и его способность обобщать различные молекулярные структуры позиционируют ее как основополагающий инструмент в области вычислительной химии и за ее пределами.


Проверьте бумагу, модели на обнимании и странице GitHubПолем Весь кредит на это исследование направлено на исследователей этого проекта. Кроме того, не стесняйтесь следить за нами Twitter И не забудьте присоединиться к нашему 95K+ ML Subreddit и подписаться на Наша информационный бюллетеньПолем


ASIF Razzaq является генеральным директором Marktechpost Media Inc. как дальновидного предпринимателя и инженера, ASIF стремится использовать потенциал искусственного интеллекта для социального блага. Его последнее усилие-запуск медиа-платформы искусственного интеллекта, Marktechpost, которая выделяется благодаря глубокому освещению машинного обучения и новостей о глубоком обучении, которое является технически обоснованным и легко понятным для широкой аудитории. Платформа может похвастаться более чем 2 миллионами ежемесячных просмотров, иллюстрируя свою популярность среди зрителей.

Source link

Scroll to Top