Машинное обучение расширилось за пределы традиционных евклидовых пространств в последние годы, исследуя представления в более сложных геометрических структурах. Несуклидовое представление обучение-это растущее поле, которое стремится охватить основные геометрические свойства данных, внедряя их в гиперболические, сферические или смешанные продукты. Эти подходы были особенно полезны в моделировании иерархических, структурированных или сетевых данных более эффективно, чем евклидовые встраивания. Поле стало свидетелем значительных достижений с новыми инструментами и алгоритмами для облегчения этих сложных представлений.
Специальной проблемой в этом домене является отсутствие унифицированной структуры, интегрирующей различные подходы к неяклидовому обучению представления. Текущие методологии часто диспергируются по нескольким программным пакетам, создавая неэффективность в реализации. Многие существующие инструменты обслуживают определенные типы неклидовых пространств, ограничивая их более широкую применимость. Исследователи нуждаются в комплексной и доступной библиотеке, которая обеспечивает беспрепятственное встраивание, классификацию и регрессию при сохранении совместимости с установленными рамками машинного обучения. Устранение этого пробела имеет решающее значение для развития неэвклидовых исследований и приложений машинного обучения.
Было введено несколько инструментов для облегчения машинного обучения на основе коллектора. Geoopt, пакет Python, обеспечивает римановую оптимизацию для невклидовых коллекторов, но его функциональность ограничена. Другие реализации сосредоточены на гиперболическом обучении, но не имеют последовательности, что приводит к фрагментированным методологиям. Отсутствие унифицированного набора инструментов с открытым исходным кодом, который соединяет эти пробелы, сделало неэвклидовое машинное обучение менее доступным для более широкого исследовательского сообщества. Для обеспечения плавного принятия и интеграции неклидных методов обучения необходима более комплексная структура.
Исследовательская группа из Колумбийского университета представила Manify, библиотеку Python с открытым исходным кодом, предназначенную для устранения ограничений существующих нехиклидных инструментов обучения представления. Manify выходит за рамки текущих методологий, включив в себя внедрения смешанной оказания и методов обучения на основе коллекторов в один пакет. Он построен на GeOoopt, расширяя свои возможности, позволяя изучать представления в продуктах гиперболических, гиперсферических и евклидовых компонентов. Библиотека облегчает задачи классификации и регрессии, одновременно обеспечивая оценку кривизны многообразии. Консолидируя множественные методы обучения неклидова в структурированную структуру, Manify обеспечивает надежное решение для исследователей, работающих с данными, которые естественным образом существуют в неклидовых пространствах.
Manify содержит три основных функциональных возможностях: встраивание графиков или матриц расстояний в продукты коллекторы, обучающие предикторы для многообразных данных и оценка кривизны наборов данных. Библиотека интегрирует несколько методов встраивания, включая координатное обучение, нейронные сети сиамских и вариационные автоэкодоры, предлагая различные преимущества в разных приложениях. Кроме того, он поддерживает различные классификаторы, такие как деревья решений, персептроны и поддержка векторных машин, которые были адаптированы для работы с нехиклидными данными. Manify также оснащен специализированными инструментами для измерения кривизны, помогая пользователям в определении наиболее подходящей геометрии коллектора для их наборов данных. Эти возможности делают его универсальной и мощной библиотекой для исследователей, исследующих неклидовые методы обучения.
Производительность Manify была оценена по нескольким задачам машинного обучения, демонстрируя значительные улучшения в качеством внедрения и прогнозирующей точности. Способность библиотеки моделировать гетерогенную кривизну в пределах одной структуры снижает искажение метрического уровня по сравнению с евклидовыми методами. Результаты показывают, что встроения, генерируемые с использованием Manify, демонстрируют превосходную структурную верность, сохраняя дистанции более точно, чем традиционные методы. Библиотека также продемонстрировала вычислительную эффективность, поскольку время обучения сопоставимо с существующими методами евклидова, несмотря на повышенную сложность неклидных представлений. Процедуры производительности показывают, что Manify достигает среднего улучшения примерно на 15% в точность классификации по сравнению с евклидовыми встраиваниями, демонстрируя ее эффективность в задачах обучения на основе многообразий.
Manify представляет собой значительный прогресс в неклидном обучении представления, учитывая ограничения существующих инструментов и обеспечивает более точное моделирование сложных структур данных. Предлагая хорошо интегрированную структуру с открытым исходным кодом, библиотека упрощает принятие методов обучения на основе коллекторов для исследователей и практиков. Внедрение Manify преодолело разрыв между теоретическими достижениями и практической реализацией, что сделало неяклидовые методы обучения более доступными для более широкого научного сообщества. Будущие улучшения могут еще больше оптимизировать свои возможности, укрепив свою роль в качестве ключевого ресурса в исследованиях машинного обучения.
Проверить бумага и страница GitHub. Весь кредит на это исследование направлено на исследователей этого проекта. Кроме того, не стесняйтесь следить за нами Twitter И не забудьте присоединиться к нашему 80K+ ML SubredditПолем

Нихил – стажер консультант в Marktechpost. Он получает интегрированную двойную степень в области материалов в Индийском технологическом институте, Харагпур. Нихил является энтузиастом AI/ML, который всегда исследует приложения в таких областях, как биоматериалы и биомедицинская наука. С большим опытом в области материальной науки, он изучает новые достижения и создает возможности для внесения вклад.