Интервью с Дебалиной Падарией: Содержание конфиденциальности генеративных моделей

В этой серии интервью мы встречаемся с некоторыми участниками докторского консорциума AAAI/Sigai, чтобы узнать больше об их исследованиях. В этом последнем интервью мы слышим от Дебалины Падарии и слышим о ее работе по созданию конфиденциальности генеративных моделей, почему это такая интересная область для обучения, различные проекты, в которых она участвовала до сих пор во время доктора наук, и ее опыт в докторантуре в AAAI 2025.

Расскажите нам немного о своей докторской диссертации – где вы учитесь и какова тема вашей
исследовать?

В настоящее время я получаю докторскую степень в Университете Де Монфор, Великобритания, поддерживается престижным Институтом Алана Тьюринга и программой стратегического партнерства Accenture. Мое исследование в первую очередь фокусируется на создании конфиденциальности генеративных моделей, одновременно создавая структуру для количественной оценки компромиссов конфиденциальности/утилиты в генеративных модельных синтетических наборах данных. Хотя генерация синтетических данных (SDG) является одним из возникающих случаев использования генеративного ИИ, потенциальные приступы конфиденциальности, связанные с генеративными моделями, становятся критическими проблемами. В моем исследовании исследуется современные показатели конфиденциальности в генеративных моделях (GMS), рассматривая ограничения существующих подходов к сохранению конфиденциальности. Это исследование направлено на разработку новой основы, сохраняющей конфиденциальность, которая будет способствовать практическим достижениям генерации синтетических данных по всей промышленности и государственному сектору.

Не могли бы вы дать нам обзор исследования, которое вы провели до сих пор во время доктора философии?

На первом этапе исследования я всесторонне рассмотрел литературу о консервативных GMS. Я предложил систематическое литературное обследование, которое предлагает углубленный анализ исчерпывающего списка публикаций для картирования текущего ландшафта. Кроме того, я разработал новые таксономии для классификации конфиденциальности и полезных показателей GMS, что позволяет нам понять сходства и различия разных метрик. Предварительный напечаток моего комплексного литературного опроса теперь доступен в ARXIV: Содержание конфиденциальности генеративных моделей: комплексный опрос.

На втором этапе моего исследования я провел эмпирическое исследование, посвященное рискам конфиденциальности и полезности синтетических табличных данных, генерируемых современными генеративными моделями. В этом исследовании рассматриваются как уязвимости конфиденциальности, так и влияние дифференциальных механизмов конфиденциальности, что является потенциальным последствием для областей, которые полагаются на синтетические данные. Я представил результаты этого исследования на симпозиуме «Женщины в машинном обучении» (WIML2024), ICML 2024. В целом, мои эмпирические результаты показывают, что, хотя популярный подход, дифференциальная конфиденциальность, обладает большим обещанием для контроля раскрытия и количественного определения риска конфиденциальности синтетических данных, это включает компромиссы, которые необходимо тщательно рассмотреть. Другим важным аспектом SDG является его надежность в нынешнем регулирующем ландшафте, где мировые усилия по регулированию направлены на установление этического стандарта в разработке генеративного ИИ. Я проанализировал, как использование генеративных модельных синтетических наборов данных пересекается с появляющимися соответствующими нормативными средствами, и представил мои выводы на 2-м семинаре ICML по генеративному ИИ и закону (Genlaw ’24): навигация на риски и вознаграждения генеративных модельных синтетических наборов: регулирующая перспектива.

На третьем этапе я разработал новую методологию, сосредоточенную на конфиденциальности, создавающих конфиденциальность, генерирование синтетических данных для приложений временных рядов. Я разработал расширяемую структуру, интегрируя компоненты и интерфейсы, реализуя различные модули кандидатов, такие как генеративные модели, атаки и защита. Я полагаюсь на защиту, которая предоставляет современные дифференциальные гарантии конфиденциальности, такие как шумовые возмущения и стратегии градиента. Кроме того, я предложил новую атаку по выводу членства на синтетические данные временных рядов в настройках белого ящика, чтобы продемонстрировать сопротивление этой структуры атакам. Кроме того, я провел обширную оценку для оценки эффективности синтетических данных с использованием различных качественных и количественных показателей полезности, демонстрируя ее эффективность с моделью SOTA (современное). Я представил предварительные выводы о предлагаемой структуре в семинаре AAAI 2025 по искусственному искусству для публичных мисс. Кроме того, мое предложение по диссертации доктора философии было принято в докторском консорциуме AAAI/Sigai 2025 года и теперь доступно в структуре конфиденциальности для обеспечения конфиденциальности для генеративных модельных синтетических наборов данных | Труды конференции АААИ по искусственному интеллекту.

Есть ли аспект вашего исследования, который был особенно интересным?

Одним из интересных аспектов моего исследования было исследование компромиссов конфиденциальности и ухода в синтетических данных. Эта область убедительна, потому что повышение конфиденциальности, особенно благодаря таким механизмам, как дифференциальная конфиденциальность, часто происходит за счет точности данных. До сих пор мои выводы показали, что, хотя дифференциальная конфиденциальность может эффективно снижать риски раскрытия, обеспечивая при этом более высокие уровни защиты конфиденциальности, она часто значительно ухудшает статистическое качество и нижестоящие характеристики синтетических данных. Это создает критические проблемы для практиков и политиков в таких областях, как здравоохранение и финансы, где синтетические данные все чаще используются для обеспечения обмена данными при сохранении конфиденциальности. Навигация по этому компромиссу имеет решающее значение для продвижения заслуживающих доверия систем ИИ. Другим интересным аспектом моего исследования является выбор подходящих показателей оценки для синтетических наборов данных временных рядов. Поскольку различные показатели могут привести к разнообразным компромиссам, и в настоящее время нет четкого консенсуса по наиболее подходящим показателям оценки для оценки синтетических данных временных рядов, это остается важной проблемой в этой области.

Каковы ваши планы по созданию вашего исследования до сих пор во время доктора философии – какие аспекты вы будете расследовать дальше?

В то время как в публикации данных, сохраняющих конфиденциальность данных, показал заметный успех в приложениях на основе изображений, другие критические области, такие как данные временных рядов, используемые в здравоохранении, финансах и прогнозировании погоды, не были значительно изучены. Мое исследование особенно сосредоточено на создании конфиденциальности синтетических данных для последовательных приложений, где обработка временных зависимостей является сложной задачей и часто требует сложных моделей. Я уже разработал новую основу для обеспечения конфиденциальности для приложений временных рядов при оценке производительности синтетических данных с использованием подходящих конфиденциальных и полезных показателей. Для следующего шага я буду оценивать компромиссы конфиденциальности/коммунальных услуг, которые позволяют последовательно сравнивать значения конфиденциальности и полезности с различными конфигурациями SDG. Кроме того, мое исследование будет сосредоточено на выявлении соответствующих показателей полезности, определении того, когда их оценки являются значимыми и когда они могут быть склонны к неверному толкованию.

Дебалина представляет свой плакат на докторантуре AAAI/Sigai

Каким был докторский консорциум AAAI/Sigai и опыт конференции AAAI в целом?

Посещение докторского консорциума AAAI/Sigai является одним из лучших опытов во время моего доктора философии. Организационный комитет разработал расписание программы очень вдумчиво для поддержки аспирантов. Одним из основных моментов была сессия наставника -им, где каждая группа была в паре с опытными экспертами из академических кругов и промышленности. Их совет о том, как приблизиться к переходу после доктора наук, был невероятно ценным. Были также обеды и ужины, организованные программным комитетом, где у нас была возможность связаться с коллегами -исследователями из разных слоев общества. Я настоятельно рекомендую, чтобы аспиранты подумали о посещении докторского консорциума хотя бы один раз во время их исследовательского путешествия.

Посещение конференции AAAI было действительно ценным опытом для меня. Выдающимся моментом был выступление доктора Эндрю Нг, всемирно известного ученого ИИ. У меня также была возможность выступить на семинаре «Женщины в области разнообразия ИИ», где я участвовал в проницательных дискуссиях с ведущими отраслевыми экспертами в этой области. На конференции также была представлена ​​ярмарка работы, предлагающая возможность связаться с потенциальными работодателями о возможностях карьеры. Это был также мой первый опыт в Соединенных Штатах, и посещение одной из ведущих конференций в ИИ сделало для меня незабываемый момент!

Какой совет вы бы дали кому -то, кто думает о доктории доктора философии в поле?

ИИ-одно из самых быстрорастущих полей сегодня, где докторская степень в области искусственного интеллекта является невероятно требовательным! Имейте в виду-преследование доктора наук-это долгосрочное обязательство. Путешествие может быть поездками на американских горках, где ваша умственная сила, преданность делу и мотивация будут оспариваться больше, чем ваш интеллект. Кроме того, как иностранный студент, получающий докторскую степень за границей, вы можете столкнуться с дополнительными проблемами, в том числе вдали от систем поддержки семьи. Тем не менее, это путешествие также предлагает огромный личный и профессиональный рост, поскольку вы раздвигаете границы и развиваете устойчивость. Одним из ключевых элементов вашего путешествия по докторски является ваши руководители. Их руководство, обратная связь и критическая оценка являются центральными для формирования вашего роста в качестве исследователя. Окружите себя сверстниками, взаимодействуйте с более широким исследовательским сообществом, делитесь идеями и борьбой с другими. Посещение конференций, семинаров или летних школ также может быть обогащающим опытом, предоставляя возможности получить ценную информацию и создать значимое сотрудничество.

Не могли бы вы рассказать нам интересный (не связанный с неай) факт о вас?

Я родом из Индии, страны, известной своей богатой традицией и глубоко укоренившимися ценностями в образовании и инновациях. Рассматривая докторскую степень в качестве второго ребенка, я также работаю на полную ставку замечательного маленького мальчика! Свободное время – это роскошь в качестве аспиранта и родителя, но с постоянной поддержкой моего удивительного мужа, который делится родительскими обязанностями и поощряет мои академические цели, мы максимально используем его, проводя время вместе. Мне нравится готовить индийскую кухню, рисовать, играть и тусоваться с моим сыном, и лучшая часть-пытаясь ответить на все свои бесконечные «почему» вопросы о мире! Он считает, что его мама все еще «учится так же, как он» – и я думаю, что это вызвало общую любовь к обучению в нас обоих!

Дебалина Падария

Я являюсь доктором научно -исследовательским учащимся на факультете Школы информатики и информатики в Университете Де Монтфор, Великобритания, консультируется доктором Абузаром Тахххани (Университет де Монтфорта), профессор Эерк Бойтен (Университет Де Монфор) и д -р Изабель Вагнер (Базельский университет, Швейцария). Мое исследование поддерживается Accenture и Программой стратегического партнерства Алана Тьюринга, Великобритания. Моя докторская степень сосредоточена на создании конфиденциальности генеративных моделей и количественной оценке компромиссов между конфиденциальностью и полезностью. До сих пор во время моего доктора философии, я был приглашен в качестве члена группы в Международном женском дне в Университете Де Монтфорт, Великобритания, получил докторскую посла студента по борьбе с конференцией по безопасности и конференции по безопасности и конфиденциальности Sprite+, Белфаст, Северная Ирландия, служил волонтером на Симпозиуме Machine Learning в ICML 2024. 2025, и занимал должность члена организационного комитета на конференции по исследованиям после аспирантуры в Университете Де Монтфор, Великобритания. Помимо исследований, у меня есть десять лет академического опыта в качестве доцента в Индии. Я также являюсь членом Общества оперативных исследований, Великобритания, Индийского общества технического образования (ISTE) и Ассоциации учителей компьютерных наук (CSTA).

Теги: AAAI, AAAI докторский консорциум, AAAI2025, ACM Sigai


Люси Смит – старший управляющий редактор Aihub.

Source link

Scroll to Top