Технологии
- Опубликовано
- Авторы
Свен Говал, Пушмет Кохли
Новый инструмент помогает водяному знаке и определяет синтетические изображения, созданные Imagen
Изображения, сгенерированные AI, становятся все более популярными с каждым днем. Но как мы можем лучше идентифицировать их, особенно когда они выглядят такими реалистичными?
Сегодня, в партнерстве с Google Cloud, мы запускаем бета-версию Synthid, инструмента для водяных знаков и идентификации изображений, сгенерированных AI. Эта технология встраивает цифровой водяной знак непосредственно в пиксели изображения, что делает ее незаметным для человеческого глаза, но обнаруживаемым для идентификации.
Synthid выпускается в ограниченное количество клиентов Vertex AI с использованием Imagen, одной из наших последних моделей текста к изображению, которые используют входной текст для создания фотореалистичных изображений.
Генеративные технологии ИИ быстро развиваются, а компьютерные образы, также известные как «синтетические образы», становится все труднее отличить от тех, которые не были созданы системой ИИ.
Хотя генеративный ИИ может раскрыть огромный творческий потенциал, он также представляет новые риски, например, позволяет создателям распространять ложную информацию – как намеренно, так и непреднамеренно. Возможность идентифицировать контент, сгенерированный AI, имеет решающее значение для расширения прав и возможностей людей знаниями о том, когда они взаимодействуют с генерируемыми средствами массовой информации, и для предотвращения распространения дезинформации.
Мы стремимся подключить людей с высококачественной информацией и поддержать доверие между создателями и пользователями в обществе. Частью этой ответственности является предоставление пользователям более продвинутых инструментов для определения изображений, сгенерированных AI, чтобы их изображения-и даже некоторые отредактированные версии-могут быть идентифицированы позже.
Synthid генерирует незаметный цифровой водяной знак для сгенерированных AI-изображений.
Google Cloud-это первый облачный провайдер, который предложит инструмент для ответственности создания изображений, сгенерированных AI, и с уверенностью идентифицировать их. Эта технология основана на нашем подходе к разработке и развертыванию ответственного ИИ, и была разработана Google DeepMind и усовершенствован в партнерстве с Google Research.
Synthid не является надежным в отношении экстремальных манипуляций с изображением, но он обеспечивает многообещающий технический подход для расширения прав и возможностей людей и организаций для ответственности с AI-генерируемым контентом. Этот инструмент также может развиваться вместе с другими моделями ИИ и методами, помимо изображений, таких как аудио, видео и текст.
Новый тип водяного знака для изображений искусственного интеллекта
Водяные знаки – это конструкции, которые могут быть наложены на изображения, чтобы идентифицировать их. От физических отпечатков на бумаге до полупрозрачного текста и символов, которые сегодня на цифровых фотографиях они развивались на протяжении всей истории.
Традиционных водяных знаков недостаточно для выявления изображений, сгенерированных AI, потому что они часто применяются как штамп на изображении и могут быть легко отредактированы. Например, дискретные водяные знаки, найденные в углу изображения, могут быть вырезаны с помощью базовых методов редактирования.
Обеспечить правильный баланс между незаметным и надежностью манипуляций с изображениями сложно. Очень заметные водяные знаки, часто добавляемые в виде слоя с именем или логотипом на верхней части изображения, также представляют эстетические проблемы для творческих или коммерческих целей. Аналогично, некоторые ранее разработанные незаметные водяные знаки могут быть потеряны с помощью простых методов редактирования, таких как изменение размера.
Водяной знак обнаруживается даже после таких модификаций, как добавление фильтров, изменение цвета и яркости.
Мы разработали синтид, поэтому он не ставит под угрозу качество изображения и позволяет водяному знаку оставаться обнаруживаемым даже после таких модификаций, как добавление фильтров, изменение цветов и сохранение с различными схемами сжатия потерей – чаще всего используется для JPEG.
Synthid использует две модели глубокого обучения – для водяного знака и идентификации – которые были обучены вместе на разнообразном наборе изображений. Комбинированная модель оптимизирована в ряде целей, включая правильное определение содержания с водяными знаками и улучшение незабываемости путем визуального выравнивания водяного знака с исходным содержанием.
Надежный и масштабируемый подход
Synthid позволяет клиентам Vertex AI с уверенностью создавать изображения, сгенерированные AI, и с уверенностью идентифицировать их. Хотя эта технология не идеальна, наше внутреннее тестирование показывает, что она точна против многих общих манипуляций с изображением.
Объединенный подход синтида:
- Водянка: Synthid может добавить незаметный водяной знак к синтетическим изображениям, создаваемым Imagen.
- Идентификация: Сканируя изображение для своего цифрового водяного знака, Synthid может оценить вероятность создания изображения Imagen.
Synthid может помочь оценить, насколько вероятно, что изображение было создано Imagen.
Этот инструмент предоставляет три уровня доверия для интерпретации результатов идентификации водяного знака. Если обнаружен цифровой водяной знак, часть изображения, вероятно, генерируется Imagen.
Synthid способствует широкому набору подходов для выявления цифрового контента. Одним из наиболее широко используемых методов идентификации контента является метаданные, которые предоставляют информацию, такую как то, кто его создал и когда. Эта информация хранится в файле изображения. Цифровые подписи, добавленные в метаданные, могут затем показать, было ли изменено изображение.
Когда информация о метаданных не повреждена, пользователи могут легко идентифицировать изображение. Тем не менее, метаданные могут быть удалены вручную или даже потеряны при редактировании файлов. Поскольку водяной знак Synthid встроен в пиксели изображения, он совместим с другими подходами идентификации изображений, которые основаны на метаданных и остаются обнаруженными, даже когда метаданные теряются.
Что дальше?
Чтобы ответственно создать контент, сгенерированный AI, мы стремимся к разработке безопасных, безопасных и заслуживающих доверия подходов на каждом этапе пути-от генерации изображений и идентификации до медиа-грамотности и информационной безопасности.
Эти подходы должны быть надежными и адаптируемыми, поскольку генеративные модели продвигаются и расширяются до других сред. Мы надеемся, что наша технология Synthid может работать вместе с широким спектром решений для создателей и пользователей по всему обществу, и мы продолжаем развивать синтид, собирая обратную связь от пользователей, расширяя его возможности и изучая новые функции.
Synthid может быть расширен для использования в других моделях искусственного интеллекта, и мы взволнованы потенциалом интеграции его в большее количество продуктов Google и предоставления его третьим лицам в ближайшем будущем-дать возможность людям и организациям ответственно работать с контентом, сгенерированным AI.
Примечание. Модель, используемая для производства синтетических изображений в этом блоге, может отличаться от модели, используемой на Imagen и Vertex AI.
Благодарности
Этот проект руководил Свеном Говалом и Пушметом Кохли, с ключевыми исследованиями и инженерными вкладами (в списке алфавитно): Руди Бунель, Джейми Хейс, Сильвестре-Альвиз Рекаффи, Флориан Симберг, Дэвид Штутц и Мегана Тотакури.
Спасибо Нидхи Вьясу и Захра Ахмеду за доставку продукта; Крис Гэмбл за помощь инициировать проект; Ян Гудфелло, Крис Бреглер и Ориол Виналс за их совет. Другими участниками являются Пол Бернард, Миклос Хорват, Саймон Розен, Оливия Уайлс и Джессика Юнг. Спасибо также многим другим, которые внесли свой вклад в Google DeepMind и Google, включая наших партнеров в Google Research и Google Cloud.
Изображение металлической бабочки с водяными знаками с призматическими узорами на крыльях