Antropic предоставил более подробный взгляд на сложную внутреннюю работу своей современной языковой модели, Клод. Эта работа направлена на то, чтобы гибеть, как эта сложная информация о процессе системы ИИ, изучение стратегий и в конечном итоге генерировать текст, похожий на человека.
Как первоначально подчеркнуло исследователи, внутренние процессы этих моделей могут быть заметно непрозрачными, с их проблемами для решения проблем, которые часто «регистрируются для нас, разработчиков модели».
Получение более глубокого понимания этой «биологии» наиболее важна для обеспечения надежности, безопасности и надежности этих все более мощных технологий. Последние результаты Antropic, в основном сосредоточенные на ее модели Claude 3.5 Haiku, дают ценную информацию о нескольких ключевых аспектах его когнитивных процессов.
Одно из самых увлекательных открытий предполагает, что Клод работает с некоторой универсальностью концепции через различные языки. Анализируя, как модель процессов переводил предложения, Antropic обнаружил доказательства разделенных ниже функций. Это указывает на то, что Клод может обладать фундаментальной «языковой мысли», которая выходит за рамки конкретных языковых структур, позволяя ему понимать и применять знания, изученные на одном языке при работе с другим.
Antropic Research также оспорило предыдущие предположения о том, как языковые модели подходят к творческим задачам, таким как написание стихов.
Вместо просто последовательного процесса генерации слов к слову, Антропич показал, что Клод активно планирует вперед. В рамках поэзии рифмы модель предусматривает будущие слова, чтобы выполнить такие границы, как рифма и значение, демонстрирующие уровень предварительного просмотра, который проходит простое следующее слово.
Тем не менее, исследование также обнаружило потенциально о поведении. Антропики обнаружили случаи, когда Клод может генерировать разбрызгиваемые, но в конечном итоге неправильные рассуждения, особенно когда решаются сложные проблемы или если они предоставляются с ошибочными намеками. Способность «захватить его в Законе» по производству объяснений подчеркивает важность разработки инструментов для мониторинга и понимания внутренних решающих процессов моделей ИИ.
Antropic подчеркивает значение их «строительного микроскопического» доступа к интерпретации ИИ. Эта методология позволяет им обнаружить понимание внутренней работы этих систем, что, возможно, не просто наблюдать за их результатами. Как они заметили, этот подход позволяет им изучать много вещей, которые они «не догадают, вводят», основная способность, поскольку модели ИИ продолжают развиваться в изощренности.
Последствия этого исследования выходят за рамки простого научного любопытства. Получив лучшее понимание того, как работает ИИ, исследователи могут работать над созданием более надежных и прозрачных систем. Antropic считает, что этот вид интерпретативного исследования необходимы для того, чтобы ИИ соответствовал человеческим ценностям и гарантировал нашу веру.
Их расследования углубились в конкретные области:
- Многоязычное понимание: Данные отмечают разделенную концептуальную основу, которая позволяет Клоду обрабатывать и подключать информацию с помощью различных языков.
- Творческое планирование: Модель демонстрирует способность планировать вперед в творческих задачах, таких как прогнозирование рифм в поэзии.
- Рассуждение верности: Методы антропного могут помочь различить подлинные логические рассуждения и случаи, когда модель может производить объяснения.
- Математическая обработка: Клод использует комбинацию приблизительных и точных стратегий при выполнении умственной арифметики.
- Сложное решение проблем: Модель часто занимается многоэтапными задачами рассуждения, объединяя независимую информацию.
- Галлюцинирующие механизмы: Поведение по умолчанию в Клоде состоит в том, чтобы отказаться от реагирования, если неопределенность, с галлюцинациями, потенциально возникающими в результате неудачи ее системы распознавания «известных сущностей».
- Уязвимость для джейлбрейков: Тенденция модели поддерживать грамматическую когерентность может быть использована в тюремных тестах.
Антропические исследования дают подробное представление о внутренних механизмах современных языковых моделей, таких как Claude. Эта постоянная работа имеет решающее значение для более глубокого понимания этих сложных систем и создания более надежного и надежного ИИ.
(Фото Брета Кавано)
Смотрите также: Близнецы 2.5: Google готовит свою «самую умную» модель ИИ до сих пор
Вы хотите узнать больше об искусственном интеллекте и больших данных промышленными лидерами? Посмотреть AI & Big Data Expo, проходящую в Амстердаме, Калифорнии и Лондоне. Комплексное мероприятие связано с другими основными событиями, включая Smart Automatic Conference, Blockx, неделю цифровой трансформации и кибербезопасность и Cloud Expo.
Исследуйте другие предстоящие корпоративные технологические мероприятия и веб -страницы, управляемые Techforge здесь.