Исследователи антропного анализа раскрывают инновационные методы для обнаружения скрытых целей в системах ИИ, обучая Клода скрывать свои истинные цели, прежде чем успешно открыть их с помощью инновационных методов аудита, которые могут трансформировать стандарты AI -безопасности. Читать далее
Source link
