Best-of-N Jailbreak: простое случайное изменение входных данных и многократные попытки заставить основные системы ИИ преодолеть ограничения безопасности и вызвать вредные реакции.
В последние годы, с быстрым развитием генеративного ИИ (GAI) и больших языковых моделей (LLM), вопросы их безопасности и надежности привлекают большое внимание. В недавнем исследовании был обнаружен метод, названный Best-of-N jailbreak (сокращенно BoN)...