Взлом в стоге сена: как длинный контекст обходит защиту языковых моделей

Исследование показывает, что увеличение объема вводного текста может значительно снизить безопасность больших языковых моделей, делая их уязвимыми для атак, направленных на обход встроенных ограничений.






