Самовосстанавливающийся код: Новый подход к автоматическому исправлению ошибок

Архитектура HAFixAgent демонстрирует принципиальную возможность систематического анализа и исправления уязвимостей, выстраивая рабочий процесс, в котором каждый компонент служит для реверс-инжиниринга и нейтрализации потенциальных угроз.

Исследователи разработали систему, использующую историю изменений кода для более эффективного поиска и устранения ошибок в программах.

Неидеальные злодеи: Почему языковым моделям сложно играть отрицательных персонажей

По мере снижения морального уровня персонажа — от безупречного до злодейского — большинство языковых моделей демонстрируют заметное ухудшение качества ролевой игры, что указывает на общую сложность убедительного воплощения морально неоднозначных или злобных личностей.

Исследование показывает, что современные языковые модели испытывают трудности с убедительным изображением злодеев из-за конфликта между встроенными ограничениями безопасности и необходимостью симуляции негативных черт характера.

Научная оценка идей: изменчивость со временем

Интервал между волнами демонстрирует временную зависимость, определяющую динамику распространения и взаимодействия волновых процессов.

Исследование показывает, что человеческое восприятие научных идей не является постоянным, что создает проблемы для систем искусственного интеллекта, обучающихся на фиксированных предпочтениях.

Взлом в стоге сена: как длинный контекст обходит защиту языковых моделей

В исследовании длинных контекстов обнаружено, что модели Llama-3 и Qwen2.5 демонстрируют различную динамику компромисса между способностью и безопасностью: Llama-3 показывает последовательное снижение как успешности (ASR), так и частоты отказов по мере смещения цели запроса к концу контекста, в то время как Qwen2.5 выявляет эффект

Исследование показывает, что увеличение объема вводного текста может значительно снизить безопасность больших языковых моделей, делая их уязвимыми для атак, направленных на обход встроенных ограничений.