Взлом в стоге сена: как длинный контекст обходит защиту языковых моделей

В исследовании длинных контекстов обнаружено, что модели Llama-3 и Qwen2.5 демонстрируют различную динамику компромисса между способностью и безопасностью: Llama-3 показывает последовательное снижение как успешности (ASR), так и частоты отказов по мере смещения цели запроса к концу контекста, в то время как Qwen2.5 выявляет эффект

Исследование показывает, что увеличение объема вводного текста может значительно снизить безопасность больших языковых моделей, делая их уязвимыми для атак, направленных на обход встроенных ограничений.

Квантовый расчет опционов: новый подход к моделированию волатильности

Формулировки дифференциальных уравнений для оценки опционов демонстрируют два взаимодополняющих подхода: моделирование движения базового актива вперед во времени и распространение стоимости опциона назад от даты погашения, при этом связь между ними устанавливается через уравнение Колмогорова и формулу Фейнмана-Каца, позволяя точно определить ожидаемую выплату опциона с учетом безрисковой процентной ставки.

Исследование предлагает квантовый алгоритм для оценки стоимости опционов с учетом локальной волатильности, открывая перспективы для ускорения финансовых расчетов.

Квантовые схемы учатся сами: новый подход к архитектурному поиску

Гибридная система обучения с подкреплением, представленная в данной архитектуре, не просто конструирует квантовую схему, но и выращивает ее, кодируя информацию о предыдущих шагах, генерируя дискретные и непрерывные параметры управления, и используя полученную обратную связь из среды для итеративного обновления политики, предсказывая тем самым будущие точки отказа и адаптируясь к ним.

Исследователи разработали метод, позволяющий алгоритмам машинного обучения самостоятельно проектировать оптимальные квантовые схемы для решения сложных задач.

Критический взгляд: как самооценка улучшает ответы больших языковых моделей

Модель CritiCal, работающая на базе DeepSeek-R1-Distill-Qwen-7B, демонстрирует значительный потенциал в улучшении калибровки уверенности больших языковых моделей даже при использовании в качестве учителя модели с худшими показателями, что указывает на возможность повышения надежности систем в условиях неидеальных исходных данных.

Исследование показывает, что обучение моделей с использованием естественных языковых оценок помогает им лучше оценивать свою уверенность в ответах.

Причинность и обучение представлений: новый взгляд на биомедицинские данные

Графическая модель демонстрирует, что обучение представлений, основанное на причинно-следственных связях, позволяет системам не просто адаптироваться к данным, но и понимать лежащие в их основе механизмы, обеспечивая устойчивость и гибкость в меняющейся среде.

Исследование посвящено методам выявления причинно-следственных связей и разработки эффективных алгоритмов обучения, применимых к сложным биомедицинским задачам.