Избавляем нейросети от лишних знаний: методы редактирования моделей

Новое исследование рассматривает, как можно целенаправленно удалять информацию из больших языковых моделей, не переобучая их целиком.

Новое исследование рассматривает, как можно целенаправленно удалять информацию из больших языковых моделей, не переобучая их целиком.

Исследователи разработали метод предварительного обучения, позволяющий моделям биологических последовательностей самостоятельно выявлять и исправлять ошибки в процессе анализа.

Новое исследование показывает, что для передачи навыков логического мышления от больших языковых моделей достаточно анализировать лишь начальные этапы процесса рассуждения.
Новое исследование показывает, как современные алгоритмы обработки языка могут значительно повысить точность прогнозирования эффективности терапии рака легких.
![Иерархическая оптимизация рангов и динамическая адаптация в HyDRA позволяют эффективно настроить мобильные визуально-языковые модели (VLM) посредством обучения с подкреплением, где [latex]X_{t}[/latex] и [latex]X_{v}[/latex] обозначают текстовые и визуальные токены соответственно, а ранги, такие как [latex]R^{Up}[/latex], [latex]R^{Q}[/latex], [latex]R^{K}[/latex] и [latex]R^{Gate}[/latex], регулируют проецирование в полносвязных сетях.](https://arxiv.org/html/2512.20674v1/x2.png)
Новый подход HyDRA позволяет эффективно настраивать модели, объединяющие зрение и язык, для работы на мобильных платформах, не увеличивая количество обучаемых параметров.

Новый подход к формальной верификации глубоких нейронных сетей с использованием ранних выходов позволяет повысить эффективность проверки, не жертвуя безопасностью.
В статье представлена методика анализа вычислительной сложности, основанная на понятии смешанных частных производных полиномов и их ранга.

Новый подход к предварительной обработке визуальных данных позволяет значительно ускорить работу моделей, понимающих изображения и текст, без изменения их архитектуры.

В статье представлен инновационный многозадачный метод распознавания таблиц, сочетающий структурный и контентный анализ для повышения эффективности.
![Исследование причинно-следственных связей в обучении с подкреплением выявляет способность системы к обобщению, формируя запросы на ассоциации, вмешательства и контрфакты - выраженные, например, как [latex]p(v_i | do(v_j = c))[/latex] - для анализа обобщения на разных уровнях и выявления потенциальных уязвимостей в архитектуре системы.](https://arxiv.org/html/2512.20760v1/x2.png)
Новое исследование показывает, как комбинация обучения с подкреплением и верифицируемых наград может значительно улучшить обобщающую способность моделей при решении задач, требующих причинно-следственного анализа.