Долгоиграющая память: Новый тест для ИИ-агентов
Исследователи представили AgentLongBench — комплексную платформу для оценки способности ИИ-агентов эффективно обрабатывать и использовать большие объемы информации в динамичной среде.
Исследователи представили AgentLongBench — комплексную платформу для оценки способности ИИ-агентов эффективно обрабатывать и использовать большие объемы информации в динамичной среде.
![Обучение с учётом квантования демонстрирует два подхода: прямое обучение с предсказанием следующего токена, использующее перекрёстную энтропию на целевых данных, и дистилляцию знаний, где полноточная модель-учитель предоставляет «мягкие» метки, оптимизируемые посредством расхождения Кульбака-Лейблера [latex]KL divergence[/latex].](https://arxiv.org/html/2601.20088v1/x1.png)
Новый метод позволяет эффективно восстановить производительность больших языковых моделей, оптимизированных для работы с 4-битными вычислениями.

Исследователи представляют единую модель для виртуальных сенсоров, обеспечивающую значительное повышение эффективности и масштабируемости за счет использования общих знаний и фокусировки на релевантных сигналах.

В статье представлен детальный обзор и оценка четырех популярных фреймворков для организации и автоматизации жизненного цикла машинного обучения.
Исследование демонстрирует потенциал Kolmogorov-Arnold Networks (KAN) как альтернативного подхода к прогнозированию свойств материалов, предлагая повышенную эффективность и интерпретируемость.

Представлен фреймворк BloomQA, позволяющий автоматически создавать качественные и валидные тесты для оценки возможностей языковых моделей в практических областях.
![Изучение потребления видеопамяти [latex]VRAM[/latex] для модели Qwen3-32B демонстрирует, что добавление скрытых состояний к кешу [latex]KV[/latex] значительно увеличивает использование памяти по сравнению с использованием только кеша [latex]KV[/latex], что указывает на компромисс между вычислительной эффективностью и потреблением ресурсов.](https://arxiv.org/html/2601.20326v1/x1.png)
Новое исследование показывает, что кэш KV, традиционно применяемый для ускорения генерации текста, может быть перепрофилирован для задач самооценки и адаптивного рассуждения, открывая новые возможности для эффективного использования ресурсов.
Квантовый Переворот: От Теории к Реальности Вот парадокс: мы говорим о революционных технологиях, которые большинство людей даже не могут представить. Как объяснить квантовый мир, не усугубив непонимание? Это как пытаться описать цвет кому-то, кто никогда не видел света. Представьте себе, что вы пытаетесь настроить радио. Классический компьютер – это как поиск нужной станции, перебирая их … Читать далее

Исследователи представили комплексный инструмент для оценки способности систем находить ошибки в научных публикациях и повышать качество автоматической проверки.
![Оптимизация размера пакета позволила выявить оптимальные значения для катиона Зундела, воды и пара-H2, обеспечивающие максимальную эффективность сэмплирования [latex] ESS/sec [/latex] на графическом процессоре NVIDIA RTX 5090, демонстрируя возможность тонкой настройки производительности алгоритма GG-PI в зависимости от исследуемой системы.](https://arxiv.org/html/2601.20228v1/figs/SI/ess_ggpi.png)
Исследователи разработали метод, позволяющий извлекать информацию о квантовых свойствах молекул из классических симуляций, значительно ускоряя процесс моделирования.