Нейронные сети и квантовая химия: новый детерминированный подход
Исследователи разработали детерминированный метод оптимизации нейронных квантовых состояний, позволяющий добиться высокой точности при моделировании сильно коррелированных систем.
Исследователи разработали детерминированный метод оптимизации нейронных квантовых состояний, позволяющий добиться высокой точности при моделировании сильно коррелированных систем.

В статье представлен обзор методов атрибуции, направленных на снижение количества недостоверной информации, выдаваемой системами генерации, использующими поиск релевантных знаний.

Исследование показывает, как использование оптимизатора второго порядка значительно повышает эффективность и скорость обучения моделей сжатия изображений.
Исследователи представили AgentLongBench — комплексную платформу для оценки способности ИИ-агентов эффективно обрабатывать и использовать большие объемы информации в динамичной среде.
![Обучение с учётом квантования демонстрирует два подхода: прямое обучение с предсказанием следующего токена, использующее перекрёстную энтропию на целевых данных, и дистилляцию знаний, где полноточная модель-учитель предоставляет «мягкие» метки, оптимизируемые посредством расхождения Кульбака-Лейблера [latex]KL divergence[/latex].](https://arxiv.org/html/2601.20088v1/x1.png)
Новый метод позволяет эффективно восстановить производительность больших языковых моделей, оптимизированных для работы с 4-битными вычислениями.

Исследователи представляют единую модель для виртуальных сенсоров, обеспечивающую значительное повышение эффективности и масштабируемости за счет использования общих знаний и фокусировки на релевантных сигналах.

В статье представлен детальный обзор и оценка четырех популярных фреймворков для организации и автоматизации жизненного цикла машинного обучения.
Исследование демонстрирует потенциал Kolmogorov-Arnold Networks (KAN) как альтернативного подхода к прогнозированию свойств материалов, предлагая повышенную эффективность и интерпретируемость.

Представлен фреймворк BloomQA, позволяющий автоматически создавать качественные и валидные тесты для оценки возможностей языковых моделей в практических областях.
![Изучение потребления видеопамяти [latex]VRAM[/latex] для модели Qwen3-32B демонстрирует, что добавление скрытых состояний к кешу [latex]KV[/latex] значительно увеличивает использование памяти по сравнению с использованием только кеша [latex]KV[/latex], что указывает на компромисс между вычислительной эффективностью и потреблением ресурсов.](https://arxiv.org/html/2601.20326v1/x1.png)
Новое исследование показывает, что кэш KV, традиционно применяемый для ускорения генерации текста, может быть перепрофилирован для задач самооценки и адаптивного рассуждения, открывая новые возможности для эффективного использования ресурсов.