Нейронные сети и квантовая химия: новый детерминированный подход

Исследователи разработали детерминированный метод оптимизации нейронных квантовых состояний, позволяющий добиться высокой точности при моделировании сильно коррелированных систем.

Искореняя галлюцинации: как обеспечить достоверность систем генерации на основе поиска

Единый конвейер атрибуции больших языковых моделей позволяет комплексно оценивать вклад различных компонентов в процесс генерации текста, обеспечивая прозрачность и контроль над работой сложных систем искусственного интеллекта.

В статье представлен обзор методов атрибуции, направленных на снижение количества недостоверной информации, выдаваемой системами генерации, использующими поиск релевантных знаний.

Ускорение сжатия изображений: новый взгляд на оптимизацию второго порядка

Наблюдаемые зависимости

Исследование показывает, как использование оптимизатора второго порядка значительно повышает эффективность и скорость обучения моделей сжатия изображений.

Долгоиграющая память: Новый тест для ИИ-агентов

Исследователи представили AgentLongBench — комплексную платформу для оценки способности ИИ-агентов эффективно обрабатывать и использовать большие объемы информации в динамичной среде.

Виртуальные сенсоры: новая эра интеллектуального мониторинга

В отличие от современных подходов, обучающих и развертывающих отдельные модели для каждого виртуального сенсора, представленная работа объединяет несколько сенсоров в единую модель, используя их синергию для достижения превосходной масштабируемости и эффективности, при этом система самостоятельно определяет релевантные входные сигналы и выборочно прогнозирует показания сенсоров, повышая объяснимость и избавляя от необходимости в экспертных знаниях.

Исследователи представляют единую модель для виртуальных сенсоров, обеспечивающую значительное повышение эффективности и масштабируемости за счет использования общих знаний и фокусировки на релевантных сигналах.

Предсказуемость материалов: новый взгляд на нейронные сети

Исследование демонстрирует потенциал Kolmogorov-Arnold Networks (KAN) как альтернативного подхода к прогнозированию свойств материалов, предлагая повышенную эффективность и интерпретируемость.

Искусственный интеллект проверяет знания: новый подход к оценке компетенций

Скорость прогрессии иерархического цветения, как показано в исследовании, варьируется в зависимости от условий, что указывает на чувствительность этого процесса к внешним факторам и потенциальную возможность его регулирования.

Представлен фреймворк BloomQA, позволяющий автоматически создавать качественные и валидные тесты для оценки возможностей языковых моделей в практических областях.

Память о прошлом: Как использовать кэш KV для повышения интеллекта языковых моделей

Изучение потребления видеопамяти [latex]VRAM[/latex] для модели Qwen3-32B демонстрирует, что добавление скрытых состояний к кешу [latex]KV[/latex] значительно увеличивает использование памяти по сравнению с использованием только кеша [latex]KV[/latex], что указывает на компромисс между вычислительной эффективностью и потреблением ресурсов.

Новое исследование показывает, что кэш KV, традиционно применяемый для ускорения генерации текста, может быть перепрофилирован для задач самооценки и адаптивного рассуждения, открывая новые возможности для эффективного использования ресурсов.