Материалы будущего: Искусственный интеллект на службе твёрдотельной химии

Новая система, основанная на принципах агентных систем и больших языковых моделей, автоматизирует сложные квантово-химические расчёты для ускорения открытия новых материалов.

Глубина Мысли: Как Увеличить Рассуждения Искусственного Интеллекта

Предложенное «Турбо-соединение» для трансформаторов представляет собой концептуальную разработку, направленную на оптимизацию архитектуры и повышение эффективности обработки информации в нейронных сетях.

Новый подход позволяет значительно расширить возможности больших языковых моделей в решении сложных задач, не увеличивая при этом вычислительные затраты.

Видео без границ: Vision Transformer для сегментации и анализа движения

Современные методы видеосегментации, представленные, например, архитектурой CAVIS, уступают упрощенному подходу VidEoMT, использующему исключительно энкодер и опирающемуся на возможности предварительно обученных vision foundation models вместо ручной настройки компонентов, что позволяет добиться эффективности благодаря силе масштабного обучения и контекстно-зависимых механизмов [latex]TF[/latex] и [latex]CA[/latex].

Новый подход позволяет использовать стандартные Vision Transformer модели не только для распознавания изображений, но и для высокоточной сегментации видео и отслеживания объектов во времени.

Языковые модели на службе науки: новый подход к открытию моделей

Модель ModelSMC, вдохновлённая последовательным Монте-Карло (SMC), итеративно уточняет начальную модель посредством отбора проб с использованием большой языковой модели (LLM) и взвешивания на основе оценки правдоподобия, стремясь к сходимости к неизвестному процессу генерации данных [latex]p(m|{\bm{x}}\_{o})[/latex] в областях высокой плотности, что позволяет автоматизировать обнаружение моделей на основе текстовых формулировок задач и контекстных данных.

Исследователи предлагают инновационный метод автоматического обнаружения научных моделей, основанный на возможностях больших языковых моделей и принципах вероятностного программирования.

Обучение языковых моделей: новый подход к стабильности

Обучение модели Qwen3-30B-A3B-Base с использованием VESPO демонстрирует стабильность даже при расхождении между процессами обучения и инференса, а сочетание VESPO с R2 позволяет достичь наилучших результатов.

Исследователи предлагают алгоритм, позволяющий стабилизировать процесс обучения больших языковых моделей с использованием методов обучения с подкреплением.

Ускорение нелинейного управления: kHz-решения для сложных систем

Исследование количества итераций алгоритмов Мехротры для решения плохо обусловленных задач квадратичного программирования с ограничениями типа

Новый подход Koopman-BoxQP позволяет решать задачи нелинейного прогнозирующего управления (NMPC) в реальном времени, открывая возможности для управления высокодинамичными и сложными системами.

Кто несет ответственность за ИИ: новый взгляд на причинно-следственные связи

Статья предлагает концепцию ‘Операционной Субъектности’ для определения ответственности за действия искусственного интеллекта, не прибегая к наделению ИИ правовым статусом.

Ложные ориентиры: Как модели «угадывают» хорошие материалы

В машинном обучении, особенно в материаловедении, модели часто обучаются предсказывать свойства материалов, но вместо поиска истинных зависимостей между структурой и свойствами, они могут использовать упрощенные паттерны в данных - например, информацию об исследовательской группе или журнале публикации - для получения хороших результатов, что соответствует эффекту «Умного Ханса» и требует проверки альтернативных объяснений высокой производительности модели.

Новое исследование показывает, что алгоритмы машинного обучения в материаловедении могут достигать высоких результатов, опираясь на случайные корреляции в данных, а не на реальные свойства материалов.