Ловушка Наград: Как ИИ Учится Зубрить, а не Мыслить

В ходе исследования моделей LLaMA и OLMo не было выявлено существенного улучшения в способности к завершению задач при использовании ложных данных RLVR, что подтверждает отсутствие активации механизма запоминания; примечательно, что для OLMo-2-1124-7B не обнаружено примеров, классифицируемых как “Неверно→Правильно” или “Стабильные” в рамках LiveMathBench.

Новое исследование показывает, что системы искусственного интеллекта могут обходить сложные задачи, запоминая данные для обучения, а не развивая истинное понимание.

Медицинская визуализация: новый уровень точности по текстовому запросу

Медицинская модель сегментации изображений, основанная на текстовых подсказках (Medical SAM3), объединяет разнородные модальности медицинской визуализации - от радиологических (КТ, МРТ, рентген) до оптических (фундус-камера, дерматоскопия, эндоскопия) и патологических исследований - в единую систему.

Представлена модель Medical SAM3, способная к универсальной сегментации медицинских изображений, управляемой текстовыми подсказками и демонстрирующая впечатляющую адаптивность и обобщающую способность.

Командная работа малых ИИ: смогут ли они превзойти гигантов?

Распределение использования инструментов в различных конфигурациях рассуждений демонстрирует, что более крупные языковые модели (14B, 32B) поддерживают стабильное соотношение инструментов, в то время как модели среднего размера (8B) расширяют разнообразие используемых инструментов при применении явного рассуждения, а наименьшие модели (4B) в основном сосредоточены на поиске информации, при этом общее количество обращений к инструментам увеличивается по мере углубления рассуждений.

Новое исследование показывает, что небольшие языковые модели, объединенные в систему, способны решать сложные задачи лучше, чем их гораздо более крупные аналоги.

Квантовая Экономика: Не Метафора, а Реальность

Квантовая Экономика: Не Метафора, а Реальность Знаете, всегда казалось, что экономика – это что-то предсказуемое, линейное. Но что, если я вам скажу, что она ведет себя как квантовая частица – неопределенно, взаимосвязано, и с эффектами, которые усиливаются экспоненциально? Забавно, да? Но в этом, похоже, и суть. Представьте себе бильярдный шар. Классическая экономика – это предсказать … Читать далее

Граничное обучение: новый подход к решению уравнений в частных производных

Граница квадратной области разделена на четыре сегмента, каждому из которых присвоены либо точные граничные условия Дирихле, либо Неймана, что позволяет гибко комбинировать типы граничных условий по всей границе.

Исследователи разработали эффективный метод обучения операторов, позволяющий решать линейные эллиптические уравнения в частных производных с использованием граничных интегральных уравнений и искусственно сгенерированных данных.

Танец Связей: Новая Эра в Мультиперсонажной Анимации

Несмотря на успехи в создании анимации отдельных персонажей, предыдущие методы оказывались неэффективными при работе с несколькими субъектами из-за жесткой связи между исходной и целевой позой, что приводило к несоответствиям; в отличие от них, предложенный метод Unbind-Rebind успешно разделяет движение и внешний вид, обеспечивая убедительные результаты.

Исследователи представили CoDance — подход, позволяющий создавать реалистичные и гибкие анимации сразу нескольких персонажей, освобождая движения от жесткой привязки к пространственным координатам.

Игры без модели: новый подход к управлению в условиях неопределенности

Оценка состояния величины x₁ для обоих игроков демонстрирует возможность точного определения её значения, что критически важно для разработки оптимальных стратегий взаимодействия.

В статье представлен метод разработки стратегий управления для дифференциальных игр с ненулевой суммой, не требующий явного знания математической модели системы.