Геометрия устойчивости: новый взгляд на представления в нейросетях

Тепловая карта геометрической устойчивости демонстрирует зависимость стабильности алгоритмов от семейства и набора данных, где красным цветом обозначены неустойчивые конфигурации, а зеленым - стабильные.

Исследование представляет метрику Shesha, позволяющую оценить стабильность геометрической структуры представлений, и демонстрирует её превосходство в прогнозировании устойчивости моделей и выявлении изменений в процессе обучения.

Рассуждения врача в цифре: Новый тест для ИИ

Исследователи представили новый комплексный тест, позволяющий оценить способность искусственного интеллекта анализировать медицинские записи и принимать обоснованные решения.

Обучение рассуждению: новый подход к длинным цепочкам мыслей

Исследование демонстрирует, как изменение температуры при выборке данных из модели Qwen3-Next-80B-A3B-Thinking влияет на распределение вероятностей и, как следствие, на величину функции потерь при обучении, раскрывая чувствительность модели к параметрам генерации.

Исследователи разработали эффективный метод дистилляции знаний, позволяющий создавать компактные модели, превосходящие существующие в задачах сложного логического мышления.

Голос Культуры в Эпоху ИИ: Африканский Опыт

Первая Африканская Летняя Школа Цифрового Гуманизма выявила критические пробелы в способности современных генеративных моделей искусственного интеллекта понимать и воспроизводить культурно обусловленные формы общения.

Предвидеть, чтобы Действовать: Обучение Агентов с Адаптивным Планированием

Предложенная схема Imageine-then-Plan (ITP) включает две модификации - ITP\texttt{ITP}\_{\text{I}}, не требующую предварительного обучения и позволяющую агентам, управляемым большими языковыми моделями, обучаться посредством воображения непосредственно в процессе работы, и ITP\texttt{ITP}\_{\text{R}}, использующую смоделированные сценарии будущего для более эффективной и экономичной оптимизации стратегии действий.

Новый подход позволяет агентам, основанным на больших языковых моделях, более эффективно планировать свои действия, используя возможности предсказания и моделирования окружающего мира.

Искусственный интеллект на страже беспроводной связи: новый подход к моделированию каналов

Парадигма, представленная на рисунке, демонстрирует, как искусственный интеллект позволяет выводить информацию о каналах связи, формируя основу для адаптивных и интеллектуальных коммуникационных систем.

В статье представлен инновационный подход к прогнозированию характеристик беспроводных каналов связи, основанный на применении методов искусственного интеллекта.