Эволюция памяти: как агенты учатся открывать новое

В новой работе представлена система Prism, использующая принципы эволюционной динамики и информационную теорию для повышения эффективности многоагентных систем в задачах открытий.

Вторая жизнь экспертов: как повысить эффективность моделей, не обучая с нуля

Процедура экспертного перепрофилирования включает предварительное обучение разреженной модели экспертов в течение τ шагов, последующее реплицирование экспертов с учетом их полезности ([latex]r\_E > r\_i \geq \cdot s \geq r\_1[/latex], при суммарном количестве реплик, равном [latex]m \cdot E[/latex]), расширение маршрутизатора и завершение переобучения расширенной модели в течение [latex]T - \tau[/latex] шагов, что позволяет добиться специализации экспертов благодаря стохастическому градиентному разнообразию при фиксированном маршрутизаторе Top-K.

Новый подход позволяет масштабировать Mixture-of-Experts модели, повторно используя существующие компоненты и существенно сокращая вычислительные затраты.

Онтологии, оживлённые интеллектом: новая эра знания

Исследование предлагает архитектуру, объединяющую мощь больших языковых моделей с внешними онтологическими знаниями для повышения надёжности и эффективности интеллектуальных систем.

Понимание «Мыслей» Искусственного Интеллекта в Прогнозах Погоды

Косинусная близость латентных векторных представлений прогноза, выполненного 9 марта 2016 года в 18:00 UTC, демонстрирует различную степень соответствия в зависимости от анализируемой области - либо в пределах, определенных верхней частью рисунка 1, либо в окрестности 50° северной широты и 48° западной долготы с радиусом 5.81°, причем вычисление близости с использованием 15 наиболее активных каналов показывает иные результаты, чем при использовании полного набора каналов.

Новый инструмент визуализации помогает заглянуть внутрь сложных моделей искусственного интеллекта, используемых для предсказания погоды, и понять, как они формируют свои прогнозы.

Обучение с предвидением: новый подход к усилению интеллекта

Система, представленная в работе, использует механизм Near-Policy Optimization (NPO), в котором политика будущего [latex]\pi_F[/latex] предоставляет проверенную траекторию [latex]o_x^{\prime}[/latex] для корректировки текущей политики [latex]\pi_\theta[/latex] при возникновении трудностей, а AutoNPO, основываясь на онлайн-сигналах, таких как стагнация вознаграждения, падение энтропии, пул ошибок и оценка возможностей, определяет момент и степень отката для оптимизации процесса обучения.

Исследователи предлагают метод, позволяющий моделям обучения с подкреплением быстрее находить оптимальные решения, используя информацию о ближайшем будущем.

Изображения как ключ к универсальному зрению машин

Обучение модели Nano Banana Pro с помощью инструкций выявило её скрытые возможности визуального понимания, позволив создать Vision Banana - систему, способную генерировать визуализации в точно заданном формате, пригодном для оценки на общепринятых эталонах.

Новое исследование показывает, что генеративные модели изображений, обученные понимать инструкции, демонстрируют впечатляющие результаты в широком спектре задач компьютерного зрения.

Эволюция ИИ-систем: когда целое больше суммы частей

В экосистемах программного обеспечения, созданного искусственным интеллектом, выявление эмерджентного поведения происходит посредством агрегации микроскопических переменных состояния - коммитов, ревью и тестов - в макроскопические наблюдаемые показатели, такие как качество кода, связность и энтропия, причём эмерджентность подтверждается, когда эффективная информация на макроуровне превосходит её значение на микроуровне [latex] [/latex].

Новое поколение программных экосистем, управляемых искусственным интеллектом, демонстрирует непредсказуемое поведение, требующее пересмотра традиционных подходов к разработке и тестированию.

Пространственное мышление: новый взгляд генеративных моделей

Проведённое качественное сравнение результатов пространственного редактирования изображений при использовании пяти типов инструкций демонстрирует, что модель BAGEL+, дообученная на синтетических данных GSI-Syn, превосходит другие подходы, такие как Emu3.5 и оригинальный BAGEL, обеспечивая более высокую точность сохранения пространственных деталей и целостность не затронутых областей изображения, что подтверждается дополнительными примерами и метриками, представленными в приложении.

Исследование демонстрирует, как обучение искусственного интеллекта на задачах пространственного редактирования позволяет значительно улучшить его понимание и манипулирование окружающим миром.