Самообучающиеся агенты: как выявлять и исправлять ошибки

Предлагается методология отладки $DoVer$ (Do-then-Verify), разбивающая неудачные сессии на последовательные этапы проб, определяющая вероятные причины сбоев и генерирующая целенаправленные вмешательства, позволяющие модифицировать план или сообщения, с последующей оценкой эффективности изменений путём повторного воспроизведения траектории и измерения прогресса, где этапы планирования и перепланирования выделены синим цветом, выполнение - зеленым, предполагаемые ошибки - красным, критические сбои - темно-красным, успешное завершение - темно-зеленым, вмешательства - желтым, а новые этапы планирования и выполнения - синим и зеленым штрихом соответственно.

Новая система DoVer позволяет автоматически находить и устранять неисправности в сложных системах, основанных на взаимодействии нескольких языковых моделей.

Самостоятельность в эпоху ИИ: Как студенты учатся учиться с искусственным интеллектом

Новое исследование раскрывает ключевые аспекты проактивного взаимодействия студентов с инструментами искусственного интеллекта в образовательном процессе.

Многоликие уязвимости: проверка безопасности мультимодальных ИИ

Исследование представляет собой унифицированный бенчмарк OmniSafeBench-MM, включающий в себя 13 методов атак и 15 методов защиты, предназначенных для оценки устойчивости многомодальных систем, а также трёхмерный протокол оценки, измеряющий степень вредоносности, соответствия и детализации результатов.

Новый комплексный инструмент позволяет оценить устойчивость мультимодальных искусственных интеллектов к обходу защитных механизмов и вредоносным запросам.

Управляемые системы: от классики до машинного обучения

В рамках идентификации систем, предложены подходы к наложению свойств, ориентированных на управление, в оптимизационной формулировке, что позволяет добиться желаемого поведения и устойчивости системы, определяемых через целевую функцию и ограничения, выраженные математически, например, как $J(x) = \frac{1}{2} ||Ax - b||^2$ с учетом ограничений равенства $Ax = b$.

В статье представлен обзор современных методов идентификации систем, ориентированных на задачи управления и обеспечивающих гарантии стабильности и производительности.

От подсказок к понятиям: эволюция сегментации изображений

Несмотря на общую направленность, переход от SAM2 к SAM3 связан с фундаментальным разрывом в архитектуре и концепции сегментации, проявляющимся в различиях в целях оптимизации, методах мультимодального промтинга, пространствах семантических вложений, декодировании в стиле DETR, моделировании неоднозначности и подходе к представлению на основе PE, что препятствует переносу экспертизы между этими системами.

Новое исследование раскрывает ключевые различия между моделями сегментации изображений, переходящими от управления через подсказки к пониманию концепций, и объясняет, почему старые подходы больше не работают.

Искусственный интеллект на страже: от анализа до автономной защиты

В статье прослеживается эволюция систем искусственного интеллекта в сфере кибербезопасности, способных самостоятельно анализировать угрозы и принимать решения.

За пределами токенов: обучение генерации точных числовых значений

Модель регрессии, основанная на декодировании, преобразует входной вектор $\mathbf{x}$ в компактное представление $\phi(\mathbf{x})$, которое затем декодируется в несколько дискретных последовательностей (например, бинарное представление <1><1><0>), преобразуемых в скалярные значения $\hat{y}\_{1}=6,\hat{y}\_{2}=5,\hat{y}\_{3}=7$ и агрегируемых, например, с помощью медианы, для получения итоговой предсказания $\hat{y}=6$.

Новый подход, объединяющий обучение с подкреплением и регрессию на основе генеративных моделей, позволяет значительно повысить точность численных прогнозов.

Вместе к пониманию: как люди и ИИ могут строить общую картину мира

Новый подход к взаимодействию человека и искусственного интеллекта предлагает совместное формирование и критическую оценку моделей мира и целей, а не просто следование командам.