Неопределенность как ресурс: Управление агентами искусственного интеллекта

Для преодоления спирали галлюцинаций в долгосрочных агентах, предложен фреймворк AUQ, преобразующий вербализованную неопределённость в активные, двунаправленные сигналы управления, включающие в себя две взаимодополняющие системы: Система 1 (Неопределённость-Осведомлённая Память, UAM), неявно распространяющая вербализованную уверенность и семантические объяснения для предотвращения слепого принятия решений, и Система 2 (Неопределённость-Осведомлённая Рефлексия, UAR), использующая эти объяснения в качестве рациональных сигналов для запуска целенаправленного разрешения неопределённости во время вывода только при необходимости, что позволяет агенту динамически балансировать между эффективным выполнением и глубоким размышлением.

Новый подход позволяет преобразовывать неопределенность в долгосрочных планах агентов искусственного интеллекта в управляемые сигналы, повышая их надежность и точность.

Физика в Машинах: Проверка на Понимание Мира

Разработанная структура PhysicsMind объединяет в себе базовую модель с набором данных, сформированным с учётом законов физики, экспертно проверенными аннотациями и разнообразными контролируемыми сценариями, что позволяет достичь надёжного понимания видео и оценки, учитывающей физические принципы.

Новый бенчмарк PhysicsMind позволяет оценить, насколько хорошо современные модели искусственного интеллекта понимают законы физики и предсказывают поведение объектов в реальном мире.

Быстрые вычисления: новый подход к линейной алгебре в глубоком обучении

В исследовании архитектуры RandMultiHeadAttention системы Panther демонстрируется, что применение линейного внимания Performers (Choromanski et al., 2022) позволяет существенно снизить потребление памяти во время прямого прохода по сравнению со стандартной реализацией в PyTorch, особенно при увеличении длины последовательности, числа голов внимания и использовании случайных признаков, при фиксированной размерности встраивания в 512.

Библиотека Panther позволяет значительно сократить вычислительные затраты и объем памяти при обучении нейронных сетей, используя методы случайной численной линейной алгебры.

Искусственный интеллект меняет научные горизонты: влияние больших языковых моделей на финансирование исследований в США

Наблюдается стремистый рост использования больших языковых моделей (БЯМ) в финансируемых федеральными агентствами США исследованиях, что подтверждается анализом данных NSF за период с 2021 по 2025 год и локально взвешенными регрессиями, при этом особенно заметный скачок произошел после публичного релиза ChatGPT 30 ноября 2022 года.

Новое исследование показывает, как появление мощных моделей искусственного интеллекта трансформирует систему федерального финансирования научных разработок в Соединенных Штатах.

Искусственный интеллект в обучении: как правильно задавать вопросы

Новое исследование показывает, что качество вопросов, генерируемых языковыми моделями для образовательных целей, напрямую зависит от используемых методов разработки запросов.

Искусственный интеллект на страже здоровья: баланс между безопасностью и конфиденциальностью

В статье рассматриваются методы ответственного внедрения искусственного интеллекта в здравоохранение, обеспечивающие защиту данных пациентов и соблюдение нормативных требований.

Искусственный взгляд: Новый тест для поиска изображений, собранных из частей

В рамках исследования была предложена новая таксономия запросов, обеспечивающая сбалансированное распределение запросов EDIR по пяти основным и пятнадцати подкатегориям, что демонстрирует возможность детализированной классификации и позволяет оценить нюансы в задачах поиска изображений по текстовому описанию.

Исследователи представили EDIR — принципиально новый способ оценки систем поиска по изображениям, учитывающий сложность композитных сцен.