Код, который устаревает: Как «умные» помощники ухудшают качество программ

В ходе анализа траекторий агентов и репозиториев, созданных человеком, наблюдается монотонный рост показателей многословности и структурной эрозии у агентов, в то время как у человеческих репозиториев эти показатели стабилизируются, что указывает на принципиальное различие в динамике развития кода, подтвержденное 95% доверительным интервалом.

Новое исследование показывает, что при многократном самосовершенствовании, код, сгенерированный языковыми моделями, неизбежно становится более сложным и громоздким.

За пределами автоматизации: как сделать анализ данных инструментом для мышления

Новый подход к построению процессов анализа данных с использованием промежуточных, понятных человеку результатов позволяет пользователям лучше понимать логику работы ИИ и вносить свой вклад в принятие решений.

Проверка на прочность: Эволюционный поиск уязвимостей в сложных ИИ-агентах

Сравнительный анализ демонстрирует различия между подходами к тестированию на устойчивость больших языковых моделей (LLM) - через диалоговое взаимодействие и через использование LLM в качестве автономных агентов.

Новый подход позволяет выявлять скрытые недостатки в системах искусственного интеллекта, способных к многошаговому взаимодействию с инструментами.

Искусственный интеллект как кластеризатор: новый подход к анализу данных

Большие языковые модели демонстрируют способность адаптировать выявление скрытых групповых структур в зависимости от разнообразных пользовательских инструкций, что отличает их подход к кластеризации от традиционных методов, основанных на логических рассуждениях.

Исследователи представили инновационный метод кластеризации, основанный на использовании больших языковых моделей, способных выполнять инструкции и генерировать кластеры.

Научный текст в структуре: новые возможности языковых моделей

Исследователи продемонстрировали, как относительно небольшие языковые модели могут преобразовывать научные предложения в иерархические JSON-представления, сохраняя при этом их смысл.

Видео-агент EVA: Разумный взгляд в будущее обработки видео

Для решения задач, требующих анализа длинных видеороликов, предложенный подход EVA позволяет агенту эффективно распределять визуальные токены: сначала проводится быстрый просмотр видео с низким разрешением для общего понимания, а затем извлекаются ключевые фрагменты с высоким разрешением и частотой кадров, что позволяет избежать ограничений, свойственных традиционным методам равномерной выборки и жестким инструментам извлечения кадров, и обеспечивает более точные ответы на поставленные вопросы.

Новая система EVA демонстрирует способность эффективно понимать и рассуждать над длинными видео, используя принципы планирования и адаптивного распределения ресурсов.

Самообучающийся агент для автоматизации GUI: новый подход

Интерфейс UI-Voyager (4B) демонстрирует впечатляющую эффективность в автоматизации Android, достигая 81.0% успеха в выполнении задач (Pass@1), превосходя более крупные модели и устанавливая новый стандарт, превышающий показатели человеческой производительности.

Исследователи представили UI-Voyager — систему, способную самостоятельно осваивать управление графическим интерфейсом пользователя, используя опыт неудачных попыток.

Принятие решений в медицине: как искусственный интеллект может помочь врачу

Обзор посвящен интеграции методов причинного машинного обучения в клинические системы поддержки принятия решений и анализу перспектив улучшения взаимодействия человека и ИИ в здравоохранении.

Реалистичные Виртуальные Миры Автопилота: Новый Шаг к Безопасности

В рамках исследования PhyGenesis разработан подход к генерации физически правдоподобных многовидовых видео, основанный на преобразовании произвольных 2D-траекторий в физически корректные 6-мерные движения, последующей проекции в условия видимости с камеры и синтезе высококачественного видеоматериала с использованием физически обоснованного генератора, обученного на гетерогенном наборе данных, включающем как реальные, так и симулированные сценарии, в том числе столкновения и выезды за пределы дорожного полотна.

Исследователи представили модель PhyGenesis, позволяющую создавать правдоподобные видео симуляции вождения с учетом физических законов и сложных траекторий.