Видео в сети: новый тест для искусственного интеллекта

Набор данных Video-BrowseComp представляет собой эталон для оценки возможностей систем в задачах поиска по видео, охватывающий три уровня сложности - от прямого извлечения информации до рассуждений на основе данных из разных источников, что позволяет комплексно протестировать способность машин к пониманию видеоконтента.

Исследователи представили комплексную платформу для оценки способности ИИ-агентов проводить глубокий анализ видеоконтента в интернете и использовать полученные знания для решения сложных задач.

Искусственный интеллект как соавтор: самообучающиеся системы для научных исследований

Исследование демонстрирует подход к автоматическому созданию исследовательских планов, где модели обучаются генерировать стратегии достижения целей, а оценка этих планов осуществляется на основе рубрик, извлеченных из существующих научных работ с помощью специализированных моделей выбора и формирования, при этом итоговая награда за обучение и оценка качества плана формируются на основе доли выполненных критериев рубрики, соответствующих общим рекомендациям.

Новая система ResearchPlanGen способна автоматически генерировать обоснованные планы научных исследований, используя самообучение и оценку по заданным критериям.

Связи, которые лечат: как искусственный интеллект раскрывает закономерности в онкологических исследованиях

Новое исследование показывает, как машинное обучение позволяет предсказывать и понимать паттерны сотрудничества между учеными, работающими над победой над раком.

Форма мышления: как распределение данных важнее правильных ответов

По результатам обучения моделей на наборах данных MBPP для генерации кода, наблюдается устойчивая зависимость производительности от распределения данных: чем дальше данные отклоняются от распределения, на котором обучалась модель, тем сложнее добиться улучшения результатов, даже если сами данные корректны, в то время как использование цепочек рассуждений (CoT) с неверными ответами или даже перефразировка корректных CoT для приближения к распределению модели демонстрирует значительно лучшую производительность по сравнению со стандартными CoT.

Новое исследование показывает, что при обучении больших языковых моделей для решения задач рассуждения, важно не только качество данных, но и их соответствие реальному распределению информации.

Самообучающаяся защита: Искусственный интеллект на службе киберустойчивости

Агентивный искусственный интеллект выступает посредником двунаправленного взаимодействия между кибер-услугами и физическими системами, обеспечивая замкнутое когнитивное управление и адаптацию в интегрированной киберфизической системе.

Новый подход к кибербезопасности предполагает использование интеллектуальных агентов для адаптации к постоянно меняющимся угрозам в цифровом и физическом пространствах.

Видение и Действие: Новые Модели для Понимания Изображений и Управления Роботами

Семейство моделей Dream, основанное на диффузионной языковой модели Dream-7B, представляет собой передовое решение в области мультимодального понимания и планирования, демонстрирующее возможности долгосрочного прогнозирования и служащее основой для создания первой предварительно обученной диффузионной модели визуально-языкового агента (dVLA), предназначенной для решения широкого спектра задач.

Исследователи представили семейства моделей Dream-VL и Dream-VLA, способных не только понимать визуальный контент, но и планировать действия робота на его основе.

Искусственный интеллект и бережливые стартапы: новые горизонты?

Исследование анализирует растущее взаимодействие между искусственным интеллектом и методологией Lean Startup, выявляя ключевые тренды и перспективы развития.