Видео как ответ: предсказание и генерация событий в видеорядах

При разработке вознаграждения Joint-GRPO установлено, что оценка, основанная исключительно на тексте, не способна выявить визуальную несогласованность, в то время как вознаграждение, основанное только на видео, не учитывает семантические ошибки, что подчеркивает необходимость комбинированного подхода для достижения надежной оценки качества рассуждений на разных стадиях обучения.

Новое исследование предлагает модель, способную предсказывать развитие событий в видео и генерировать соответствующие видеофрагменты в качестве ответа на заданный вопрос.

Рассуждая как эксперт: как научить нейросети понимать причинно-следственные связи

Система CARE обрабатывает наборы данных для выявления причинно-следственных связей, расширяет их для создания разнообразных сценариев обучения, формируя на их основе пары

Новая методика позволяет значительно улучшить способность больших языковых моделей к анализу причин и следствий, объединяя их знания с результатами традиционных алгоритмов.

Видео-Рассуждения: Проверка на Прочность

Наблюдения за шестью моделями генерации видео на тринадцати задачах, требующих логических рассуждений, показали, что производительность каждой из них может быть сопоставлена благодаря нормализации оценок внутри каждой размерности, выявляя различия в способности моделей к решению задач, требующих когнитивных усилий.

Новый комплексный бенчмарк V-ReasonBench позволяет оценить способность генеративных видеомоделей к логическому мышлению и выявить распространенные ошибки в создании реалистичных роликов.

Проверка цитат: Искусственный интеллект на страже научной достоверности

Автоматизированный конвейер верификации цитирований объединяет обработку документов, хранение векторных представлений, гибридный поиск по семантическому подобию и ключевым словам с использованием BM25, нейронную переранжировку с помощью FlashRank и анализ на основе больших языковых моделей, выдавая классификацию, подтверждающие доказательства, детализированное обоснование и оценку достоверности для каждой задачи верификации цитирования.

Новая система SemanticCite автоматически анализирует полные тексты источников, чтобы убедиться в корректности цитирований и выявить возможные неточности.

Разум без границ: Новая архитектура для мощных языковых моделей

Эффективность Nemotron Elastic демонстрирует стабильность затрат на обработку токенов и объём используемой памяти при увеличении масштаба модели, в то время как Minitron-SSM демонстрирует линейную зависимость этих показателей, что подтверждается анализом точности на ключевых бенчмарках, включающих MATH-500, AIME-2024, AIME-2025, GPQA, LiveCodeBench v5 и MMLU-Pro.

Исследователи представили Nemotron Elastic — инновационный подход к обучению и сжатию гибридных моделей, открывающий путь к более эффективному и доступному искусственному интеллекту.

Раскрывая логику коллективного разума: MACIE для анализа поведения многоагентных систем

Оценка вклада отдельных факторов ($ϕ\_i$) по всем наборам данных выявила, что положительные значения ($ϕ\_i > 0$) указывают на созидательный эффект, тогда как отрицательные ($ϕ\_i < 0$) - на конкуренцию или взаимное подавление, при этом индекс синергии (SI) позволяет количественно оценить степень проявления этих взаимодействий.

Новый фреймворк MACIE позволяет понять, как отдельные агенты влияют на общие результаты в сложных многоагентных системах, обеспечивая прозрачность и справедливость при оценке их вклада.

Разделяй и Властвуй: Новый Подход к Развёртке 3D-Моделей

В отличие от базовых моделей, генерирующих чрезмерно фрагментированные UV-карты, затрудняющие 2D-редактирование текстур, PartUV создает значительно меньше карт с границами, ориентированными по частям объекта, что обеспечивает более эффективное выполнение 2D-операций.

Исследователи представили метод PartUV, который позволяет создавать более качественные и удобные развёртки 3D-моделей, используя сегментацию по семантическим частям и геометрические алгоритмы.

Искусственный интеллект: между суверенитетом и взаимозависимостью

Новая статья исследует, как страны могут выстраивать стратегическую автономию в области ИИ, не отказываясь от глобального сотрудничества и обмена данными.