Агенты SERA: Код, Созданный с Подтверждением

Процесс «мягкой верификации» (Soft Verified Generation) предполагает итеративное совершенствование функции посредством траекторий изменений, преобразованных в синтетические запросы на изменение, после чего учительская модель пытается воспроизвести исправление исключительно по описанию запроса, а сравнение полученных исправлений на уровне строк с использованием порога, например, [latex] r \geq 0.5 [/latex], служит основой для отбора данных обучения.

Новый подход к обучению кодирующих агентов позволяет достичь выдающихся результатов с минимальными затратами благодаря использованию синтетических данных и техники ‘мягкой верификации’.

Математика в таблицах: новая архитектура для интерпретируемого машинного обучения

Архитектура StructuralCFN изучает взаимосвязи в данных посредством адаптивных управляемых вентилей, а итоговый прогноз формируется гибридным функциональным комитетом с обходным линейным каналом, обеспечивающим устойчивость и точность вычислений.

Исследователи представили StructuralCFN — нейронную сеть, способную выявлять и использовать математические зависимости в табличных данных, обеспечивая высокую точность и понятность результатов.

Облегчённые модели для робототехники: дистилляция знаний для VLA

Метод Shallow-π позволяет уменьшить глубину трансформерной основы и блока действий в визуально-языковой модели посредством дистилляции знаний, используя три функции потерь для согласования с истинными действиями, выходами учителя и промежуточной перекрестной внимательностью между основой и блоком действий.

Новый подход позволяет значительно снизить вычислительную нагрузку моделей, понимающих язык, зрение и действия, открывая путь к их использованию на мобильных и встраиваемых устройствах.

Понять и Действовать: Оценка Применимости Объяснимого ИИ

Категории информации, подлежащие пользовательской ответственности, и связанные с ними действия определяют рамки контроля и отчётности в системе, формируя основу для оценки и управления последствиями каждого шага.

Новое исследование предлагает систематизированный подход к оценке того, насколько объяснения в системах искусственного интеллекта позволяют пользователям эффективно принимать решения и действовать.

Математика на пределе: как обучить ИИ решать сложные задачи

В ходе обучения на бенчмарке MATH500, алгоритм DGPO демонстрирует динамику, отличную от GRPO, оба из которых используют в качестве основы языковую модель Qwen2.5-Math-7B, что указывает на потенциальные различия в эффективности оптимизации для решения математических задач.

Новая методика позволяет значительно повысить способность больших языковых моделей к математическому рассуждению, используя адаптивное обучение и перефразировку вопросов.

Умное здание: AI-агент для оптимизации энергопотребления

Новая платформа, основанная на агентном искусственном интеллекте, позволяет автоматизировать управление инженерными системами зданий и существенно снизить расходы на энергию.

Визуальное мышление: новая модель для понимания документов

В DeepSeek-OCR 2 внедрён механизм визуальной токеновой компрессии, заимствованный из DeepEncoder и использующий 80-миллионно-параметрический компрессор изображений для 16-кратного уменьшения количества визуальных токенов, при этом DeepEncoder V2 отличается заменой CLIP-модуля на компактную языковую модель, что позволяет, посредством специализированных масок внимания, обрести возможности сжатия знаний CLIP и инициировать причинно-следственное моделирование визуальных последовательностей.

Разработчики представили DeepSeek-OCR 2 — систему, способную глубже анализировать визуальную информацию в документах, используя принципы причинно-следственного анализа.

Искусственный интеллект под прицелом: защита агентов в реальном мире

Дипфейки представляют собой растущую угрозу безопасности как критически важных систем управления, так и агентов искусственного интеллекта, подрывая доверие к данным и потенциально приводя к непредсказуемым и опасным последствиям.

В статье рассматриваются новые угрозы, связанные с использованием дипфейков против систем управления, основанных на искусственном интеллекте, и предлагается комплексный подход к обеспечению их безопасности.

Мир в коде: Новая эра симуляций с открытым исходным кодом

Модель демонстрирует способность к генерации разнообразных будущих траекторий развития событий, направляемых текстовыми подсказками, охватывая как глобальные изменения окружающей среды ([latex]например, «зима», «пиксель-арт»[/latex]), так и точечные локальные вмешательства ([latex]например, «фейерверки», «рыбы[/latex]), при этом сохраняя физическую и временную согласованность.

Исследователи представили LingBot-World — платформу, расширяющую возможности генерации видео и симуляций, способную к долгосрочному планированию и управлению действиями.