Искусственный интеллект проверяет знания: новый подход к оценке компетенций

Скорость прогрессии иерархического цветения, как показано в исследовании, варьируется в зависимости от условий, что указывает на чувствительность этого процесса к внешним факторам и потенциальную возможность его регулирования.

Представлен фреймворк BloomQA, позволяющий автоматически создавать качественные и валидные тесты для оценки возможностей языковых моделей в практических областях.

Математика на пределе: как обучить ИИ решать сложные задачи

В ходе обучения на бенчмарке MATH500, алгоритм DGPO демонстрирует динамику, отличную от GRPO, оба из которых используют в качестве основы языковую модель Qwen2.5-Math-7B, что указывает на потенциальные различия в эффективности оптимизации для решения математических задач.

Новая методика позволяет значительно повысить способность больших языковых моделей к математическому рассуждению, используя адаптивное обучение и перефразировку вопросов.

Умное здание: AI-агент для оптимизации энергопотребления

Новая платформа, основанная на агентном искусственном интеллекте, позволяет автоматизировать управление инженерными системами зданий и существенно снизить расходы на энергию.

Память о прошлом: Как использовать кэш KV для повышения интеллекта языковых моделей

Изучение потребления видеопамяти [latex]VRAM[/latex] для модели Qwen3-32B демонстрирует, что добавление скрытых состояний к кешу [latex]KV[/latex] значительно увеличивает использование памяти по сравнению с использованием только кеша [latex]KV[/latex], что указывает на компромисс между вычислительной эффективностью и потреблением ресурсов.

Новое исследование показывает, что кэш KV, традиционно применяемый для ускорения генерации текста, может быть перепрофилирован для задач самооценки и адаптивного рассуждения, открывая новые возможности для эффективного использования ресурсов.

Квантовый Переворот: От Теории к Реальности

Квантовый Переворот: От Теории к Реальности Вот парадокс: мы говорим о революционных технологиях, которые большинство людей даже не могут представить. Как объяснить квантовый мир, не усугубив непонимание? Это как пытаться описать цвет кому-то, кто никогда не видел света. Представьте себе, что вы пытаетесь настроить радио. Классический компьютер – это как поиск нужной станции, перебирая их … Читать далее

Визуальное мышление: новая модель для понимания документов

В DeepSeek-OCR 2 внедрён механизм визуальной токеновой компрессии, заимствованный из DeepEncoder и использующий 80-миллионно-параметрический компрессор изображений для 16-кратного уменьшения количества визуальных токенов, при этом DeepEncoder V2 отличается заменой CLIP-модуля на компактную языковую модель, что позволяет, посредством специализированных масок внимания, обрести возможности сжатия знаний CLIP и инициировать причинно-следственное моделирование визуальных последовательностей.

Разработчики представили DeepSeek-OCR 2 — систему, способную глубже анализировать визуальную информацию в документах, используя принципы причинно-следственного анализа.

Искусственный интеллект под прицелом: защита агентов в реальном мире

Дипфейки представляют собой растущую угрозу безопасности как критически важных систем управления, так и агентов искусственного интеллекта, подрывая доверие к данным и потенциально приводя к непредсказуемым и опасным последствиям.

В статье рассматриваются новые угрозы, связанные с использованием дипфейков против систем управления, основанных на искусственном интеллекте, и предлагается комплексный подход к обеспечению их безопасности.

Проверка научных статей: новый эталон для автоматического рецензирования

Рамка PaperAudit-Review обеспечивает многоуровневый анализ, сочетая в себе обнаружение на трех степенях глубины с последующим синтезом критических оценок на основе полученных результатов.

Исследователи представили комплексный инструмент для оценки способности систем находить ошибки в научных публикациях и повышать качество автоматической проверки.

Мир в коде: Новая эра симуляций с открытым исходным кодом

Модель демонстрирует способность к генерации разнообразных будущих траекторий развития событий, направляемых текстовыми подсказками, охватывая как глобальные изменения окружающей среды ([latex]например, «зима», «пиксель-арт»[/latex]), так и точечные локальные вмешательства ([latex]например, «фейерверки», «рыбы[/latex]), при этом сохраняя физическую и временную согласованность.

Исследователи представили LingBot-World — платформу, расширяющую возможности генерации видео и симуляций, способную к долгосрочному планированию и управлению действиями.