Когда Искусственный Интеллект Перерастает Экзаменаторов

Оценка математических способностей современных моделей, таких как Claude Sonnet 4.5, DeepSeek v3.2, Gemini 3 Pro, GPT-5 и Kimi K2 Thinking, на отфильтрованном наборе данных Omni-MATH-2 показывает, что расхождения в оценках, обусловленные субъективностью экспертов, а не случайными ошибками в разметке, приводят к изменению относительного рейтинга моделей и особенно усиливаются при решении сложных задач, демонстрируя зависимость результатов от выбора эксперта и специфики предметной области, например, в области математического анализа для моделей Claude и DeepSeek.

Новое исследование показывает, что современные системы ИИ достигают пределов точности не из-за собственных ограничений, а из-за несовершенства методов оценки.

Самообучающиеся бизнес-процессы: новый уровень автоматизации

Многоуровневая архитектура агенторной BPM-системы позволяет структурировать процессы и задачи, обеспечивая гибкость и масштабируемость при автоматизации бизнес-операций.

В статье представлена концепция систем управления бизнес-процессами, способных к автономному выполнению, адаптации и оптимизации благодаря использованию интеллектуальных агентов.

Динамическая теория поля в реальном времени: путь к квантовым вычислениям

Итеративный процесс подгонки демонстрирует сходимость как вблизи металл-диэлектрического перехода, так и в сильно коррелированной моттовской изолирующей фазе (при [latex]U=8[/latex]), что подтверждается быстрым достижением фиксированных значений параметров ванны [latex]\{t\_{0},t\_{1},t\_{2},\epsilon\_{1},\epsilon\_{2}\}[/latex] в течение 20-30 итераций и измеряется через среднеквадратичную ошибку [latex]\epsilon\_{RMS}[/latex] между последовательными функциями гибридизации.

Новая итерационная схема позволяет решать сложные задачи модели Хаббарда, открывая перспективы для реализации алгоритмов на квантовых компьютерах ближайшего будущего.

Квантовые Иллюзии и Экзопланеты: Размышления Физика

Квантовые Иллюзии и Экзопланеты: Размышления Физика Знаете, всегда смешно, когда пытаешься увидеть что-то, что принципиально скрыто. Как будто ищешь кота в абсолютно черной комнате. Вот и с экзопланетами так: свет их слабый, а звездный свет – оглушительный. И вот, оказывается, квантовая механика может помочь нам эту темноту прояснить. Парадоксально, не так ли? Что за Магия? … Читать далее

ИИ-агенты под контролем: новая система диагностики безопасности

Оценка точности модели AgentDoG на трех эталонных наборах данных для бинарной классификации безопасности и на ATBench для гранулярной классификации демонстрирует ее превосходство над существующими универсальными и защитными моделями в выявлении небезопасного поведения.

Представлена AgentDoG — платформа для оценки и повышения безопасности автономных ИИ-агентов, способная предвидеть и предотвращать нежелательное поведение.

Математика по формуле-1: новый подход к решению задач

В отличие от традиционных методов математического рассуждения (Zero-shot, CoT, PoT), которые приступают к решению задачи напрямую, предложенный подход F-1 сначала формализует уравнение, а затем адаптивно выбирает стратегию решения, выполняя все этапы в рамках одного вызова.

Исследователи предлагают инновационный метод, использующий математические формулы для повышения точности и эффективности языковых моделей при решении прикладных задач.

Визуальный интеллект: как машины учатся мыслить образами

Современные мультимодальные модели расширяют возможности логических умозаключений, переходя от преимущественно вербального, символического моделирования мира, характерного для больших языковых моделей, к визуальной генерации, что позволяет создавать более реалистичные и человекоподобные модели, особенно в задачах, связанных с физическим миром и опирающихся на сочетание вербальной и визуальной информации, подобно тому, как это происходит в когнитивных процессах человека.

Новый подход к мультимодальному обучению позволяет искусственному интеллекту решать задачи, требующие пространственного мышления и понимания физического мира, благодаря генерации изображений.

Искусственный интеллект на железе: новая архитектура для сверхбыстрого вывода

Программный комплекс AI\_FPGA\_Agent обеспечивает автоматизированный переход от программного обеспечения к аппаратной реализации посредством взаимодействия прикладного уровня с фреймворком, системой моделирования на основе SystemC и драйвером аппаратного ускорителя, при этом системная верификация осуществляется через тестовую среду SystemC и поведенческую модель перед синтезом финального битового потока для FPGA и развертыванием аппаратного ускорителя.

В статье представлена инновационная платформа, объединяющая гибкие возможности FPGA и интеллектуальное программное обеспечение для значительного ускорения задач машинного обучения.

Оптимизация цветовой квантизации изображений: от машинного зрения к восприятию человека

В результате квантования цветов с использованием алгоритма k-means для изображения statlab, повышение разрешения достигается без увеличения значения k для каждой цветовой модели, при этом оптимизированная цветовая модель XYZ демонстрирует наилучшие результаты для данного изображения во всех значениях k.

Новое исследование сравнивает эффективность алгоритма k-средних для цветовой квантизации изображений в различных цветовых пространствах, чтобы добиться оптимального баланса между точностью и визуальным качеством.