Агенты нового поколения: Формализация интеллекта для надежных рабочих процессов

В ходе оценки производительности моделей [latex]gemini-3-flash-previuew[/latex] и [latex]gpt-4.1[/latex] в десяти различных областях решаемых задач, стратегии [latex]agentics-agg[/latex], [latex]agentics-both[/latex] и [latex]agentics-react[/latex] демонстрируют агрегированные результаты, сопоставимые или превосходящие показатели базовой стратегии [latex]baseline-react[/latex].

В статье представлена Agentics 2.0 — платформа, позволяющая создавать надежные, масштабируемые и прозрачные системы на основе искусственного интеллекта, способные к логическому выводу и адаптации.

Самообучающийся код: проверка возможностей ИИ в долгосрочном поддержании проектов

Система SWE-CI моделирует непрерывный цикл интеграции профессиональных программных команд, используя рабочий процесс, основанный на взаимодействии двух агентов: архитектора и программиста.

Новое исследование оценивает способность больших языковых моделей поддерживать качество кодовой базы и избегать регрессий в процессе непрерывной интеграции.

Разумный подбор растворителей: новый подход на стыке нейросетей и физики

Система [latex]AI4S-SDS[/latex], объединяющая многоагентный подход и алгоритм Монте-Карло с поиском по дереву (MCTS), представляет собой интегрированный инструмент для рационального проектирования растворителей, позволяющий оптимизировать их свойства посредством совместного анализа и целенаправленного поиска в химическом пространстве.

Исследователи разработали систему, объединяющую возможности больших языковых моделей с точными физическими расчетами для эффективного поиска новых химических формул растворителей.

Бесконечная История: Создание Долгоиграющих Видео с Реалистичным Миром

Предлагаемый конвейер генерации видео по сюжету использует последовательную структуру: ключевые кадры, создаваемые на основе нарратива, преобразуются в видеофрагменты с помощью модели

Новая разработка позволяет генерировать часовые видеоролики с сохранением визуальной связности и плавными переходами между кадрами, словно созданные профессиональным режиссером.

Искусственный интеллект и биология: способно ли обучение языковых моделей к новым открытиям?

Результаты тестирования базовых моделей на задачах MMLU-Pro (Биология) и DBench-Bio (январь 2026) демонстрируют различия в производительности, отраженные в сравнительных показателях, представленных в виде столбчатой диаграммы и графика зависимости соответственно.

Новое исследование представляет динамичный инструмент оценки, позволяющий проверить, действительно ли современные системы искусственного интеллекта способны генерировать новые знания в области биологических наук.

Понимание структуры текста: новый вызов для языковых моделей

Процесс создания T2S-Bench включает в себя сбор данных, многошаговое рассуждение и сквозное построение набора данных, что позволяет комплексно оценить способность систем к решению задач, требующих последовательного анализа информации.

Исследователи представили масштабный набор данных и методику оценки, позволяющие проверить и улучшить способность искусственного интеллекта к осмыслению структуры текстовой информации.

Искусственный интеллект, создающий искусственный интеллект: мнения экспертов

Ожидания относительно публичного развертывания моделей, способных ускорить исследования в области искусственного интеллекта, разнятся в зависимости от принадлежности к организации: представители, полагающие, что развертывание произойдет внутри компаний, мотивируют это ценностью ASARA и потенциальной прибылью от внутреннего использования в исследованиях и разработках, в то время как сторонники публичного развертывания указывают на экономическое давление, потребность в финансировании, конкуренцию и соображения ответственного подхода, при этом значительная часть респондентов считает, что решения о развертывании будут зависеть от государственного регулирования и различий в политике и культуре между лабораториями.

Новое исследование раскрывает взгляды ведущих специалистов на перспективы и риски автоматизации исследований в области искусственного интеллекта и возможности неконтролируемого роста его возможностей.

ИИ-компаньон в реальном времени: новый уровень взаимодействия с видео

В разработанной системе Proact-VL, на каждой секунде происходит обработка разнородных токенов - видео, запроса и контекста - с последующим принятием решения о необходимости ответа на основе скрытого состояния [latex]\text{FLAG}[/latex] и порогового значения τ: в случае превышения порога генерируется короткий текстовый фрагмент, соответствующий ответу, иначе - добавляется токен тишины, обеспечивая динамическое управление речью.

Представлена система, способная генерировать осмысленные и непрерывные ответы в видеопотоке, открывая возможности для интерактивных ИИ-ассистентов.

Искусственный интеллект на службе физики: новый взгляд на обучение

Исследование анализирует стремительно развивающуюся область применения искусственного интеллекта в физическом образовании, выявляя ключевые тенденции и перспективные направления развития.