Мыслительный процесс языковых моделей: новый взгляд на рассуждения

Gemini 2.5 Pro демонстрирует среднюю точность на уровне AIME 2025 по каждому вопросу, полученную в результате 780 запросов к модели, с указанием стандартной ошибки в виде погрешностей.

В статье представлена теоретическая основа для анализа и улучшения способности больших языковых моделей к логическому мышлению, основанная на изучении влияния контекста и эффективного использования вычислительных ресурсов.

Семантика впереди: новый подход к генерации изображений

В рамках исследования предложена методика построения композитного латентного пространства, где входное изображение кодируется в семантический и текстурный латенты посредством отдельных VAE-энкодеров, которые затем конкатенируются для асинхронного диффузионного моделирования.

Исследователи предлагают инновационный метод, ставящий семантическое понимание в основу процесса диффузии для повышения скорости и качества генерации изображений.

Код как лакмусовая бумажка: Сравниваем языковые модели

Общецелевые и специализированные языковые модели демонстрируют различную производительность при оценке как естественного языка, так и кода, что указывает на необходимость адаптации архитектуры модели к конкретной задаче для достижения оптимальных результатов.

Новое исследование показывает, что модели, обученные на коде, превосходят универсальные языковые модели не только в программировании, но и в задачах, требующих логического мышления и надежности.

Понимание сложных систем: новый взгляд на агентные модели

В статье представлена методика, позволяющая глубже анализировать поведение агентных моделей, разделяя динамику во времени и геометрические свойства распределений.

Искусственный интеллект находит новые грани в задаче упаковки сфер

Исследование истории задач об упаковке сфер демонстрирует, что разработанный на основе искусственного интеллекта подход (2025 год) превосходит все ранее известные решения в критическом диапазоне размерностей от 4 до 16, включая такие классические конструкции, как D4, E6, E7, E8, K12 и другие, что знаменует собой новый этап в данной области.

Новый подход, основанный на моделировании и эффективном использовании данных, позволил добиться значительных успехов в решении сложной математической проблемы упаковки сфер в многомерном пространстве.

Разумные агенты: Как понять и исправить этические ошибки языковых моделей

Исследование этических аспектов многоагентных систем, основанных на больших языковых моделях, выявляет три взаимосвязанных уровня оценки - поведение отдельных агентов, их взаимодействие и общую системную сходимость - и предполагает, что понимание причинно-следственных связей, а также целенаправленные вмешательства, основанные на механистическом анализе, необходимы для обеспечения этичного поведения системы в целом.

Новый обзор посвящен исследованию причин возникновения нежелательного поведения в системах, состоящих из нескольких больших языковых моделей, и предлагает методы для целенаправленной коррекции этих проблем.