Кто работает в языковой модели: выявление экспертов в архитектуре Mixture-of-Experts

Оценка взвешенной по уверенности активации экспертов (CWAS) демонстрирует различия в поведении моделей DeepSeek-MoE, Qwen-MoE и Mixtral-8×7B, выявляя нюансы в использовании экспертных возможностей каждой из них.

Новое исследование раскрывает, какие части больших языковых моделей отвечают за обработку различных типов информации и как они взаимодействуют друг с другом.

Логика в действии: Улучшение понимания инструкций для больших языковых моделей

Предлагаемая структура LsrIF включает в себя два ключевых компонента: построение логически структурированных наборов данных (LsrInstruct) и формирование вознаграждений с учётом структуры (LsRM), что позволяет оптимизировать взаимодействие и повысить эффективность системы.

Новый подход позволяет большим языковым моделям более точно следовать инструкциям, используя явное моделирование логики этих инструкций.

Искусственный интеллект в медицине: платформа для стандартизации и воспроизводимости

Новая платформа MHub.ai упрощает доступ к моделям искусственного интеллекта в медицинской визуализации, обеспечивая их стандартизацию и воспроизводимость для практического применения.

Искусственный интеллект учится понимать задачи: новый подход к генерации и редактированию изображений

Предлагаемый метод, TAG-MoE, объединяет AMM-DiT с MoE-слоями, иерархическую семантическую аннотацию задач для разметки обучающих данных атомарными дескрипторами и новый семантически-выровненный маршрутизатор, который явно сопоставляет поведение маршрутизации MoE с семантикой задач посредством регуляризации предсказуемого выравнивания.

Исследователи представили TAG-MoE — систему, позволяющую нейросетям более эффективно решать различные задачи генерации и редактирования изображений, избегая конфликтов и оптимизируя специализацию.

Понимание видео от первого лица: как большие языковые модели отвечают на вопросы

Предлагаемая система визуального вопросно-ответного анализа (VQA) представляет собой комплексную архитектуру, предназначенную для эффективного извлечения информации из визуальных данных и предоставления точных ответов на поставленные вопросы.

Новое исследование демонстрирует, как можно значительно улучшить способность нейросетей понимать сложные видеозаписи, снятые от первого лица, и отвечать на вопросы о них.

Проверка на прочность: Новый тест для кодирующих ИИ

Оценивая способность агента следовать инструкциям в реалистичной среде, OctoBench комбинирует разнородные, постоянные источники указаний с интерактивным каркасом, фиксируя траектории взаимодействия и сопоставляя их с бинарным контрольным списком, детализирующим проверяемые ограничения, после чего оценка осуществляется языковой моделью, позволяющей отделить успешное выполнение задачи от строгого соблюдения правил.

Исследователи представили OctoBench — комплексную платформу для оценки способности искусственного интеллекта следовать инструкциям и решать сложные задачи кодирования с учетом реальных ограничений.

Командная работа агентов: обучение без обновления модели

Многопрофильная коллаборация в решении математических задач, представленная системой MATTRL, демонстрирует потенциал объединения различных специализаций для достижения более эффективного и всестороннего подхода к сложным вычислениям.

Новый подход позволяет многоагентным системам улучшать навыки рассуждения и решения задач, используя совместное обучение и текстовый опыт без необходимости переобучения.