Искусственный интеллект — Страница 189

Языковые модели диффузии: новый уровень эффективности

06.11.2025 от Денис Аветисян

Диффузионные языковые модели, подобно любым системам, неизбежно подвержены переобучению, однако продолжительность их эффективной работы зависит от объема уникальных данных – чем больше данных, тем позднее наступает переобучение – и размера модели, при этом увеличение масштаба ускоряет этот процесс.

Исследование показывает, что модели диффузии превосходят традиционные авторегрессионные модели при ограниченном объеме данных.

Табулярные данные: новый взгляд на обучение без учителя

06.11.2025 от Денис Аветисян

Архитектура Orion-MSP преобразует табличные данные в векторные представления, используя многомасштабное разреженное взаимодействие строк и механизм памяти Perceiver для двунаправленной коммуникации, что позволяет предсказывать тестовые метки в один проход, раскрывая потенциал для глубокого понимания и манипулирования структурированной информацией.

Новая архитектура Orion-MSP позволяет эффективно извлекать знания из табличных данных без необходимости в длительном обучении.

Визуальный интеллект машин: новый тест на сообразительность

06.11.2025 от Денис Аветисян

Таксономия задач MME-CC выделяет три ключевые категории рассуждений — пространственное, геометрическое и основанное на визуальных знаниях — каждая из которых иллюстрируется конкретными подзадачами и примерами входных данных, демонстрируя структурированный подход к оценке многомерных мультимодальных способностей.

Исследователи представляют сложный набор задач для оценки способности мультимодальных моделей понимать и рассуждать о визуальной информации.

Роботы на испытании: новая платформа для оценки интеллекта

06.11.2025 от Денис Аветисян

Набор из тридцати задач, предназначенный для тестирования манипуляторов, выявил существенные различия в эффективности различных алгоритмов обучения, при этом модели, дообученные авторами отчета, демонстрируют превосходство над теми, что были дообучены студентами-волонтерами, что указывает на важность квалифицированной тонкой настройки для достижения оптимальных результатов.

Представлена онлайн-платформа RoboChallenge, позволяющая оценить способность роботов понимать язык и выполнять действия в реальном мире.

Когда мнения расходятся: как модели принимают решения при конфликте данных

06.11.2025 от Денис Аветисян

Для оценки надежности модели при столкновении с противоречивыми данными, разработан фреймворк, измеряющий степень неопределенности модели в визуальной и текстовой модальностях через энтропию, и использующий относительную неопределенность для анализа выбора модели в условиях конфликта.

Новое исследование показывает, что при столкновении визуальной и текстовой информации, выбор модели определяется относительной неуверенностью в каждой из этих модальностей.

Когда ИИ не умеет работать в команде

05.11.2025 от Денис Аветисян

Однородное сотрудничество предполагает, что системы, лишенные внутренних разногласий, могут эффективно функционировать, но их неспособность к адаптации перед лицом непредвиденных обстоятельств предвещает неизбежный системный сбой.

Исследование выявило неожиданный пробел в способностях современных языковых моделей к эффективному сотрудничеству.

Визуальный код: новый вызов для искусственного интеллекта

05.11.2025 от Денис Аветисян

Распределения VCode демонстрируют вариативность кодирования, отражая спектр представлений и потенциальную неоднозначность в структуре данных.

Бенчмарк VCode демонстрирует, как сложные визуальные представления, такие как SVG, ставят под сомнение возможности современных языковых моделей в области мультимодального кодирования.

АюрПарам: Искусственный интеллект на службе аюрведы

05.11.2025 от Денис Аветисян

Корпус собранных данных демонстрирует языковое разнообразие, охватывая древний санскрит, распространенные хинди и маратхи, а также современный английский, что указывает на стремление к многоязыковой обработке и пониманию.

Новая модель искусственного интеллекта, обученная на древних текстах аюрведы, открывает возможности для анализа и понимания традиционных медицинских знаний.

Головоломки для разума: проверка языковых моделей на прочность

05.11.2025 от Денис Аветисян

Оценка производительности различных языковых моделей на RiddleBench выявила значительные различия в способности давать правильные ответы, демонстрируя, что эффективность решения задач, требующих логического мышления, сильно варьируется между отдельными архитектурами.

Исследование представляет RiddleBench – комплексный тест, оценивающий способность больших языковых моделей к многоступенчатым рассуждениям, пространственному мышлению и коррекции ошибок.

Сжимаются ли изображения в ‘мозгу’ ИИ?

05.11.2025 от Денис Аветисян

Новый бенчмарк позволяет оценить, насколько эффективно большие мультимодальные модели ‘упаковывают’ визуальную информацию.