Язык как мост между зрением и мозгом: новая модель для синхронизации сигналов

Исследователи разработали метод, использующий язык для более точной интерпретации визуальной информации и ее связи с активностью мозга.

Иллюзии мультимодальных моделей: как они ошибаются, сопоставляя изображения

Современные мультимодальные модели сталкиваются с фундаментальными ограничениями в логических рассуждениях, переходящих от одной сцены к другой, что проявляется в насыщении результатов на задачах восприятия даже при использовании передовых решений, демонстрируемых на бенчмарках вроде MMBench и Open VLM.

Новый бенчмарк выявил существенные ограничения в способности современных моделей рассуждать о динамических сценах, несмотря на успехи в распознавании образов.

Числовые тени в языковых моделях: как скрытые связи влияют на понимание

Анализ корреляции слоёв в моделях Qwen2.5-3B и Llama 3.1 70B демонстрирует, что степень соответствия атрибутов (оранжевый) и степень их загрязнения (зелёный) тесно связаны с корреляцией между предсказанными и фактическими значениями (синий) для пар признаков, связанных с годом рождения/началом работы и областью/населением.

Исследование показывает, что большие языковые модели могут смешивать информацию о различных числовых характеристиках, приводя к непредсказуемым результатам.

Рассуждения ИИ в таблицах: Новый вызов для больших языковых моделей

Существующие наборы данных для анализа таблиц зачастую ограничены в своей применимости к реальным, разнородным информационным системам, в то время как RUST-BENCH объединяет данные, охватывающие сразу несколько аспектов сложности – специфичность предметной области, длину таблиц, полуструктурированность и сложность запросов – что позволяет более адекватно оценивать и разрабатывать решения для практических задач.

Исследование демонстрирует, насколько сложно для современных систем искусственного интеллекта эффективно анализировать и делать выводы на основе данных, представленных в виде таблиц с неструктурированным текстом.

Познай Себя: Разговорчивый помощник для понимания языковых моделей

Конвейер KnowThyselff обеспечивает точную атрибуцию токенов и оценку предвзятости, что демонстрируется на двух примерах, подтверждающих математическую чистоту и доказуемость алгоритма.

Новая платформа делает интерпретацию сложных нейросетей более доступной благодаря интерактивным визуализациям и объяснениям на естественном языке.

Самообучающаяся система для ускорения обучения гигантских нейросетей

Основанный на принципах агентности, фреймворк ASAP позволяет оптимизировать производительность системы, рассматривая её не как статичную конструкцию, а как развивающуюся экосистему, где каждый компонент влияет на общую устойчивость и адаптивность.

Новый подход к автоматической оптимизации стратегий распределения данных позволяет значительно повысить эффективность обучения масштабных языковых моделей.

Автоматическая параллелизация кода: куда ведут нас нейросети?

Исследование показывает, что применение искусственного интеллекта для автоматической распараллелизации кода не всегда стабильно и требует новых методов оценки качества.

Чиплеты и свет: Новый подход к ускорению больших языковых моделей

Архитектура PICNIC объединяет вычислительные макросы, межсоединения и набор инструкций в единую систему, оптимизированную для эффективной обработки данных и выполнения задач.

Исследователи представляют систему, объединяющую передовые чиплеты, кремниевую фотонику и вычисления в памяти для значительного повышения производительности и энергоэффективности при работе с масштабными моделями машинного обучения.