Искусственный интеллект — Страница 185

Язык как мост между зрением и мозгом: новая модель для синхронизации сигналов

08.11.2025 от Денис Аветисян

Исследователи разработали метод, использующий язык для более точной интерпретации визуальной информации и ее связи с активностью мозга.

Иллюзии мультимодальных моделей: как они ошибаются, сопоставляя изображения

08.11.2025 от Денис Аветисян

Современные мультимодальные модели сталкиваются с фундаментальными ограничениями в логических рассуждениях, переходящих от одной сцены к другой, что проявляется в насыщении результатов на задачах восприятия даже при использовании передовых решений, демонстрируемых на бенчмарках вроде MMBench и Open VLM.

Новый бенчмарк выявил существенные ограничения в способности современных моделей рассуждать о динамических сценах, несмотря на успехи в распознавании образов.

Числовые тени в языковых моделях: как скрытые связи влияют на понимание

08.11.2025 от Денис Аветисян

Анализ корреляции слоёв в моделях Qwen2.5-3B и Llama 3.1 70B демонстрирует, что степень соответствия атрибутов (оранжевый) и степень их загрязнения (зелёный) тесно связаны с корреляцией между предсказанными и фактическими значениями (синий) для пар признаков, связанных с годом рождения/началом работы и областью/населением.

Исследование показывает, что большие языковые модели могут смешивать информацию о различных числовых характеристиках, приводя к непредсказуемым результатам.

Язык и ценности: Как большие модели понимают культуру?

08.11.2025 от Денис Аветисян

Методология, представленная на схеме, структурирует процесс исследования, обеспечивая последовательный подход к анализу и пониманию сложных систем во времени.

Исследование показывает, что ответы больших языковых моделей могут сильно зависеть от формулировки запроса и культурного контекста.

Рассуждения ИИ в таблицах: Новый вызов для больших языковых моделей

08.11.2025 от Денис Аветисян

Исследование демонстрирует, насколько сложно для современных систем искусственного интеллекта эффективно анализировать и делать выводы на основе данных, представленных в виде таблиц с неструктурированным текстом.

Познай Себя: Разговорчивый помощник для понимания языковых моделей

08.11.2025 от Денис Аветисян

Конвейер KnowThyselff обеспечивает точную атрибуцию токенов и оценку предвзятости, что демонстрируется на двух примерах, подтверждающих математическую чистоту и доказуемость алгоритма.

Новая платформа делает интерпретацию сложных нейросетей более доступной благодаря интерактивным визуализациям и объяснениям на естественном языке.

Управление характером языковых моделей: новый подход к стабильному контролю

08.11.2025 от Денис Аветисян

Гибридный отбор признаков для LLama-3-8B-Instruct, визуализированный через статический слой выбора, основанный на Offline Prior/Offline Best, и динамический отбор слоёв, демонстрирует, что частота использования слоёв варьируется в процессе управления, а среднее значение выбранных динамических слоёв служит ключевым показателем эффективности этого процесса.

Исследователи разработали метод, позволяющий тонко настраивать личностные качества больших языковых моделей без переобучения.

Самообучающаяся система для ускорения обучения гигантских нейросетей

08.11.2025 от Денис Аветисян

Основанный на принципах агентности, фреймворк ASAP позволяет оптимизировать производительность системы, рассматривая её не как статичную конструкцию, а как развивающуюся экосистему, где каждый компонент влияет на общую устойчивость и адаптивность.

Новый подход к автоматической оптимизации стратегий распределения данных позволяет значительно повысить эффективность обучения масштабных языковых моделей.

Автоматическая параллелизация кода: куда ведут нас нейросети?

08.11.2025 от Денис Аветисян

Исследование показывает, что применение искусственного интеллекта для автоматической распараллелизации кода не всегда стабильно и требует новых методов оценки качества.

Чиплеты и свет: Новый подход к ускорению больших языковых моделей

08.11.2025 от Денис Аветисян

Архитектура PICNIC объединяет вычислительные макросы, межсоединения и набор инструкций в единую систему, оптимизированную для эффективной обработки данных и выполнения задач.

Исследователи представляют систему, объединяющую передовые чиплеты, кремниевую фотонику и вычисления в памяти для значительного повышения производительности и энергоэффективности при работе с масштабными моделями машинного обучения.