Восполняя пробелы в знаниях: Как языковые модели учатся делать выводы

Новый подход к поисково-генеративным моделям позволяет им самостоятельно находить и проверять недостающие предпосылки для более логичных и правдивых ответов.

Эффективный базис для моделирования электрон-ядерной динамики

Автор: Денис Аветисян Новый взгляд на выбор базисных функций позволяет повысить точность смешанных квантово-классических расчетов. В данной работе показано, что состояния, полученные в рамках приближения Борна-Оппенгеймера, служат приближенным предпочтительным базисом для моделирования связанных электрон-ядерных процессов. Несмотря на значительный прогресс в квантовой динамике связанных систем, выбор подходящего базиса для описания движения электронов и ядер остается сложной … Читать далее

Язык как мост между зрением и мозгом: новая модель для синхронизации сигналов

Исследователи разработали метод, использующий язык для более точной интерпретации визуальной информации и ее связи с активностью мозга.

Иллюзии мультимодальных моделей: как они ошибаются, сопоставляя изображения

Современные мультимодальные модели сталкиваются с фундаментальными ограничениями в логических рассуждениях, переходящих от одной сцены к другой, что проявляется в насыщении результатов на задачах восприятия даже при использовании передовых решений, демонстрируемых на бенчмарках вроде MMBench и Open VLM.

Новый бенчмарк выявил существенные ограничения в способности современных моделей рассуждать о динамических сценах, несмотря на успехи в распознавании образов.

Числовые тени в языковых моделях: как скрытые связи влияют на понимание

Анализ корреляции слоёв в моделях Qwen2.5-3B и Llama 3.1 70B демонстрирует, что степень соответствия атрибутов (оранжевый) и степень их загрязнения (зелёный) тесно связаны с корреляцией между предсказанными и фактическими значениями (синий) для пар признаков, связанных с годом рождения/началом работы и областью/населением.

Исследование показывает, что большие языковые модели могут смешивать информацию о различных числовых характеристиках, приводя к непредсказуемым результатам.

Рассуждения ИИ в таблицах: Новый вызов для больших языковых моделей

Существующие наборы данных для анализа таблиц зачастую ограничены в своей применимости к реальным, разнородным информационным системам, в то время как RUST-BENCH объединяет данные, охватывающие сразу несколько аспектов сложности – специфичность предметной области, длину таблиц, полуструктурированность и сложность запросов – что позволяет более адекватно оценивать и разрабатывать решения для практических задач.

Исследование демонстрирует, насколько сложно для современных систем искусственного интеллекта эффективно анализировать и делать выводы на основе данных, представленных в виде таблиц с неструктурированным текстом.

Познай Себя: Разговорчивый помощник для понимания языковых моделей

Конвейер KnowThyselff обеспечивает точную атрибуцию токенов и оценку предвзятости, что демонстрируется на двух примерах, подтверждающих математическую чистоту и доказуемость алгоритма.

Новая платформа делает интерпретацию сложных нейросетей более доступной благодаря интерактивным визуализациям и объяснениям на естественном языке.