Проверка на правдивость: новый стандарт оценки больших языковых моделей

Представлен комплексный набор тестов, позволяющий объективно оценить, насколько достоверную информацию генерируют современные языковые модели.

Представлен комплексный набор тестов, позволяющий объективно оценить, насколько достоверную информацию генерируют современные языковые модели.

Новый подход позволяет автоматически извлекать структурированные данные из научных статей, преодолевая сложности работы с мультимодальными данными и сложными документами.

Новая работа предлагает принципиально новый взгляд на то, как нейросети учатся понимать и создавать сложные визуальные сцены, используя аналогии и модульный подход.

В статье представлен инновационный метод верификации длинных цепочек рассуждений, использующий активное обучение и обучение с подкреплением для повышения точности и эффективности.

Исследователи представили систему, способную решать олимпиадные задачи по математике, преодолевая ограничения по длине контекста и демонстрируя впечатляющие результаты.
Новое исследование устанавливает математическую связь между алгоритмами принятия решений в ИИ и фундаментальными принципами физики, открывая новые перспективы для понимания природы разума и агентности.

Новое исследование демонстрирует, как видеомоделирование позволяет эффективно и масштабно оценивать поведение роботов в сложных сценариях.
Исследование посвящено повышению эффективности решения проблем в программном обеспечении за счет применения методов искусственного интеллекта.

Представлена T-pro 2.0 — эффективная языковая модель, способная к глубокому анализу и рассуждениям на русском языке.

Новое исследование показывает, что сообщества искусственных агентов, придерживающихся разных ценностей, способны к более эффективному коллективному поведению и самоорганизации.