Иллюзия Рассуждений: Почему Оценка Базовых Языковых Моделей Может Быть Обманчива

Новое исследование показывает, что оценка способности к рассуждению у языковых моделей, не обученных следовать инструкциям, может давать неверные результаты из-за их склонности к генерации правдоподобных, но не обязательно верных ответов.







