Искусственный интеллект: Стремление к идеалу или отражение реальности?
![В исследовании, охватившем четыре семейства игр, базовые модели демонстрируют превосходство над выстроенными в соответствии с человеческими предпочтениями, побеждая в соотношении 9.7:1 (213 против 22, [latex] p<10^{-{40}} [/latex]), при этом значительная часть пар моделей показывает низкую корреляцию с человеческим поведением (ниже 0.3).](https://arxiv.org/html/2603.17218v1/fig1_main_result.png)
Новое исследование показывает, что настройка больших языковых моделей на соответствие человеческим предпочтениям снижает их способность предсказывать поведение людей в стратегических ситуациях.



![Предлагаемая система совершенствует мета-модель [latex]\mathcal{M}=(\theta, \mathcal{S})[/latex] посредством двух взаимодополняющих циклов, работающих в различных временных масштабах: быстрой адаптации, основанной на навыках, анализирующей неудачные траектории и мгновенно расширяющей библиотеку навыков [latex]\mathcal{S}[/latex] без обновления параметров, и оптимизации политики, аккумулирующей пост-адаптационные траектории и, при наличии достаточного объема данных, использующей сигналы простоя (сон, бездействие, календарь) для инициирования обновления весов θ посредством тонкой настройки Cloud LoRA.](https://arxiv.org/html/2603.17187v1/x6.png)


