Предсказание способностей больших языковых моделей: новый подход

Исследователи предлагают инновационную систему для оценки и прогнозирования производительности сложных нейросетей, основанную на сочетании статистического анализа и моделирования поведения.


![Стимулирование модели к более продолжительному рассуждению демонстрирует прирост производительности, однако сопутствующее снижение коэффициента уникальности [latex]R_{context}[/latex] указывает на склонность к повторениям.](https://arxiv.org/html/2602.11748v1/x9.png)
![На основе численного анализа, представленного на рисунке, величины [latex]W_1[/latex], [latex]W_2[/latex], [latex]W_3[/latex], [latex]W_4[/latex] и [latex]W_5[/latex] демонстрируют характерные распределения в фазовом пространстве [latex]R_2[/latex] с точностью до [latex]\mathcal{O}(\alpha_s^3)[/latex], что подтверждает точность моделирования распада тяжелых частиц на легкие с полулептонными каналами на следующем к следующему к следующему ведущему порядку в квантовой хромодинамике.](https://arxiv.org/html/2602.11537v1/x9.png)


