Сжатие интеллекта: Оценка точности квантования больших языковых моделей

Новое исследование подробно анализирует методы пост-тренировочного квантования, позволяющие уменьшить размер и повысить эффективность больших языковых моделей без существенной потери качества.
[/latex] и построение тензора [latex]B_{ij}^{q}[/latex], учтены; отсутствие данных в некоторых точках обусловлено нехваткой памяти GPU для проведения соответствующих вычислений.](https://arxiv.org/html/2601.08077v1/x4.png)

![В квантовой системе эволюция состояния из начальной точки [latex]|0\rangle[/latex] в целевую [latex]|1\rangle[/latex] демонстрирует успешное управление, что подтверждается полным перекрытием векторов состояний и, как следствие, их визуальным объединением в единый вектор на сфере Блоха.](https://arxiv.org/html/2601.08662v1/images/bloch_sphere_final.png)