Один пример – ключ к интеллекту: как обучить ИИ рассуждать?
![Оценка производительности комплексного обучения (MATH и LIMR) и различных выборок полиматематического обучения (Синтетические простые, естественные примеры пред-алгебры, [latex]\pi_{1}[/latex]) на базе Qwen2.5-7b-base демонстрирует, что применение жадного декодирования и скользящего усреднения с окном в 5 точек для AIME2024, AIME2025 и других эталонов позволяет выявить различия в эффективности различных подходов к обучению.](https://arxiv.org/html/2601.03111v1/x10.png)
Новое исследование показывает, что для существенного улучшения способности больших языковых моделей к логическому мышлению достаточно всего одного, тщательно подобранного или сгенерированного примера.

![Предложенный подход DiffCoT преодолевает проблему накопления ошибок, свойственную традиционным методам последовательного рассуждения [latex]CoT[/latex], за счет одновременного анализа как шумовых, так и временных измерений, что позволяет итеративно корректировать предыдущие ошибки и эффективно снижать предвзятость, возникающую при несоответствии между обучением и применением.](https://arxiv.org/html/2601.03559v1/x1.png)
![Расширенная нейро-символическая архитектура обеспечивает одновременное обучение как нейронными сетями, так и символьными системами: прямой вывод ([latex]deduce()[/latex] методы нейронного и символьного модулей, соединённые через транслятор) формирует предсказания, в то время как нейронная индукция (обучение нейронного модуля посредством обратного распространения ошибки, основанного на абдуктивных сигналах от символьного модуля) и символическая индукция (добавление новых правил в политику символьного модуля через его метод [latex]induce()[/latex] во время эволюционных мутаций) обеспечивают адаптацию и обогащение знаний системы.](https://arxiv.org/html/2601.04799v1/x2.png)




