Поиск с разумом: Как научить ИИ признавать свои границы
![Предложенная схема BAPO осуществляет обучение посредством чередования рассуждений агента, генерирующего множество вариантов решения для каждого вопроса путем комбинирования логических цепочек и взаимодействия с внешней средой, и вычисления вознаграждения, состоящего из оценки корректности ответа [latex]\mathcal{R}^{\textit{Correct}}[/latex], поощрения за выдачу ответа «не знаю» [latex]\mathcal{R}^{\textit{IDK}}[/latex] при отсутствии верного решения, а также адаптивного модулятора, динамически отключающего [latex]\mathcal{R}^{\textit{IDK}}[/latex] в зависимости от соотношения ответов «не знаю» на этапе исследования и разнообразия вариантов на этапе стабилизации.](https://arxiv.org/html/2601.11037v1/x2.png)
Новый подход к обучению ИИ позволяет ему надежнее искать информацию и честно говорить, когда ответа у него нет.
![Предложенная схема BAPO осуществляет обучение посредством чередования рассуждений агента, генерирующего множество вариантов решения для каждого вопроса путем комбинирования логических цепочек и взаимодействия с внешней средой, и вычисления вознаграждения, состоящего из оценки корректности ответа [latex]\mathcal{R}^{\textit{Correct}}[/latex], поощрения за выдачу ответа «не знаю» [latex]\mathcal{R}^{\textit{IDK}}[/latex] при отсутствии верного решения, а также адаптивного модулятора, динамически отключающего [latex]\mathcal{R}^{\textit{IDK}}[/latex] в зависимости от соотношения ответов «не знаю» на этапе исследования и разнообразия вариантов на этапе стабилизации.](https://arxiv.org/html/2601.11037v1/x2.png)
Новый подход к обучению ИИ позволяет ему надежнее искать информацию и честно говорить, когда ответа у него нет.
Статья исследует, как машинное обучение меняет научную практику и как ученым сохранить контроль над процессом познания в эпоху алгоритмов.

Новое исследование выявляет проблему искажения фактов в больших языковых моделях, обученных на личных данных, и предлагает способы её решения.

Исследование показывает, как вдохновение из физики и экологии позволяет создавать более компактные и производительные нейронные сети.

Новая модель позволяет создавать правдоподобные движения человека, управляя каждой частью тела и последовательностью действий на основе текстовых инструкций.
Обзор посвящен созданию цифровых двойников человеческих органов и их потенциалу для радикального улучшения диагностики и лечения.

Новое исследование показывает, что продвинутые навыки рассуждения в больших языковых моделях могут возникать не только за счет увеличения их размера, но и благодаря симуляции социального взаимодействия и обмена мнениями.

Новое исследование показывает, что предоставление пользователям фактических доказательств вместе с объяснениями от систем искусственного интеллекта значительно повышает доверие к проверке фактов и точность оценок.

Исследователи предлагают принципиально новый подход к организации памяти для языковых агентов, позволяющий им сохранять и использовать информацию на протяжении неограниченно длительных периодов.

Исследователи предлагают переосмыслить «забывчивость» больших языковых моделей, рассматривая её не как недостаток, а как полезный когнитивный механизм, аналогичный человеческой памяти.