Память на века: Как научить ИИ долгосрочному планированию

Система, представленная на рисунке, оптимизирует работу с длинными последовательностями действий, заменяя обширные траектории использования инструментов сжатыми, индексированными сводками, при этом сохраняя детали в отдельном хранилище, что позволяет повторно извлекать и внедрять точный контент по индексу для эффективного выполнения задач в условиях ограниченного контекстного окна.

Новая система Memex(RL) позволяет агентам искусственного интеллекта эффективно хранить и использовать прошлый опыт для выполнения сложных задач, требующих долгосрочного планирования.

Хрупкость вычислений: надежность нейроускорителей нового поколения

Кривая, отображающая точность (КРП), демонстрирует, как вариации в характеристиках аппаратного обеспечения влияют на производительность нейронной сети; смещение кривой в красной области указывает на снижение точности при увеличении этих вариаций.

Статья посвящена анализу и методам повышения надежности вычислительных систем, основанных на архитектуре Compute-in-Memory, в условиях вариативности и неидеальности компонентов.

Интеллектуальная защита: от разведданных об угрозах к автоматической настройке брандмауэра

Архитектура предложенного агента демонстрирует принципиально новый подход к организации взаимодействия, позволяющий достигать гибкости и эффективности благодаря внутренней структуре, ориентированной на автономное принятие решений.

Новая система объединяет возможности больших языковых моделей и семантического анализа для повышения эффективности предотвращения вторжений.

Световой Хронотоп: Фокусировка Импульсов для Квантовых Эффектов

Фотонный таутохрон, управляемый двумя импульсными последовательностями с периодом повторения [latex]\pi/2[/latex], демонстрирует мультистабильность, позволяя кодировать информацию в виде четырех различных осциллирующих состояний, соответствующих комбинациям битов [latex]|00\rangle[/latex], [latex]|01\rangle[/latex], [latex]|10\rangle[/latex] и [latex]|11\rangle[/latex], при этом интенсивность импульсов подобрана для работы именно в мультистабильном режиме, а насыщенность цветовой шкалы ограничена [latex]1/10[/latex] от пиковой интенсивности для обеспечения наглядности.

Новое исследование демонстрирует, как создание параболического потенциала для света позволяет усиливать нелинейные оптические явления и открывает путь к более эффективным квантовым устройствам.

Инженерная логика в компактных нейросетях: обучение с подкреплением для решения задач механики балок

Процесс PE-RLVR-FT адаптирует дистиллированную языковую модель к решению задач из области механики балок: модель, дополненная обучаемыми LoRA-адаптерами, генерирует варианты ответов на вопросы из синтетического набора данных, после чего детерминированная функция вознаграждения, оценивающая соответствие формату и корректность статических расчетов балок, преобразует их в сигналы относительного преимущества, используемые алгоритмом GRPO для обновления исключительно параметров LoRA, оставляя веса предобученной основы неизменными.

Новый подход позволяет эффективно обучать небольшие нейросети решать сложные инженерные задачи, используя обучение с подкреплением и верифицируемые награды.

Поиск с пониманием: Новая стратегия для интеллектуальных агентов

В ходе исследования для задачи BrowseComp-Plus, система AgentIR-4B, ориентированная на рассуждения, демонстрирует превосходство над традиционным поиском на основе вложений Qwen3-Embedding-4B при взаимодействии с агентом Tongyi-DR, что указывает на важность учета логических связей при извлечении информации.

Исследователи предлагают подход, позволяющий агентам глубже понимать контекст запроса и находить более релевантную информацию для сложных исследований.

Совместный разум: Соревнования ИИ в поисках научных открытий

В рамках предложенной архитектуры MACC каждый агент самостоятельно формирует модель и предоставляет свои результаты на централизованную доску объявлений, управляемую стимулами, где оценка и распределение вознаграждений осуществляются в соответствии с заданными институциональными параметрами.

Новая платформа MACC позволяет исследовать, как взаимодействие между искусственными агентами и правильно выстроенные стимулы могут ускорить научные исследования.