Разумные машины: Как обучить большие языковые модели мыслить?

В обучении с подкреплением, основанном на подсказках, возникают три ключевые проблемы: резкое улучшение производительности при появлении даже короткого сегмента полезной подсказки, возрастающая неоднозначность и расширение пространства поиска при использовании более длинных или абстрактных подсказок, а также компромисс между эффективностью подсказки и возрастающими вычислительными затратами, связанными с использованием моделей-учителей или многоступенчатой курацией.

Новая методика KnowRL позволяет значительно улучшить способность больших языковых моделей к рассуждениям, используя обучение с подкреплением и тщательно отобранные знания.

Реалистичные миры для ИИ: новый симулятор на базе Gaussian Splatting

Платформа Habitat-GS, использующая 3DGS и динамические гауссовские аватары, обеспечивает более реалистичное и детализированное моделирование сред для обучения навигационных агентов, сохраняя высокочастотные визуальные детали и эффекты, зависящие от точки зрения, в отличие от традиционных симуляторов на основе полигональных сеток, и тем самым способствуя разработке более устойчивых и адаптивных систем автономной навигации.

Разработчики представили Habitat-GS — платформу для обучения ИИ-агентов навигации в фотореалистичных 3D-средах, созданных с помощью передовой технологии Gaussian Splatting.

Скрытая уверенность: как большие языковые модели оценивают собственные ответы

Исследование производительности многослойных перцептронов (MLP) в задачах математического рассуждения на наборах данных GSM1K и MATH демонстрирует, что увеличение выразительности зондов не выявляет скрытой привилегированной информации; внешние модели по-прежнему остаются эффективными предикторами, что указывает на ограниченность улучшения производительности за счет простого увеличения сложности зондирования.

Новое исследование показывает, что модели искусственного интеллекта обладают внутренним пониманием своей собственной точности, которое часто теряется из-за общего согласия между ними.

Самообучающаяся лаборатория: Искусственный интеллект на пути к новым материалам

Исследователи разработали автоматизированную платформу, управляемую ИИ, для синтеза и анализа сложных соединений, открывая новые возможности для материаловедения.

Сияние фотонов: новый уровень точности в предсказаниях столкновений частиц

Распределение инвариантной массы пар фотонов, рассчитанное с точностью до [latex]N^{3}LO[/latex], демонстрирует, что значения, полученные методом [latex]q_{T}[/latex]-разрезания при фиксированном [latex]r_{cut}[/latex], согласуются с прямыми вычислениями до [latex]NNLO[/latex], при этом остаточная зависимость от [latex]r_{cut}[/latex] в нижней панели остается в пределах статистической погрешности.

Исследователи представили наиболее точный на сегодняшний день расчет вероятности рождения пар фотонов в процессе столкновений частиц, значительно снизив неопределенность теоретических предсказаний.

Медицинские изображения в новом разрешении: подход на основе доменных представлений

Многомасштабное сравнение скрытых представлений выявило, что MedVAE обеспечивает более высокую степень соответствия между скрытыми представлениями реконструированных и исходных изображений (измеренная с помощью PSNR и косинусной близости) на всех уровнях пространственного понижения разрешения (от [latex]64\times 64[/latex] до [latex]1\times 1[/latex]) для данных МРТ коленного сустава, мозга и рентгеновских снимков грудной клетки, подтверждая, что специализированное для предметной области скрытое пространство лучше сохраняет информацию о высокой разрешающей способности на протяжении всей пространственной иерархии.

Новое исследование показывает, как использование специализированных автоэнкодеров позволяет значительно улучшить качество восстановления медицинских изображений.

Цифровые двойники: новый взгляд на стратегическое планирование

Динамическая байесовская сеть, лежащая в основе генеративной модели активного вывода для цифрового двойника, описывает взаимодействие между физическим пространством и выведенным цифровым пространством посредством условных зависимостей между случайными величинами, действиями, операторами генеративной модели и априорными предпочтениями, причём вывод состояния происходит в текущий момент времени [latex] t_{c} [/latex], а вывод политики распространяет цифровое состояние в будущее время [latex] t_{p} [/latex].

Исследование предлагает инновационный подход к моделированию сложных многоагентных систем и адаптации к динамично меняющимся условиям окружающей среды.

Искусственная сверхпроводимость: Новые горизонты в цепях КЭД

Исследование демонстрирует, что сверхпроводящий контур или массив контуров способны индуцировать спаривание в двумерной электронной системе, такой как графен, посредством квантовых флуктуаций квантованного магнитного потока.

Исследование демонстрирует возможность создания экзотических сверхпроводящих фаз и управления электронными свойствами материалов посредством тонкой настройки взаимодействий в квантовых электрических цепях.