Обучение с подкреплением: как улучшить логическое мышление больших языковых моделей

Для оценки траекторий взаимодействия, алгоритм разделяет процесс рассуждения на промежуточные шаги и вычисляет награду, основанную на соотношении энтропий между текущей и эталонной политиками, а также на конечном результате, позволяя таким образом количественно оценить качество и эффективность каждого шага в процессе принятия решений.

Новый подход к обучению с подкреплением позволяет значительно повысить способность больших языковых моделей к логическому мышлению и расширить границы их возможностей.

Искусственный интеллект настраивает тонкие пленки: новый подход к оптимизации ALD-процессов

Искусственный интеллект, управляющий процессом атомно-слоевого осаждения, функционирует посредством итеративного цикла: логический модуль формирует запросы и обрабатывает ответы, полученные от модуля искусственного интеллекта, который, используя модель рассуждений, определяет оптимальную стратегию оптимизации и запрашивает проведение дополнительных экспериментов в симулированном реакторе, что позволяет непрерывно совершенствовать процесс.

Исследование демонстрирует, что агенты искусственного интеллекта, использующие языковые модели рассуждений, способны автономно оптимизировать процессы атомно-слоевого осаждения (ALD), достигая результатов, сопоставимых с опытом экспертов-технологов.

Ускорение больших языковых моделей для периферийных устройств

Квантование моделей, оптимизированных алгоритмами Adam и Muon, демонстрирует снижение точности на восьми контрольных примерах, за исключением SIQA, где наблюдается её увеличение, что указывает на чувствительность к методу оптимизации при снижении вычислительной точности.

Новый подход позволяет эффективно сжимать и адаптировать крупные языковые модели для работы на устройствах с ограниченными ресурсами, сохраняя при этом высокую точность.

Искусственный интеллект и сценарии выживания: таксономия рисков

В статье представлена система классификации потенциальных угроз, связанных с развитием искусственного интеллекта, основанная на анализе вероятных сценариев сохранения человечества.

Математические экзамены: новый вызов для искусственного интеллекта

Сравнительный анализ производительности при отклонении запросов демонстрирует, что использование полностраничного ввода обеспечивает более надежные результаты по сравнению с режимом, ориентированным на отдельные вопросы.

Исследователи представили масштабный набор данных MathDoc для оценки способности моделей извлекать информацию из реальных экзаменационных работ по математике и распознавать неполные или нечеткие данные.

Молекулярный конструктор: ИИ создает соединения с заданными свойствами

Система M4olGen осуществляет итеративное проектирование молекул, начиная с поиска кандидатов, соответствующих заданным критериям (QED, LogP, молекулярный вес), и последующего уточнения их структуры посредством многошагового алгоритма оптимизации, управляемого GRPO, для достижения требуемых характеристик, основываясь на анализе локальным решателем и обратной связи от оценщика.

Новый подход на базе искусственного интеллекта позволяет генерировать молекулы, точно соответствующие нескольким заданным параметрам одновременно.

Биоматериалы и ИИ: Новое поколение производства

Исследование посвящено применению искусственного интеллекта и машинного обучения для оптимизации процессов производства из возобновляемых и биооснованных материалов.

Искусственный интеллект для микроэлектроники: новый подход к моделированию полупроводников

Набор примеров из эталонного набора TCAD демонстрирует широкий спектр типов вопросов - от операционных и концептуальных до относящихся к моделированию, - что подчеркивает глубину и разнообразие понимания предметной области, необходимого для создания высокоэффективных моделей.

Исследователи разработали метод создания специализированных языковых моделей, способных генерировать исполняемый код для сложных инженерных задач, даже при ограниченном объеме данных.