Внутренний мозг нейросети: обнаружена система вознаграждения

В ходе исследования модели Qwen-2.5-14B-SimpleRL-Zoo на наборах данных GSM8K и MATH500 было продемонстрировано, что зондирование значений позволяет с высокой точностью предсказывать значения, опираясь лишь на небольшое количество нейронов, ответственных за оценку, что подтверждается результатами, представленными для слоев 2-4.

Новое исследование выявило в больших языковых моделях подсистему, функционирующую аналогично системе вознаграждения в мозге, определяющую ценность состояний и ошибки предсказания.

Полимеры и ИИ: Новый подход к материаловедению

Многоагентная система исследований полимеров демонстрирует комплексный набор результатов, отражающих взаимосвязь между различными параметрами и свойствами исследуемых материалов.

Исследователи разработали систему искусственного интеллекта, способную ускорить открытие и проектирование новых полимерных материалов, как синтетических, так и биополимеров.

Как оценить беспристрастность искусственного судьи?

Качество скрытых представлений, оцениваемое медианой θ, демонстрирует корреляцию с оценками согласованности SummEval и метрикой MIE PQ VIEScore; при этом, результаты, полученные различными моделями-судьями, показывают тенденции, сопоставимые с оценками, данными человеком.

Новое исследование предлагает метод диагностики надежности больших языковых моделей в роли оценщиков, отделяя внутреннюю согласованность от соответствия человеческим суждениям.

Самообучающаяся химия: QUASAR автоматизирует атомные симуляции

Архитектура QUASAR предусматривает гибкую систему итеративного уточнения, где пунктирные линии обозначают необязательные пути обратной связи, позволяющие оптимизировать процесс и достичь желаемого результата.

Новая система, основанная на больших языковых моделях, способна самостоятельно проводить сложные расчеты в области вычислительной химии, открывая эру автономных научных исследований.

Сила в Обучении: Как Подготовка к Обучению с Подкреплением Повышает Эффективность Языковых Моделей

На основе анализа результатов, полученных на наборе данных SynLogic, PEAR демонстрирует стабильное улучшение производительности после обучения с подкреплением, что подтверждается показателями Pass@1 и Pass@8, при этом базовый метод Single Step IS корректирует каждый токен исключительно на основе его вероятностного соотношения.

Новое исследование показывает, что высокая производительность языковой модели при стандартном обучении не гарантирует успеха при дальнейшем обучении с подкреплением, и предлагает метод решения проблемы несоответствия данных.

Искусство управления ИИ: Как добиться большего от больших языковых моделей

В статье рассматриваются эффективные методы разработки запросов, позволяющие значительно повысить производительность ИИ в задачах анализа данных.

Иллюзии Искусственного Взгляда: Как обмануть детекторы сгенерированных изображений

Анализ частотной области демонстрирует, что стандартные методы восстановления изображений вносят глобальные спектральные артефакты, которые эффективно устраняются предложенным методом обмена данными, обеспечивая более естественное восстановление.

Новое исследование показывает, что современные детекторы изображений, созданных нейросетями, часто полагаются на легко устранимые артефакты, а не на выявление реальных манипуляций.

Правовая основа для управления искусственным интеллектом будущего

Статья рассматривает необходимость смещения фокуса в регулировании ИИ с разработки правил как таковых на создание правовой инфраструктуры, способной эти правила генерировать и внедрять.

Робот, который видит, понимает и действует: новая эра общего назначения

Робототехническая платформа Green-VLA использует визуальный опрос-ответ и данные о робототехнике для обучения, позволяя адаптировать и специализировать роботов для новых конструкций, развивать пространственное мышление, обобщать задачи, выполнять сложные манипуляции и восстанавливаться после сбоев.

Исследователи представили Green-VLA — модель, объединяющую зрение, язык и действия, позволяющую роботам эффективно выполнять разнообразные задачи в различных условиях.

Искусственный интеллект на службе симметрии: от данных к пониманию

В машинном обучении симметрия интегрируется тремя парадигмами: архитектурной, где инвариантность или эквивариантность задается изначально; неявной, достигаемой через аугментацию данных или самообучающиеся целевые функции; и возникающей, при которой симметричная организация проявляется в латентных представлениях без явного принуждения, что позволяет диагностировать структуру данных.

Новое исследование демонстрирует, как алгоритмы машинного обучения могут выявлять скрытые симметрии и упрощать анализ сложных физических данных.