Управляя мыслями машины: точная настройка больших языковых моделей

В разработанном конвейере селективного управления, проекции средних значений положительного (красного) и отрицательного (синего) классов на выбранное направление признака используются для определения слоёв, требующих коррекции - только в слоях с противоположными знаками проекций ([latex]k-2[/latex] и [latex]k+1[/latex]) применяется вращение, сохраняющее норму, в то время как слои с одинаковыми знаками ([latex]k-1[/latex]) остаются неизменными, что обеспечивает точечное воздействие на процесс обучения.

Новый метод позволяет более эффективно контролировать поведение больших языковых моделей, сохраняя при этом связность и логичность генерируемого текста.

Цифровые Двойники с Инициативой: Разбираемся в Возможностях

Системы агентности проявляются на трёх уровнях: от внешнего, где цифровые двойники служат инструментами под контролем, до внутреннего, где внедренные агенты принимают самостоятельные решения, и, наконец, распределённого, где управление возникает как эмерджентное свойство сетевого взаимодействия.

В статье представлена классификация способностей цифровых двойников, способных активно влиять на моделируемую реальность, и обсуждаются связанные с этим риски и перспективы.

Искусственный интеллект на службе лекарства: Новый подход к поиску модуляторов GPCR

Разработанный фильтр GPCR-Filter интегрируется в процесс открытия модуляторов GPCR, используя исключительно последовательности GPCR для уточнения результатов докинга после начального структурно-ориентированного виртуального скрининга, при этом последовательности GPCR преобразуются в представления на уровне остатков с помощью предварительно обученной языковой модели белков, а SMILES лигандов кодируются в характеристики на уровне атомов посредством молекулярной графовой нейронной сети, объединяемых модулем перекрестного внимания для вычисления вероятности взаимодействия.

Ученые разработали систему, использующую глубокое обучение для более эффективного и точного выявления перспективных лекарственных соединений, воздействующих на важный класс рецепторов.

Самообучающиеся агенты: от хрупкости к надежности

Предлагаемый агентный дизайн, интегрированный с ReAct, расширяет возможности агента, позволяя ему более эффективно решать задачи благодаря улучшенной структуре взаимодействия и планирования.

В новой работе представлена системно-теоретическая основа и каталог шаблонов проектирования, призванные повысить устойчивость и предсказуемость автономных систем искусственного интеллекта.

Оптимизация обучения гигантских языковых моделей: новый взгляд на сервер параметров

В архитектуре FSDP с ODC, система функционирует как децентрализованный параметрический сервер, где чётко разграничены серверная и рабочая части, что позволяет эффективно распределять вычислительную нагрузку и масштабировать процесс обучения.

В статье рассматривается адаптация архитектуры сервера параметров для эффективного обучения больших языковых моделей с использованием современных методов параллелизма данных.

Восприятие пространства: как невидимость помогает машинам видеть глубже

Разработанный метод предварительного обучения MDM использует естественные пропуски в измерениях глубины RGB-D сенсоров в качестве масок для обучения метрически-корректным, полным и точным представлениям глубины, в результате чего модель LingBot-Depth служит мощным априорным знанием о пространственном восприятии для последующих задач, таких как отслеживание 3D точек и захват предметов.

Новый подход к обработке данных с RGB-D камер позволяет создавать более точные 3D-модели окружения, даже при наличии неполной информации о глубине.

Метаповерхности: Как физика и ИИ объединяются для надёжного дизайна

Оптимизация с использованием суррогатных моделей низкой точности может приводить к ошибочным результатам при отклонении от области обучения, в то время как подход, учитывающий неопределённость и использующий многоуровневые вычисления, эффективно сбалансирует исследование и эксплуатацию, обеспечивая надежную оптимизацию, причём в данном исследовании подтверждается эффективность использования физически обоснованных правил в качестве метрики неопределённости при решении реальной задачи проектирования метаповерхностей.

Новый подход к оптимизации дизайна метаповерхностей сочетает в себе физически обоснованное моделирование неопределенности и возможности искусственного интеллекта, повышая эффективность и надежность процесса проектирования.

Стратегическое планирование: новые вызовы для интеллектуальных агентов

Предложенный эталон DeepPlanning обеспечивает комплексную основу для оценки и развития алгоритмов планирования.

Исследование выявляет слабые места современных ИИ-систем в решении долгосрочных задач, требующих самостоятельного поиска информации и соблюдения ограничений.

Химический интеллект: новый подход к созданию молекул

Модель ChemCRAFT демонстрирует превосходство над другими химическими языковыми моделями в различных областях, что подтверждается анализом кривых обучения для этапов обучения с использованием и без инструментов, а также частотой использования инструментов, при этом она отличается низкой стоимостью вычислений и более эффективной длиной токена по сравнению с другими многоагентными химическими системами, что указывает на прямую взаимосвязь между производительностью и длиной токена.

Исследователи представили систему ChemCRAFT, использующую обучение с подкреплением для расширения возможностей языковых моделей в области химии и автоматизации процессов молекулярного дизайна и синтеза.