Искусственный интеллект — Страница 45

Обучение с подкреплением: как улучшить логическое мышление больших языковых моделей

17.01.2026 от Денис Аветисян

Для оценки траекторий взаимодействия, алгоритм разделяет процесс рассуждения на промежуточные шаги и вычисляет награду, основанную на соотношении энтропий между текущей и эталонной политиками, а также на конечном результате, позволяя таким образом количественно оценить качество и эффективность каждого шага в процессе принятия решений.

Новый подход к обучению с подкреплением позволяет значительно повысить способность больших языковых моделей к логическому мышлению и расширить границы их возможностей.

Искусственный интеллект настраивает тонкие пленки: новый подход к оптимизации ALD-процессов

17.01.2026 от Денис Аветисян

Исследование демонстрирует, что агенты искусственного интеллекта, использующие языковые модели рассуждений, способны автономно оптимизировать процессы атомно-слоевого осаждения (ALD), достигая результатов, сопоставимых с опытом экспертов-технологов.

Безопасные агенты: как защитить ИИ от вредоносных действий

17.01.2026 от Денис Аветисян

Предложенная схема проактивной защиты и обратной связи для агентов на основе больших языковых моделей, обозначенная как TS-Guard, обеспечивает безопасное рассуждение при вызове инструментов, передавая агенту информацию о нарушениях ограничений вместо прерывания выполнения, что позволяет динамически корректировать поведение системы.

Новая разработка позволяет предвидеть и блокировать опасные команды, которые могут выполнить языковые модели с доступом к инструментам.

Искусственный интеллект и сценарии выживания: таксономия рисков

17.01.2026 от Денис Аветисян

В статье представлена система классификации потенциальных угроз, связанных с развитием искусственного интеллекта, основанная на анализе вероятных сценариев сохранения человечества.

Молекулярный конструктор: ИИ создает соединения с заданными свойствами

17.01.2026 от Денис Аветисян

Система M4olGen осуществляет итеративное проектирование молекул, начиная с поиска кандидатов, соответствующих заданным критериям (QED, LogP, молекулярный вес), и последующего уточнения их структуры посредством многошагового алгоритма оптимизации, управляемого GRPO, для достижения требуемых характеристик, основываясь на анализе локальным решателем и обратной связи от оценщика.

Новый подход на базе искусственного интеллекта позволяет генерировать молекулы, точно соответствующие нескольким заданным параметрам одновременно.

Биоматериалы и ИИ: Новое поколение производства

17.01.2026 от Денис Аветисян

Исследование посвящено применению искусственного интеллекта и машинного обучения для оптимизации процессов производства из возобновляемых и биооснованных материалов.

Визуальные размышления: новый подход к мультимодальному мышлению

16.01.2026 от Денис Аветисян

Предложенный метод LaViT представляет собой концептуальную основу для исследования закономерностей в визуальных данных, позволяя выявить скрытые связи и зависимости.

Исследователи предлагают инновационную архитектуру, позволяющую моделям лучше понимать связь между текстом и изображениями, приближая их к человеческому восприятию.

Помощник в браузере: Искусственный интеллект без слежки

16.01.2026 от Денис Аветисян

Встроенный в браузер поисковый помощник, ориентированный на поведение, представляет собой комплексную систему, обеспечивающую взаимодействие и доступ к информации непосредственно в контексте пользовательской активности.

Новый подход к поиску в интернете предлагает персонализированную помощь прямо в браузере, не отправляя ваши данные в облако.

Поиск по медицинским записям: как искусственный интеллект понимает пациентов?

16.01.2026 от Денис Аветисян

Новое исследование демонстрирует, что современные системы искусственного интеллекта все еще испытывают трудности с точным извлечением данных из электронных медицинских карт и сложным клиническим анализом.

Под контролем: Как обезопасить поведение ИИ-агентов

16.01.2026 от Денис Аветисян

Архитектура AgentGuardian демонстрирует разделение потоков: оранжевые линии определяют генерацию политики, в то время как синие - её исполнение, что позволяет системе динамически адаптироваться к изменяющимся условиям и обеспечивать гибкое управление.

Новая разработка позволяет автоматически формировать правила доступа и контролировать исполнение, снижая риски, связанные с вредоносными запросами и непредсказуемостью больших языковых моделей.