Кто написал: Искусственный интеллект или человек? Восприятие доверия к научным обзорам

При раскрытии информации об участии языковой модели в редактировании аннотаций, участники исследования демонстрируют выраженную склонность к выбору аннотаций, обработанных данной моделью, что указывает на существенное влияние источника текста на восприятие и предпочтения пользователей, при этом доверительные интервалы в 95% подтверждают статистическую значимость выявленной закономерности.

Новое исследование показывает, как читатели оценивают достоверность и надежность научных резюме, созданных с помощью больших языковых моделей.

Внутреннее устройство адронов: от распределений партонов к новым измерениям

В этой статье представлен всесторонний обзор функций распределения партонов и их обобщений, раскрывающих сложную структуру адронов в рамках квантовой хромодинамики.

Искусственный интеллект осваивает командную строку: новый полигон для испытаний

Задача Terminal-Bench состоит из инструкции, Dockerfile, набора тестов и эталонного решения, в рамках которой агенты выполняют тесты внутри контейнера, обеспечивая тем самым автоматизированную проверку и воспроизводимость результатов.

Исследователи представили Terminal-Bench — платформу для оценки возможностей ИИ-агентов в реалистичных сценариях работы с интерфейсом командной строки.

Ловушка Гибкости: Почему Ограничения в Порядке Декодирования Улучшают Рассуждения Моделей

Ограничение моделей на основе больших языковых моделей (dLLM) стандартным авторегрессивным порядком неожиданно расширяет пространство решений при рассуждениях, что позволило предложить подход “JustGRPO”, эффективно раскрывающий их потенциал за счёт отказа от сложных адаптаций произвольного порядка и использования стандартного GRPO.

Новое исследование показывает, что принудительный порядок генерации текста в диффузионных языковых моделях, вопреки интуиции, повышает их способность к логическому мышлению.

Искусственный интеллект в юриспруденции: как избежать вымысла и обеспечить достоверность

Новое исследование показывает, что для решения юридических задач более надежны системы, основанные на поиске и использовании проверенных данных, а не на генерации ответов ‘из головы’.

Фракталы в ускорении: Новая реализация DLA с помощью Numba

Динамика роста агрегатов в конфигурациях DLA демонстрирует закономерное замедление, проявляющееся в уменьшении мгновенной скорости роста [latex]\mathrm{d}N/\mathrm{d}t[/latex] с увеличением числа частиц [latex]N[/latex] из-за диффузионного экранирования, что подтверждается нормализованными кривыми роста [latex]N(t)/N_{max}[/latex] и эффективным радиусом агрегата [latex]R_{eff} = N^{1/D_f}[/latex].

Исследователи представили высокопроизводительную реализацию алгоритма диффузионно-лимитированной агрегации (DLA) на Python, используя JIT-компиляцию для значительного ускорения симуляций.

Единый взгляд: Новая модель для понимания и генерации изображений

В рамках фреймворка RAE, система OpenVision 3 демонстрирует способность генерировать высококачественные изображения для 256 классов ImageNet, что подтверждает ее эффективность в задаче условной генерации изображений.

Исследователи представили OpenVision 3 — архитектуру, объединяющую возможности вариационных автоэнкодеров и трансформаторов для достижения передовых результатов в задачах визуального анализа и синтеза.

Искусственный интеллект на службе лекарства: новый подход к молекулярному дизайну

В рамках разработанной системы ELILLM, молекулярные представления кодируются и используются для обучения суррогатной модели, предсказывающей результаты докинга, после чего, посредством стратегии отбора и декодирования с использованием больших языковых моделей, ограниченных химическими знаниями, генерируются новые молекулярные кандидаты, эффективность которых оценивается с помощью программного обеспечения для докинга, а полученные данные рекурсивно интегрируются для дальнейшей оптимизации процесса.

Исследователи предлагают инновационную систему, использующую возможности больших языковых моделей для создания перспективных лекарственных соединений.