Трансформеры без тормозов: Новый подход к нормализации

Функция Dynamic erf (Derf), разработанная как точечная, демонстрирует превосходство над слоями нормализации и другими точечными функциями, обеспечивая более высокую производительность в задачах классификации и генерации изображений Imagenet-1K, а также в моделировании последовательностей ДНК за счет независимого скалярного отображения каждого элемента, в отличие от нормализации каналов, используемой в LayerNorm, и аналогичного подхода DyT, что подтверждает возможность превзойти нормализацию с помощью тщательно подобранной точечной функции.

Исследователи предлагают отказаться от традиционных слоев нормализации в архитектурах трансформеров, демонстрируя повышение обобщающей способности моделей.

Виртуальные миры под контролем: новая оценка реалистичности симуляций

Представленный анализ демонстрирует, что ни одна существующая модель не преуспевает во всех аспектах создания реалистичного представления окружающего мира, охватывающего $24$ измерения визуальной достоверности, геометрической согласованности, функциональной надежности и перцептивного соответствия, что подчеркивает необходимость сбалансированного развития в области физически и поведенчески реалистичного моделирования мира.

Исследователи представили комплексный инструмент WorldLens для всесторонней оценки генеративных моделей мира, используемых в симуляциях вождения и других приложениях.

Самообучающийся агент для моделирования белков и лигандов

Исследование демонстрирует последовательность действий, включающую извлечение структуры, предварительную обработку, генерацию параметров входной силы, сольватацию, уравновешивание и производственный процесс, применимую как к системам, состоящим только из белков, так и к белково-лигандным комплексам.

Новая система DynaMate автоматизирует весь процесс молекулярной динамики, от проектирования до анализа, значительно упрощая исследование взаимодействия белков и лекарств.

Уязвимость квантовой криптографии: скрытая опасность несовершенных детекторов

Рассматриваемая схема непрерывного охлаждения, основанная на перезаряжаемых унитарных преобразованиях $V$ и тепловом канале $\Gamma$, демонстрирует, что наиболее эффективная процедура перезарядки достигается последовательным обменом полным свапом, в то время как итеративное охлаждение с использованием не-гауссовых операций, таких как обмен возбуждением для $p \geq 2$, позволяет оптимизировать процесс.

Новое исследование показывает, что даже в идеальных системах квантового распределения ключей (QKD) несоответствие эффективности детекторов может стать каналом для атак злоумышленников.

Понимание скрытых механизмов: как сделать ИИ более прозрачным

Принцип минимальной причинности позволяет создавать интерпретируемые изображения из текста посредством иерархических концептуальных графов, что открывает возможности для улучшения производительности в последующих задачах.

Новое исследование предлагает теоретическую основу для выявления интерпретируемых концепций в генеративных моделях, открывая путь к более контролируемым и понятным системам искусственного интеллекта.

Ловим ошибки: Анализ дефектов в квантовых детекторах Google Willow

В ходе выполнения вычислений на 105-кубитном чипе Google для кода поверхности $d=7$ с использованием объединенных синдромов при $r=7$, наблюдается статистически значимая корреляция между детекторами при расстоянии Левенштейна не менее 8 и конечными точками в одном раунде, отраженная в скорости возбуждения $-\theta_{i,j}$.

Новое исследование предлагает методы оценки моделей ошибок детекторов, выявляя аномальные источники шума и характеризуя производительность квантовых устройств.

Наука из текста: извлечение знаний из научных публикаций

Система SciEx обрабатывает научные PDF-документы, извлекая текст, научные иллюстрации и изображения, структурируя данные в JSON и сохраняя их в контекстуализированной базе данных, после чего, на основе запроса исследователя или с использованием LLM, модуль REV итеративно извлекает, верифицирует и агрегирует информацию из нескольких источников, унифицируя терминологию и предоставляя структурированный JSON-ответ.

Новый подход позволяет автоматически извлекать структурированные данные из научных статей, преодолевая сложности работы с мультимодальными данными и сложными документами.