Память без границ: новый подход к обработке сверхдлинных текстов

Механизм MSA объединяет отбор top-k с разреженным вниманием, обеспечивая масштабируемость и возможность дифференцируемого обучения, при этом позволяя отключать документы во время инференса для повышения устойчивости к экстраполяции и демонстрируя стабильную производительность с менее чем 9% снижением на наборе данных MS MARCO в беспрецедентном диапазоне контекста от 16K до 100M токенов, несмотря на ограничения максимальной длины контекста, влияющие на завершение некоторых кривых.

Исследователи предлагают инновационный метод, позволяющий языковым моделям эффективно работать с контекстом в 100 миллионов токенов, приближая их к человеческим возможностям восприятия информации.

Текстуры вместо Гауссиан: Новый подход к синтезу видов

Архитектура LGTM разделяет геометрию и текстуру: сеть примитивов [latex]f_{prim}[/latex] предсказывает компактные геометрические параметры [latex]{\bm{\mu}}, {\bm{s}}, {\bm{r}}, {\bm{c}}[/latex] по изображениям низкого разрешения, в то время как сеть текстур [latex]f_{texture}[/latex], обрабатывая изображения высокого разрешения с использованием сетевых блоков патчификации и проективного отображения, формирует карты текстур [latex]{\bm{T}}^{\alpha}, {\bm{T}}^{c}[/latex] для каждого примитива, что позволяет реализовать прямой 4K Gaussian splatting с существенно меньшим количеством примитивов.

Исследователи предложили метод, позволяющий создавать реалистичные изображения с разных точек обзора, используя текстурированные гауссианы и отказываясь от сложной оптимизации для каждой сцены.

Искусственный интеллект и приватность: как объяснения помогают укрепить доверие

В системе опосредованной искусственным интеллектом коммуникации, координатор на базе ИИ выполняет функцию конфиденциального посредника между исследователем и соавтором, удаляя чувствительную информацию и предоставляя получателю необходимые разъяснения, что позволяет обеспечить безопасный и контролируемый обмен данными.

Новое исследование показывает, что предоставление пользователям информации о причинах сокрытия данных искусственным интеллектом повышает их понимание и доверие к системе.

Зрение без границ: Новый подход к улучшению моделей компьютерного зрения

Исследователи предлагают простой, но эффективный метод повышения точности и надежности моделей компьютерного зрения за счет объединения информации из изображений разного разрешения.

Обучение машинному зрению: как нейросети постигают законы симметрии

В представленной работе исследуется структура модели машинного обучения, учитывающей симметрии, где соблюдение групповой эквивариантности обеспечивается соответствием преобразований предсказаний модели и входных данных под действием операций симметрии группы, а количественная оценка ошибок эквивариантности и содержания симметрии в внутренних признаках осуществляется посредством метрик [latex]A_{\alpha}[/latex] и [latex]B_{\alpha}[/latex], основанных на дисперсии преобразованных предсказаний и разложении признаков по группам симметрии, полученном с использованием интеграла Хаара.

Новое исследование показывает, что неявно обученные модели машинного обучения способны эффективно выявлять и использовать физические симметрии в данных.

Автопилот, который понимает: Vega учится водить по текстовым командам

Инструкции на естественном языке используются для управления планированием действий, что наглядно демонстрируется визуализацией их влияния на изображения с фронтальной камеры и карты BEV.

Новая модель Vega демонстрирует способность к автономному вождению, опираясь на понимание естественного языка и планирование действий на основе визуальной информации.

Беспроводной мир в машинном обучении: новый подход к сетям 6G

Для создания масштабного многомодального беспроводного набора данных, охватывающего разнообразные симулированные и реальные среды, были собраны данные, включающие трёхмерные облака точек сцен, траектории пользователей и синхронизированные по времени данные CSI, причём для моделирования использовались как фотографии реальных городских ландшафтов - площади Звезды в Париже, Запретный город в Пекине, городской район Мюнхена и Уолл-стрит в Нью-Йорке, - так и соответствующие трёхмерные модели, построенные на основе географических данных и карт покрытия сигнала, а также данные, полученные в ходе измерений на открытом воздухе с использованием прототипа системы 6G и траектории мобильных устройств.

Исследователи предлагают концепцию «Беспроводной модели мира», объединяющую многомодальные данные и физически обоснованный искусственный интеллект для создания интеллектуальных сетей нового поколения.

Интеллектуальный помощник для ядерных реакторов: Автоматизация подготовки данных для моделирования

Структура входного файла кода системы SAM определяет основу для организации и взаимодействия компонентов, предсказывая потенциальные точки отказа и определяя возможности для будущего развития системы.

Новая система AutoSAM использует возможности искусственного интеллекта для значительного упрощения и ускорения процесса создания входных файлов для сложных ядерных симуляций.