Искусственный интеллект в реальном мире: ускорение динамических моделей на грани вычислений

Ускорение на базе FPGA достигается за счет использования эквивалентной архитектуры, основанной на нейронных потоках, для реализации нейронных дифференциальных уравнений.

Новая разработка позволяет эффективно восстанавливать модели физических систем непосредственно на периферийных устройствах, открывая возможности для широкого спектра приложений.

Видение и язык: новый подход к анализу данных дистанционного зондирования

Многомасштабный конвейер объединения, представленный в данной работе, обрабатывает изображения низкого и высокого разрешения, извлекая многомасштабные признаки из высокоразрешенного изображения посредством скользящих окон, а затем объединяет их с признаками низкого разрешения посредством общей многомасштабной визуальной кодировки, после чего, используя механизм gating, внедряет объединенные детализированные признаки в выбранные скрытые слои большой языковой модели [latex]LLM[/latex].

Исследователи представили инновационную модель, объединяющую визуальную информацию и лингвистические запросы для более эффективной интерпретации спутниковых снимков.

Визуальный интеллект в сетях 6G: объединяя зрение и связь

В разработанной архитектуре предварительное обучение модели WMFM осуществляется в два этапа: на первом этапе формируется базовая модель, после чего отбрасываются проекционные головы, а на втором этапе предварительно обученная модель напрямую адаптируется для решения целевой задачи.

Новая модель объединяет данные беспроводных каналов со зрительной информацией, открывая возможности для точной локализации и анализа условий распространения сигнала в будущих сетях.

Радиомика и рак легких: новый словарь для «понимающего» ИИ

Исследователи разработали словарь, связывающий количественные признаки изображений с клиническими категориями Lung-RADS, чтобы сделать решения искусственного интеллекта в диагностике рака легких более прозрачными и надежными.

Пространственное мышление нейросетей: от основ к планированию

В рамках предложенной схемы обучения модель [latex]Qwen-Instruct[/latex] последовательно совершенствуется: сначала, посредством тонкой настройки на наборе данных Building Block, она осваивает базовые пространственные преобразования - трансляцию, масштабирование и вращение, формируя промежуточную модель [latex]Qwen-Physics[/latex], а затем, с использованием алгоритма GRPO и LoRA-адаптеров в замкнутом цикле обучения, приобретает навыки многошагового пространственного рассуждения и планирования, что приводит к созданию финальной модели [latex]Qwen-PhysRL[/latex].

Новый подход позволяет большим языковым моделям решать сложные задачи, требующие многошагового пространственного рассуждения и планирования действий.

Потоки данных и причинность: новый подход к машинному обучению

Сложный конвейер финансовых операций, представленный в виде направленного ациклического графа, обрабатывает рыночные данные посредством разработки признаков, машинного обучения, оптимизации портфеля и исполнения ордеров, при этом узлы, требующие одновременного доступа ко всем активам, ограничивают возможности пространственной разбивки, а минимальная задержка системы определяется критическим путем.

Исследователи представляют DataFlow — фреймворк, объединяющий пакетную и потоковую обработку данных временных рядов с акцентом на воспроизводимость и производительность.

Скрытые паттерны дискриминации: как выявить и объяснить

ГиFairFramework представляет собой основу, предназначенную для обеспечения справедливости в алгоритмах машинного обучения, основанную на концепции [latex] \mathcal{F} [/latex]-дискриминации, которая формально определяет расхождения в распределениях результатов для различных групп, позволяя количественно оценить и минимизировать несправедливость.

Новое исследование предлагает комплексный подход к обнаружению систематических нарушений справедливости в нейронных сетях, выходящий за рамки индивидуальных случаев.