Голос и Зрение: Как Распознавание Речи Учитывает Оба Канала

Исследование предлагает три подхода к анализу вклада входных признаков в процесс генерации токенов, основанные на матрице Шэпли [latex]\bm{\Phi}[/latex]: GlobalSHAP для оценки общего баланса модальностей, GenerativeSHAP для отслеживания динамики вклада модальностей на этапах генерации, и TemporalAlignmentSHAP для изучения соответствия между позициями входных признаков и выходных токенов.

Новое исследование раскрывает, как модели машинного обучения комбинируют аудио- и визуальную информацию для более точного распознавания речи, даже в условиях помех.

Поэзия и Машина: Как Искусственный Интеллект Распознает Эмоции в Персидской Классике

Анализ энтропии эмоциональной окраски в поэтических размерах Руми и Парвин Этесами демонстрирует, что Руми мастерски использовал метры для передачи широкого спектра чувств, в то время как эмоциональное разнообразие в поэзии Парвин Этесами проявляется иным образом, что отражено в различиях энтропии распределения эмоций.

Новое исследование демонстрирует возможности искусственного интеллекта в анализе эмоциональной окраски персидской поэзии, открывая новые перспективы для цифровых гуманитарных наук.

Моделирование пучков частиц: новый подход к расчетам электромагнитных полей

На схеме представлен процесс согласования пучка частиц с ускоряющей структурой, в котором используются две сетки для вычислений самосогласованного поля и волновых эффектов, что позволяет детально смоделировать взаимодействие и оптимизировать параметры ускорения.

В статье представлена инновационная методика, позволяющая повысить точность и эффективность моделирования динамики пучков заряженных частиц в ускорителях.

Тонкий SVD в смешанной точности: ускорение вычислений без потери качества

На рисунке продемонстрировано сравнение точности различных алгоритмов вычисления сингулярного разложения (SVD) для узких и высоких матриц, где результаты, полученные на 80 тестовых матрицах (обозначенных номерами от 1 до 80 по оси абсцисс), позволяют оценить эффективность каждого метода.

В новой статье представлен алгоритм, позволяющий значительно повысить производительность вычислений сингулярного разложения (SVD) за счет использования смешанной точности и оптимизации работы с матрицей Грама.

Видео в деталях: Адаптивная токенизация для эффективной генерации

EVATok демонстрирует превосходную реконструкцию видео и качество последующей генерации, достигая значительной экономии в использовании токенов за счёт интуитивного подхода к их распределению: динамичные или сложные сцены кодируются большим количеством токенов, в то время как повторяющиеся или простые - меньшим.

Новый подход к кодированию видео позволяет динамически выделять ресурсы в зависимости от сложности сцены, значительно повышая качество и скорость обработки.

Личность вместо размера: как обучить умного AI-репетитора

Репозиторий агентов EduClaw структурирован по предметным областям и позволяет фильтровать их по уровню сложности, обеспечивая гибкую организацию и доступ к обучающим ресурсам.

Новое исследование показывает, что эффективность обучающих AI-агентов определяется не столько мощностью языковой модели, сколько глубиной и структурированностью их профиля и навыков.

Молекулярная динамика под присмотром ИИ: новый взгляд на химические процессы

Модель Chem4DLLM использует 4D-эквивариантный графовый энкодер (UMA) для преобразования каждого 3D-кадра [latex]\mathcal{X}\_{t}[/latex] в графовое вложение, которое затем проецируется и аддитивно объединяется с вложениями специальных токенов <graph>, после чего языковая модель (Qwen3-8B) принимает полученную последовательность вложений [latex]\mathbf{E}[/latex] в качестве префикса для авторегрессивной генерации выходных данных.

Исследователи разработали систему, позволяющую искусственному интеллекту понимать и анализировать сложные траектории движения молекул, открывая новые возможности для изучения химической динамики.

Алмазные нанофотонные резонаторы: игра света и поглощения

В микродиске из алмаза наблюдается насыщаемое поглощение, обусловленное дефектами: при низкой оптической интенсивности большинство дефектов находится в основном состоянии, однако с увеличением интенсивности происходит инверсия заселения дефектов, приводящая к снижению потерь на поглощение, что подтверждается зависимостью линейных коэффициентов поглощения и интенсивностей насыщения от длины волны, с выраженными нулевыми фононными линиями для двух потенциальных дефектов.

В новом исследовании показано, как дефекты в алмазных микрорезонаторах влияют на насыщаемое поглощение света, открывая перспективы для квантовых сенсоров и нелинейной фотоники.

Колебания температуры у горизонта событий: ключ к энтропии чёрных дыр?

Новое исследование связывает флуктуации температуры на горизонте событий чёрной дыры с математическими преобразованиями, известными как супертрансляции, предлагая новый взгляд на природу энтропии и хранение информации.