Зрение сквозь сжатие: как нейросети понимают изображения с потерями

Потеря производительности VLM, вызванная сжатием изображений, успешно компенсируется предложенным методом, что подтверждается улучшением метрики BD, демонстрирующим эффективность подхода в сохранении качества визуальных представлений.

Новое исследование оценивает возможности современных моделей «зрение-язык» в обработке сжатых изображений и предлагает решение для повышения их эффективности.

Процессы под контролем: Анализ данных для эффективного бизнеса

В статье рассматривается, как анализ данных о бизнес-процессах позволяет не только оптимизировать их, но и учитывать человеческий фактор и создавать реальную ценность для организации.

Искусственный интеллект на страже лекарств: как нейросети оценивают безопасность назначений

Приложение для оценки врачом позволяет систематизировать сбор клинических данных, обеспечивая структурированный подход к диагностике и прогнозированию, что потенциально снижает вероятность ошибок и улучшает качество медицинской помощи.

Новое исследование показывает, что нейросети способны выявлять проблемы с безопасностью лекарств, но их ошибки часто связаны с нехваткой клинического контекста и понимания нюансов лечения.

Откуда взялась эта фраза? Анализ происхождения знаний в моделях ИИ

Анализ модели LIMO-v2 с использованием метода отслеживания происхождения рассуждений (Reasoning Distillation Provenance Tracing) показал, как вероятность выбора различных действий на этапах рассуждений меняется в зависимости от используемой

Новое исследование раскрывает, как отследить источник рассуждений в моделях, обученных с использованием дистилляции знаний, и понять, что является заимствованным, а что — собственным вкладом.

Самообучение с обратной связью: новый подход к анализу биологических последовательностей

Внедрение ошибок и обучение с отражением позволяют усилить способность к рассуждению в биопоследовательных моделях.

Исследователи разработали метод предварительного обучения, позволяющий моделям биологических последовательностей самостоятельно выявлять и исправлять ошибки в процессе анализа.

Искусственный интеллект на службе онкологии: новый взгляд на прогноз лечения рака легких

Новое исследование показывает, как современные алгоритмы обработки языка могут значительно повысить точность прогнозирования эффективности терапии рака легких.

Гибкая адаптация моделей «зрение-язык» для мобильных устройств

Иерархическая оптимизация рангов и динамическая адаптация в HyDRA позволяют эффективно настроить мобильные визуально-языковые модели (VLM) посредством обучения с подкреплением, где [latex]X_{t}[/latex] и [latex]X_{v}[/latex] обозначают текстовые и визуальные токены соответственно, а ранги, такие как [latex]R^{Up}[/latex], [latex]R^{Q}[/latex], [latex]R^{K}[/latex] и [latex]R^{Gate}[/latex], регулируют проецирование в полносвязных сетях.

Новый подход HyDRA позволяет эффективно настраивать модели, объединяющие зрение и язык, для работы на мобильных платформах, не увеличивая количество обучаемых параметров.