Врачебные диагнозы и искусственный интеллект: как формируются убеждения?

Управляемые убеждения формируются посредством запросов, структурированных таким образом, чтобы задать желаемый уровень уверенности в утверждении, выраженном в виде $P(A|B)$, где $A$ представляет собой убеждение, а $B$ - контекст.

Новое исследование показывает, как предварительные убеждения влияют на диагностические способности больших языковых моделей, работающих в роли врачей.

Мультимодальный синтез: динамическая маршрутизация для новых возможностей

Маршрутизатор демонстрирует динамическую адаптацию межслоевой маршрутизации, формируя различные паттерны связей в зависимости от семантики конкретных токенов, что указывает на его способность к тонкой настройке обработки информации.

Исследователи предлагают инновационный подход к генерации изображений и редактированию, основанный на адаптивной интеграции текстовой и визуальной информации.

Разумные машины: цена прогресса

Статья показывает, что стремление к повышению эффективности ИИ для рассуждений может быть сведено на нет растущими вычислительными потребностями, требуя новых подходов к учету и регулированию.

Видеохроника: Автоматическое разделение длинных видео на логичные главы

Модель автоматического сегментирования видео формирует структурированное представление контента, генерируя многоуровневые главы, включающие краткие заголовки, подробные аннотации с переработанными названиями, содержательными резюме и вводными описаниями ключевых моментов, а также точные по времени описания видеофрагментов, что обеспечивает эффективное и точное понимание видеоматериала.

Новая система использует возможности больших языковых моделей для структурирования часовых видеороликов, создавая удобную навигацию и иерархические дайджесты.

Визуальный интеллект: Модели учатся видеть и рассуждать самостоятельно

В разработанной структуре VisPlay, обучение ведется посредством совместной эволюции компонента, генерирующего вопросы на основе изображения, и многомодального решателя, где оптимизация первого осуществляется через максимизацию неопределенности замороженного решателя, измеряемой согласованностью генерируемых ответов, а второго - на отобранном наборе сложных вопросов, с использованием псевдо-меток, полученных на основе голосования большинства.

Новая разработка позволяет моделям компьютерного зрения и обработки естественного языка развивать свои способности к визуальному мышлению, используя лишь изображения и процесс самообучения.

Разумная машина: сможет ли ИИ стать автором научных статей?

В статье подробно описывается эксперимент ‘Проект Рахель’, в рамках которого была создана искусственная академическая личность для изучения проблем и последствий создания научных текстов с помощью ИИ.

Ожившие модели: Новый подход к цифровым двойникам человека

Скелет MHR демонстрирует принципы проектирования, позволяющие системам сохранять функциональность с течением времени, адаптируясь к неизбежному износу и старению.

В статье представлена система MHR, позволяющая создавать реалистичные и гибкие модели человека для широкого спектра приложений, от графики и компьютерного зрения до дополненной и виртуальной реальности.

Разум в Машине: Разные Взгляды и Будущее Искусственного Интеллекта

Статья исследует, как философские представления о природе интеллекта влияют на современные исследования в области искусственного интеллекта и подходы к обеспечению его безопасности.

Распознавание патологий на рентгене грудной клетки: новый подход с помощью текстовых инструкций

Исследователи разработали метод сегментации поражений на рентгеновских снимках грудной клетки, использующий возможности языковых моделей и автоматически сгенерированный масштабный набор данных.