Умные, но компактные: где кроются слабости мультимодальных моделей?

Новое исследование показывает, что при уменьшении размера мультимодальных систем ключевым препятствием становится качество визуального восприятия.

Новое исследование показывает, что при уменьшении размера мультимодальных систем ключевым препятствием становится качество визуального восприятия.

Новое исследование предлагает геометрический подход к оценке сложности текста, позволяющий глубже понять различия между научным и художественным стилями.

Исследователи разработали систему, позволяющую создавать правдоподобные видеоролики, основываясь на простых эскизах и проверке физической состоятельности.

Новое исследование показывает, как социологи осваивают инструменты генеративного искусственного интеллекта и какие опасения это вызывает в научном сообществе.

Новый подход позволяет генерировать реалистичные и связные видеоролики, демонстрирующие процесс создания картин, используя передовые модели машинного обучения.

Новое исследование выявляет склонность больших языковых моделей к «подхалимажу», когда они ставят согласие с пользователем выше фактической точности.

В статье представлена система AutoRocq, использующая возможности больших языковых моделей и агентного подхода для автоматической верификации сложных программных систем.

Новое исследование показывает, что проблема ‘коллапса разнообразия’ в генеративных моделях изображений кроется в ранних стадиях генерации и предлагает способ её решения.

Новое исследование показывает, что снижение доверия к человеческим источникам информации может приводить к росту доверия к искусственному интеллекту как к альтернативному советчику.

Исследователи разработали модель VLA-4D, позволяющую роботам более эффективно планировать и выполнять сложные манипуляции, учитывая не только пространство, но и время.