Искусство настройки: как улучшить генерацию изображений с помощью Diffusion Transformers

Калибр демонстрирует сравнимую производительность с Flow-GRPO на SD-3.5M, при этом требуя на 10510^{5} параметров меньше и предлагая возможность улучшения целевых метрик за счет интеграции с методами выравнивания.

Новый метод Calibri позволяет тонко настраивать блоки Diffusion Transformers для повышения качества изображений и ускорения работы без необходимости полной переподготовки модели.

Искусственный интеллект на пределе: новый вызов для самообучающихся систем

С момента появления в 2019 году, производительность передовых моделей искусственного интеллекта неуклонно растёт в рамках эталонного теста ARC-AGI, демонстрируя прогресс в решении задач, требующих общих когнитивных способностей.

Исследователи представили ARC-AGI-3 — сложный тест, который проверяет способность ИИ к адаптации и освоению новых навыков в интерактивной среде.

Управление Видео и Звуком: Новый Подход к Обучению Моделей

Система AVControl обучает каждую модальность управления посредством легковесных LoRA, демонстрируя возможность контролировать генерацию контента через пространственные параметры, траекторию камеры, движение, редактирование и аудиовизуальные данные.

Исследователи представили AVControl — гибкую систему, позволяющую эффективно обучать модели для управления аудиовизуальным контентом без масштабных переобучений.

Искусственный интеллект в здравоохранении: от изолированных систем к совместным решениям

Предлагаемая схема демонстрирует переход от разрозненного применения искусственного интеллекта к внедрению его в качестве полноценного партнёра в многостороннем уходе за пациентами, что позволяет оптимизировать взаимодействие между всеми участниками процесса.

Новый подход к применению ИИ в медицине рассматривает его не как самостоятельного агента, а как помощника, интегрированного в процесс принятия решений для улучшения взаимодействия между врачами, пациентами и другими заинтересованными сторонами.

Химик-Искусственник: Новый тест для интеллекта в химии

В исследовании Molquest сравниваются подходы больших языковых моделей и химиков-людей к химическому мышлению и принятию решений, демонстрируя различия в стратегиях решения задач, связанных с молекулярными структурами и реакциями.

Исследователи представили MolQuest — платформу, позволяющую оценить способность искусственного интеллекта самостоятельно определять молекулярные структуры на основе экспериментальных данных.

Управляя светом: Перковскитные транзисторы под электростатическим контролем

Новое исследование демонстрирует эффективное и обратимое регулирование фотолюминесценции в полностью твердотельных перковскитных транзисторах с помощью электростатической затворной регулировки.