Сцена за сценой: Когда нейросети начинают понимать сложные изображения?

Новое исследование показывает, что генеративные модели, основанные на диффузии, сталкиваются с трудностями при создании сцен с несколькими объектами, особенно когда требуется обобщение на основе новых комбинаций.




