Искусственный интеллект рисует по заказу: Новый масштабный датасет для редактирования изображений

Система UnicEdit-10M охватывает 22 задачи редактирования, от простых до сложных, и использует унифицированную стадию постобработки для фильтрации ошибок и уточнения инструкций, что позволяет получать высококачественные тройки данных, а для всесторонней оценки разработан набор метрик UnicBench.

Исследователи представили UnicEdit-10M — огромный набор данных, призванный улучшить качество и точность инструкций для редактирования изображений с помощью ИИ.

Эволюционные связи: Искусственный интеллект на службе у филогенетики

Нейронная сеть, состоящая из шести слоев и 779 параметров, обученная на выравниваниях JC для 20 таксонов в течение 50 эпох, демонстрирует способность аппроксимировать функцию $4\ln(1-3x/4)/3$ с высокой точностью, превосходя по эффективности традиционные методы максимального правдоподобия и приближаясь к результатам, достигаемым с помощью разложения в ряд Маклорена 50-го порядка, при этом предсказывая разумное поведение при приближении к предельному значению расстояния Jukes-Cantor, что свидетельствует о способности сети улавливать дополнительную информацию об эволюционном процессе, возможно, отражающую априорные знания о процессе генерации деревьев, и характеризуясь потолком аппроксимации в 4.840, превышающим средний диаметр деревьев в обучающей выборке (3.697), но значительно уступающим их максимальному диаметру (19.145).

Новое исследование демонстрирует, как глубокое обучение позволяет создавать более точные и эффективные метрики для определения эволюционных связей между организмами.

Редкостная эффективность: как сжать мультимодальные модели без потерь

Предлагаемые методы, направленные на повышение эффективности унифицированных мультимодальных моделей, сочетают в себе сжатие без обучения, основанное на разделении и отсечении наименее значимых нейронов, и адаптацию Mixture-of-Experts с динамической активацией нейронов, организованных в общие (сплошные линии) и направленные (пунктирные линии) эксперты, управляемые маршрутизатором.

Новое исследование показывает, что оптимизация разреженности в архитектуре мультимодальных моделей позволяет значительно снизить их вычислительные затраты, не жертвуя качеством.

Искусственный интеллект в бизнесе: как не упустить выгоду

Новое исследование показывает, что внедрение искусственного интеллекта в корпоративные процессы требует не только технологических решений, но и грамотного управления изменениями и преодоления организационных барьеров.

Видеогенерация и логика: проверяем, умеют ли нейросети следовать правилам

Модели генерации видео демонстрируют наилучшие результаты в задачах, связанных с пониманием человеческой деятельности и выдвижением гипотез, в то время как категории, требующие визуального анализа и игровых навыков, оказываются более сложными для них.

Новый бенчмарк RULER-Bench позволяет оценить способность современных видеогенераторов к рассуждениям и соблюдению когнитивных правил в различных ситуациях.

Вероятностный интеллект на скорости света: новые горизонты машинного обучения

Исследователи представили фотонный байесовский процессор, способный значительно ускорить обработку изображений с учетом неопределенности, открывая путь к более надежным и эффективным системам искусственного интеллекта.

Матричные вычисления: новый уровень оптимизации с помощью искусственного интеллекта

Оптимизация CUDA-ядер для матричного умножения выявляет закономерности в выборе гиперпараметров, определяющие эффективность и производительность вычислений.

Исследователи разработали систему, способную значительно ускорить вычисления матричных произведений на графических процессорах, используя возможности машинного обучения.

Музыка оживает в видео: новый подход к генерации роликов

На основе различных комбинаций движения камеры, система YingVideo-MV генерирует разнообразные видеоматериалы, демонстрируя гибкость и адаптивность подхода к созданию динамичного видеоконтента.

Исследователи представили систему, способную создавать длинные, синхронизированные с музыкой видеоролики с плавными переходами камеры и реалистичным визуальным рядом.