Персонализация генерации изображений: новый подход PureCC

В рамках предложенного подхода, PureCC, предварительно обученная модель потока используется для извлечения признаков, после чего, в фазе чистого обучения, её параметры фиксируются, а выходные данные, представляющие целевое понятие, управляются адаптивным масштабом [latex]\lambda^{\star}[/latex], направляя обучение другой, инициализированной модели потока, предсказывающей условный результат на основе базового текста, при этом весь конвейер оптимизируется с использованием функций потерь [latex]\mathcal{L}\_{PureCC}[/latex] и [latex]\mathcal{L}\_{CC}[/latex], что позволяет чистому обучению в пространстве потока скоростей эффективно усваивать целевые концепции.

Исследователи предлагают метод PureCC, позволяющий тонко настраивать модели генерации изображений по текстовому описанию, сохраняя при этом их исходные возможности и качество.

Прыжок к сути: как языковые модели пропускают лишнее

Исследование демонстрирует, что диффузионные языковые модели, такие как LLaDA, обладают значительным избыточным представлением, позволяющим эффективно пропускать слои во время инференса и сохранять 88.24% производительности при снижении вычислительных затрат на 18.75% (шесть пропущенных слоев), в то время как авторегрессивные модели, вроде Qwen2.5-7B, проявляют хрупкость, демонстрируя лишь 64.71% сохранения производительности при снижении вычислительных затрат на 7.14% (два пропущенных слоя), что указывает на концентрированное и не избыточное представление данных в этих архитектурах.

Новое исследование показывает, что модели, основанные на диффузии, умеют эффективно отсеивать избыточные вычисления при генерации текста, в отличие от традиционных авторегрессионных моделей.

Искусственный интеллект открывает новые горизонты в математике

Новый подход, сочетающий возможности нейросетевых моделей и символьных вычислений, позволил добиться значительного прогресса в решении сложной задачи комбинаторного дизайна.

Самообучающиеся агенты для поиска оптимальных нейросетей

Новая система AutoResearch-RL использует возможности машинного обучения с подкреплением и больших языковых моделей для автоматического улучшения конфигураций нейронных сетей и достижения передовых результатов.

Искусственный интеллект на службе науки: самообучающиеся агенты для новых открытий

Система EvoScientist, представляющая собой саморазвивающуюся многоагентную структуру для комплексного научного поиска, включает в себя агента-исследователя, агента-инженера и менеджера эволюции, при этом менеджер эволюции аккумулирует историю взаимодействия в две постоянные памяти - память идей [latex]M_{I} [/latex] и память экспериментов [latex]M_{E}[/latex], используемые агентами для непрерывного улучшения качества идей и повышения эффективности выполнения задач.

В новой работе представлена система EvoScientist, способная самостоятельно проводить научные исследования, учиться на опыте и генерировать публикации, приближая эру автоматизированной науки.

Обучение агентов: как масштабировать возможности, а не объём данных

Подход ATLASReinforcement Finetuning использует рубрики в качестве наград и SLM Judge для тонкой настройки, позволяя модели адаптироваться и оптимизировать свою производительность на основе заданных критериев и оценок.

Новый подход позволяет создавать эффективных агентов, способных к сложному взаимодействию с инструментами, даже при использовании небольших языковых моделей.

Искусственный интеллект на службе науки: новый этап

В статье рассматривается, как автономные агенты и современные языковые модели способны кардинально изменить научные исследования, автоматизируя рутинные процессы и расширяя возможности анализа данных.

Перенос знаний от больших моделей: новый подход к сегментации изображений

Традиционные методы дистилляции знаний, хоть и сохраняют точность в пределах одной области, упускают возможность обобщения на новые, ранее не встречавшиеся данные, в то время как предложенный подход к обобщенной дистилляции знаний ([latex]GKD[/latex]) направлен на преодоление этого ограничения.

В статье представлен метод, позволяющий эффективно использовать возможности мощных моделей компьютерного зрения для повышения точности сегментации изображений в различных условиях.