Превращая неразрешимое в решение: Автоматизация преобразования невыпуклых задач

Рамка NC2C использует возможности больших языковых моделей для автоматического преобразования общих невыпуклых задач оптимизации в выпуклые формы, обеспечивая тем самым более эффективное и надежное решение.

Новая система, основанная на моделях обработки естественного языка, позволяет автоматически упрощать сложные оптимизационные задачи, делая их доступными для эффективного решения.

Обучение с множественными наградами: как избежать коллапса и согласовать языковые модели

Групповая нормализация на основе вознаграждения с последующей пакетной нормализацией преимуществ (GDPO) обеспечивает стабильный численный диапазон и улучшенную стабильность обновления в процессе обучения с подкреплением, что, как демонстрируют результаты экспериментов с моделью Qwen2.5-Instruct-1.5B, приводит к более высокой точности и соответствию формату вознаграждения по сравнению с GRPO, о чем свидетельствует медиана и межквартильный размах кривых вознаграждения, полученных в пяти запусках.

Новый подход GDPO решает проблему нестабильности обучения в задачах с множественными наградами, обеспечивая лучшее согласование языковых моделей с разнообразными предпочтениями пользователей.

Превращая обычные МРТ в количественные данные: новый подход к анализу изображений

Исследователи разработали алгоритм, позволяющий из стандартных клинических МРТ-сканов получать точные количественные карты тканей, открывая новые возможности для масштабных биомаркерных исследований.

Один в поле не воин? Когда искусственный интеллект обходит многоагентные системы

Создание библиотек навыков для многоагентных систем снижает задержки и потребление токенов, однако точность выбора навыка нелинейно ухудшается по мере роста библиотеки, демонстрируя фазовый переход при достижении определенного порога вместимости, который может быть преодолен за счет иерархической организации навыков в структурированные категории.

Новое исследование показывает, что агенты с развитыми навыками могут эффективно выполнять задачи, ранее требовавшие координации множества ИИ, но их возможности ограничены.

Предел Эффективности: Как Энергия, Время и Точность Определяют Будущее Вычислений

Термодинамический алгоритм вычисляет функцию [latex]f(K)[/latex], эволюционируя вероятностное распределение состояния от произвольной начальной конфигурации к тепловому равновесию под воздействием потенциала [latex]V(x)=\frac{1}{2}\vec{x}^{T}K\vec{x}[/latex], после чего, посредством сэмплирования свойств системы, напрямую измеряется искомая функция, причём корреляционная матрица Σ положений в тепловом распределении соответствует обратной матрице [latex]K[/latex].

Новое исследование устанавливает фундаментальные границы между энергопотреблением, скоростью работы и надежностью термодинамических компьютеров, открывая путь к оптимизации их производительности.

Биопротоколы под контролем: новый подход к извлечению знаний в биомедицине

Исследование демонстрирует, что [latex]biopie[/latex] позволяет создавать детальные структурные представления сложных биомедицинских протоколов, включая параметры вроде температуры и длительности, что обеспечивает высокую информационную плотность и возможность многоступенчатого логического вывода за счет интеграции контекста предложений с графовыми знаниями, в то время как существующие наборы данных для извлечения информации страдают от компромисса между широтой охвата и спецификой предметной области.

Исследователи представили BioPIE — датасет и методику, позволяющие более точно понимать сложные экспериментальные процедуры и отвечать на вопросы, связанные с ними.

Переключение намагниченности в квантовых антиферромагнетиках: новые горизонты для терагерцовой спинтроники

Динамика заполнения бозонов Швингера и результирующая намагниченность демонстрируют зависимость от внешнего переключающего поля, при этом анализ временной зависимости SBMFT при [latex]\chi = 0.5[/latex] выявляет, что при [latex]h_y = 1.7J[/latex] начальная намагниченность [latex]m_{z0}[/latex] влияет на поведение системы.

Исследование демонстрирует возможности сверхбыстрого управления магнитным моментом в антиферромагнетиках, подтверждая перспективность создания спинтронных устройств нового поколения.