Обучение агентов: как масштабировать возможности, а не объём данных

Подход ATLASReinforcement Finetuning использует рубрики в качестве наград и SLM Judge для тонкой настройки, позволяя модели адаптироваться и оптимизировать свою производительность на основе заданных критериев и оценок.

Новый подход позволяет создавать эффективных агентов, способных к сложному взаимодействию с инструментами, даже при использовании небольших языковых моделей.

Эффективное сокращение двухпетлевых интегралов: новый алгоритм для прецизионных расчетов

Рекурсивное понижение ранга интеграла пентагон-треугольника от [latex](5,1)(5,1)[/latex] к рангам [latex](0,1)(0,1)[/latex] и [latex](1,1)(1,1)[/latex] демонстрирует устойчивость процесса и позволяет упростить вычисление сложных интегралов посредством последовательного снижения их ранга.

В статье представлен инновационный алгоритм для численного приведения двухпетлевых тензорных интегралов к скалярным, разработанный для повышения эффективности расчетов в физике высоких энергий.

Перенос знаний от больших моделей: новый подход к сегментации изображений

Традиционные методы дистилляции знаний, хоть и сохраняют точность в пределах одной области, упускают возможность обобщения на новые, ранее не встречавшиеся данные, в то время как предложенный подход к обобщенной дистилляции знаний ([latex]GKD[/latex]) направлен на преодоление этого ограничения.

В статье представлен метод, позволяющий эффективно использовать возможности мощных моделей компьютерного зрения для повышения точности сегментации изображений в различных условиях.

Гендерные стереотипы при найме: кто виноват – человек, алгоритм или тандем?

В процессе подбора персонала наблюдается вариативность рабочих процессов: рекрутеры могут полагаться исключительно на собственные поиски, использовать рекомендации системы искусственного интеллекта или комбинировать оба подхода, причём взаимодействие с предложенными кандидатами подразделяется на этапы контроля со стороны ИИ и последующего ручного поиска.

Новое исследование показывает, что сочетание человеческого контроля с искусственным интеллектом в системах подбора кандидатов может привести к более справедливым результатам, хотя предвзятость всё ещё сохраняется.

Раскрывая тайны рассеянного склероза: возможности машинного обучения

Доля генов, связанных с рассеянным склерозом, выявленных как значимые методами DEA и SHAP, демонстрирует, что часть генов была исключена из анализа после очистки и интеграции данных.

Новое исследование демонстрирует, как анализ многомерных данных о транскриптоме с помощью машинного обучения позволяет выявить ключевые гены и механизмы развития рассеянного склероза.

Ускорение симуляций общей теории относительности: новые методы Рунге-Кутты

Развитие неустойчивости Кельвина-Гельмгольца полностью смоделировано с использованием метода Рунге-Кутты четвёртого порядка и предложенного подхода, демонстрируя их сопоставимую эффективность в описании динамики этого явления.

В статье представлены и протестированы усовершенствованные многошаговые методы Рунге-Кутты для повышения производительности численного моделирования гравитационных волн.

Понять, почему код не работает: объяснимый ИИ для отладки интеллектуальных агентов

Система, представленная на рисунке, преобразует необработанные данные трассировки в итоговый отчет посредством последовательной автоматической аннотации, генерации объяснений и синтеза отчета, демонстрируя тем самым комплексный процесс анализа и представления информации.

Новое исследование предлагает эффективный подход к анализу сбоев в работе ИИ-агентов, создающих код, позволяя разработчикам быстро выявлять и устранять ошибки.