Искусственный интеллект и GPU: Где заканчивается оптимизация и начинается жесткое кодирование?
![В рамках оценки AgentKernelArena используется конвейер, в котором агент итеративно оптимизирует исходный код ядра, стремясь к повышению производительности, при этом процесс включает в себя этапы компиляции, проверки корректности по сравнению с эталонным кодом и измерения скорости, причём ускорение вычисляется как отношение времени выполнения эталонного ядра к времени выполнения оптимизированного, а итоговая оценка формируется на основе баллов за компиляцию, корректность и производительность, умноженную на коэффициент [latex]s_k[/latex].](https://arxiv.org/html/2605.16819v1/figures/pipeline.png)
Новый бенчмарк AgentKernelArena выявил, что ИИ-агенты, успешно оптимизирующие графические ядра для известных конфигураций, часто терпят неудачу при работе с незнакомыми параметрами.
![На основе анализа остаточных энергий для модели SK с [latex]N=100[/latex] и [latex]N=200[/latex], исследование демонстрирует способность предложенного подхода (NQA с RBQS/DBQS анзацем) успешно решать все экземпляры спиновой модели с [latex]N=100[/latex] и большинство ([latex]7[/latex] из [latex]10[/latex]) экземпляров с [latex]N=200[/latex], что указывает на эффективность метода в решении сложных задач спинового стекла.](https://arxiv.org/html/2605.15899v1/x3.png)





