Искусственный интеллект на страже кода: новая оценка качества

Исследователи представили CR-Bench — комплексный инструмент для оценки эффективности систем автоматической проверки кода, демонстрирующий, что важнее находить действительно критичные ошибки, чем просто выявлять их больше.



![В работе, предложенной Бай и коллегами, временные свёрточные сети [latex]TCN[/latex] выступают в качестве эффективного инструмента для обработки последовательностей данных, демонстрируя свою применимость в задачах, требующих анализа временных зависимостей.](https://arxiv.org/html/2603.12073v1/aux_files/graphs/TCN.png)




![Исследование предлагает три подхода к анализу вклада входных признаков в процесс генерации токенов, основанные на матрице Шэпли [latex]\bm{\Phi}[/latex]: GlobalSHAP для оценки общего баланса модальностей, GenerativeSHAP для отслеживания динамики вклада модальностей на этапах генерации, и TemporalAlignmentSHAP для изучения соответствия между позициями входных признаков и выходных токенов.](https://arxiv.org/html/2603.12046v1/x2.png)