Нейросети и предрассудки: можно ли избавиться от смещения, не потеряв полезные знания?
![Анализ совместного влияния различных методов удаления на предвзятость моделей в отношении профессий, связанных с образованием, и демографических предвзятостей, измеренную с помощью расхождения Кульбака-Лейблера [latex]KL[/latex], выявил, что наиболее благоприятным результатом является снижение обеих предвзятостей, в то время как наихудшим - их одновременное увеличение, при этом наблюдаются компромиссные сценарии, когда уменьшение одной предвзятости сопровождается усилением другой, что подтверждается анализом данных по различным профессиональным задачам, включая оценку влияния предвзятости в отношении образования, пола и расы.](https://arxiv.org/html/2512.20796v1/plots/tradeoff_bottom_panels1.png)
Новое исследование показывает, что борьба со смещением в больших языковых моделях требует индивидуального подхода, поскольку универсальные методы могут ухудшить производительность.






