Малые модели – большая опасность: новые угрозы от доступного ИИ

Уменьшение размеров и повышение эффективности языковых моделей, в сочетании с доступностью вычислительных ресурсов, создают растущие риски, поскольку даже недорогое оборудование позволяет развертывать потенциально вредоносные кампании на основе ИИ.
![Система WebArbiter, используя историю взаимодействий и текущие наблюдения, сравнивает варианты действий, применяя принципы, полученные из более мощной языковой модели, и обучается с подкреплением на основе проверяемых вознаграждений [latex]R\in\{-1,+1}[/latex], формируя структурированные обоснования и вынося окончательный вердикт, позволяя ей, в процессе работы, выводить принципы оценки и выбирать действие, наиболее эффективно приближающее к завершению задачи.](https://arxiv.org/html/2601.21872v1/x2.png)




