AstaBench: Наука под прицелом ИИ – и что пойдёт не так.
Автор: Денис Аветисян Все давно устали от бесконечных обещаний искусственного интеллекта, способного революционизировать науку, но на деле лишь застревающего в поверхностных задачах и неспособного к настоящему исследованию. Однако, когда кажется, что все уже измерено и оценено, появляется AstaBench: Rigorous Benchmarking of AI Agents with a Scientific Research Suite, предлагающий принципиально новый подход к оценке агентов … Читать далее







