Взгляд под капот: Анализ кода, сгенерированного нейросетями

Новое исследование предлагает метод оценки корректности программного кода, созданного большими языковыми моделями, путем анализа их внутренней структуры.

Новое исследование предлагает метод оценки корректности программного кода, созданного большими языковыми моделями, путем анализа их внутренней структуры.

Новая система, основанная на взаимодействии нескольких языковых моделей, помогает ученым находить и проверять факторы, влияющие на изучаемые явления.

Новая система GraphAgents использует возможности многоагентного ИИ и графов знаний для ускорения разработки экологичных материалов.
![Исследование демонстрирует, что итеративное уточнение гипотез не только отсеивает ложные корреляции, как в случае с гипотезой “Я прошу согласия” (выявленной и отклонённой после анализа сессионной предвзятости), но и позволяет обнаруживать условные подгипотезы - например, связь между упоминаниями гражданских прав, законом о избирательных правах и законопроектами, спонсируемыми демократами (с [latex]\beta = 0.42[/latex], [latex]p < 10^{-5}[/latex]) или зависимость ответственности правительства от партийной принадлежности оппозиции ([latex]\beta = 0.48[/latex]) - тем самым усиливая прогностическую силу модели и выявляя скрытые зависимости в данных.](https://arxiv.org/html/2602.07983v1/x6.png)
Новый подход, использующий искусственный интеллект, позволяет автоматизировать процесс выдвижения и проверки научных гипотез, открывая возможности для более глубокого понимания общественных явлений.
![Глубокий анализ производительности алгоритмов DeepSWE-preview и Devstral-2 в среде r2e-gym и nano-agent выявил, что, хотя оба демонстрируют значительную зависимость от случайного поиска при увеличении [latex]k[/latex], DeepSWE-preview характеризуется большей чувствительностью к случайным факторам, что проявляется в широком разбросе результатов, в то время как Devstral-2 обеспечивает более стабильные решения при меньшем влиянии случайности.](https://arxiv.org/html/2602.07150v1/x2.png)
Новое исследование показывает, что оценка производительности систем с агентами подвержена значительным случайным колебаниям, требующим более тщательного анализа.
Новые подходы к применению ИИ в сочетании с передовыми методами шифрования открывают возможности для обеспечения надежной защиты данных и объективного управления в сфере экологического регулирования.

Исследователи предлагают инновационный подход к защите конфиденциальности текстовых данных, используемых в современных моделях машинного обучения.
![Агентные рабочие процессы демонстрируют абсолютное улучшение воспроизводимости результатов на [latex]Qwen3-Coder[/latex] по сравнению с подходами, основанными на промптах, с заметным приростом успешности, достигающим нескольких процентных пунктов для каждой из исследуемых моделей - OpenCode и Claude Code.](https://arxiv.org/html/2602.08561v1/figures/gains.png)
Новое исследование сравнивает возможности больших языковых моделей и автономных AI-агентов в автоматическом восстановлении и проверке вычислительных анализов в социологии и других областях социальных наук.

Новое исследование предлагает комплексный подход к оценке способности современных моделей искусственного интеллекта формировать и использовать представления об окружающем пространстве.
Статья посвящена исследованию возможностей использования автономных систем искусственного интеллекта для оптимизации процессов токсикологической оценки и повышения эффективности разработки лекарственных препаратов.