Взгляд под капот: Анализ кода, сгенерированного нейросетями

CodeCircuit сопоставляет внутреннюю динамику большой языковой модели с графом атрибуции на уровне строк кода, позволяя выявлять ошибки посредством извлечения структурных характеристик - глобальных, топологических и состояний узлов - и, таким образом, обнаруживать скрытые структурные отпечатки валидности, где

Новое исследование предлагает метод оценки корректности программного кода, созданного большими языковыми моделями, путем анализа их внутренней структуры.

Поиск причинно-следственных связей: Искусственный интеллект в роли научного помощника

В рамках IV Co-Scientist представлена интеграция агентов, основанных на больших языковых моделях, с традиционными статистическими инструментами, что позволяет расширить возможности анализа и принятия решений.

Новая система, основанная на взаимодействии нескольких языковых моделей, помогает ученым находить и проверять факторы, влияющие на изучаемые явления.

Социальные науки на автопилоте: как ИИ ускоряет открытия

Исследование демонстрирует, что итеративное уточнение гипотез не только отсеивает ложные корреляции, как в случае с гипотезой “Я прошу согласия” (выявленной и отклонённой после анализа сессионной предвзятости), но и позволяет обнаруживать условные подгипотезы - например, связь между упоминаниями гражданских прав, законом о избирательных правах и законопроектами, спонсируемыми демократами (с [latex]\beta = 0.42[/latex], [latex]p < 10^{-5}[/latex]) или зависимость ответственности правительства от партийной принадлежности оппозиции ([latex]\beta = 0.48[/latex]) - тем самым усиливая прогностическую силу модели и выявляя скрытые зависимости в данных.

Новый подход, использующий искусственный интеллект, позволяет автоматизировать процесс выдвижения и проверки научных гипотез, открывая возможности для более глубокого понимания общественных явлений.

Непредсказуемость разумных агентов: где заканчивается удача?

Глубокий анализ производительности алгоритмов DeepSWE-preview и Devstral-2 в среде r2e-gym и nano-agent выявил, что, хотя оба демонстрируют значительную зависимость от случайного поиска при увеличении [latex]k[/latex], DeepSWE-preview характеризуется большей чувствительностью к случайным факторам, что проявляется в широком разбросе результатов, в то время как Devstral-2 обеспечивает более стабильные решения при меньшем влиянии случайности.

Новое исследование показывает, что оценка производительности систем с агентами подвержена значительным случайным колебаниям, требующим более тщательного анализа.

Искусственный интеллект на страже экологии: защита данных и справедливые алгоритмы

Новые подходы к применению ИИ в сочетании с передовыми методами шифрования открывают возможности для обеспечения надежной защиты данных и объективного управления в сфере экологического регулирования.

Скрытые смыслы под защитой: Новые методы защиты текстовых представлений

В исследовании продемонстрировано, что уязвимость текстовых представлений к атакам, направленным на извлечение конфиденциальной информации, может быть смягчена за счет применения эллиптического шума, который, в отличие от сферического, позволяет избирательно усиливать возмущения в критически важных для приватности измерениях, одновременно сохраняя семантическую целостность текста, что подтверждено практическим примером, представленным в Приложении J.

Исследователи предлагают инновационный подход к защите конфиденциальности текстовых данных, используемых в современных моделях машинного обучения.

Воспроизводимость исследований: Искусственный интеллект на службе социальных наук

Агентные рабочие процессы демонстрируют абсолютное улучшение воспроизводимости результатов на [latex]Qwen3-Coder[/latex] по сравнению с подходами, основанными на промптах, с заметным приростом успешности, достигающим нескольких процентных пунктов для каждой из исследуемых моделей - OpenCode и Claude Code.

Новое исследование сравнивает возможности больших языковых моделей и автономных AI-агентов в автоматическом восстановлении и проверке вычислительных анализов в социологии и других областях социальных наук.

Пространственный интеллект машин: как модели учатся ориентироваться в мире?

В рамках исследования пространственного познания агент активно исследует окружение, формируя и проверяя убеждения о структуре многокомнатных пространств посредством циклического процесса перемещения, вращения и наблюдения, при этом оценка эффективности познания осуществляется через использование сформированной внутренней карты пространства и направленное тестирование её точности.

Новое исследование предлагает комплексный подход к оценке способности современных моделей искусственного интеллекта формировать и использовать представления об окружающем пространстве.

Искусственный интеллект в токсикологической патологии: новый взгляд на анализ данных

Статья посвящена исследованию возможностей использования автономных систем искусственного интеллекта для оптимизации процессов токсикологической оценки и повышения эффективности разработки лекарственных препаратов.