Трансформеры: За гранью универсальности
В статье представлен обзор теоретических возможностей архитектур, основанных на трансформерах, и исследуется вопрос о том, насколько сильно ограничения в архитектуре влияют на их производительность.
В статье представлен обзор теоретических возможностей архитектур, основанных на трансформерах, и исследуется вопрос о том, насколько сильно ограничения в архитектуре влияют на их производительность.

Представлен SecureCode v2.0 — комплексный набор данных, призванный помочь AI-ассистентам создавать более безопасный код, основанный на реальных инцидентах и практиках безопасности.

Новый подход к проектированию автономных агентов позволяет значительно сократить задержки и повысить стабильность работы, объединяя методы оптимизации на уровне логики и системной архитектуры.

Исследователи представили CASA — механизм, позволяющий более эффективно объединять визуальную и текстовую информацию, особенно в задачах обработки потокового видео.
Масштабное исследование показывает, как искусственный интеллект меняет ландшафт современной разработки программного обеспечения и какие угрозы безопасности возникают с распространением AI-generated кода.

Исследователи представляют MobileWorld — комплексную платформу для оценки автономных мобильных агентов, способных взаимодействовать с пользователем и использовать внешние инструменты.
Исследование представляет комплексный подход к созданию датасетов и оценке эффективности систем автоматизированного поиска патентной документации на основе семантических кластеров.
Исследователи разработали систему, позволяющую создавать разнообразные демонстрации роботов, используя 3D-редактирование и 2D-видеоданные, что значительно повышает эффективность обучения.
Новое исследование показывает, что все больше ученых используют инструменты искусственного интеллекта для написания кода, но это может приводить к снижению контроля над качеством и надежностью программного обеспечения.

Новое исследование показывает, что активность мозга может быть использована для направления работы больших языковых моделей, обходясь без трудоемкой перенастройки.