Остановить неминуемое: Международное соглашение для безопасного развития сверхинтеллекта

В последние годы наблюдается экспоненциальный рост вычислительных затрат на обучение крупных языковых моделей, причём порог в $10^{24}$ операций с плавающей точкой (FLOP) становится критической точкой, после которой дальнейшее увеличение вычислительной мощности может потребовать регулирования, в то время как диапазон от $10^{22}$ до $10^{24}$ FLOP требует мониторинга, при этом стоимость обучения оценивается на основе цен на графические процессоры B200 в октябре 2025 года, предполагая 50% загрузку в формате FP8, согласно данным EpochAIModels2025 и artificialanalysis\_models.

В статье предлагается глобальный договор, направленный на предотвращение преждевременного создания искусственного сверхинтеллекта и смягчение связанных с этим экзистенциальных рисков.

Расширяя границы языковых моделей: сети с виртуальной шириной

Используя виртуальные сети ширины (VWN) и увеличив виртуальный коэффициент ширины до 8, удалось добиться сопоставимых результатов в обучении модели разреженного эксперта (MoE-A3.3B) с базовой моделью, сократив при этом необходимое количество токенов на 2.5–3.5 раза, что подтверждается повышенной точностью на наборе открытых бенчмарков.

Новый подход к увеличению емкости нейронных сетей позволяет добиться повышения эффективности обучения и качества генерации текста без значительного увеличения вычислительных затрат.

Искусственный интеллект в университетах: между энтузиазмом и ответственностью

Новое исследование выявляет растущее использование генеративных ИИ-инструментов студентами, обнажая пробелы в этической осведомленности и неравенство в доступе к знаниям.

Квантовый разум: Новая эра языковых моделей

Гибридная архитектура, представленная на рисунке, объединяет универсальный модуль проецирования с архитектурой Transformer, обеспечивая гибкую интеграцию и расширяя возможности модели.

Исследователи представили гибридную квантово-классическую архитектуру, способную генерировать текст с производительностью, сравнимой с классическими моделями, но с потенциально меньшими вычислительными затратами.

Взгляд в будущее автопилота: новый датасет для сложных условий

Исследование охватывает десять сценариев дорожной обстановки – ясный день на магистрали, дождь и снег на автомагистрали, рассвет и закат с прямым солнечным светом на артериальной дороге, ночная обстановка на коллекторной и артериальной дороге, туман на местной улице и пасмурный день с рабочей зоной на артериальной дороге – для всестороннего анализа условий восприятия в различных погодных и временных условиях.

Исследователи представили CATS-V2V – масштабный набор данных, призванный улучшить восприятие окружающей среды беспилотными автомобилями в неблагоприятных погодных условиях и при плохой освещенности.

Правовой Контроль Данных: Сила Многоагентных Систем

Несмотря на шестикратное увеличение вычислительной нагрузки, применение многоагентного подхода может быть оправдано в сценариях, где критически важна надёжность и точность принимаемых решений.

Новый подход к проверке соответствия законодательству при передаче данных демонстрирует значительное повышение точности благодаря использованию взаимодействующих интеллектуальных агентов.

Геометрический разум: Новый тест для искусственного интеллекта

В рамках новых исследований происходит переход к генеративному рассуждению, где традиционные тесты оценивают понимание и генерацию по отдельности, в то время как GGBench представляет собой интегрированный подход к оценке, требующий от унифицированных мультимодальных моделей одновременного понимания и генерации, что обеспечивает более комплексную проверку их возможностей.

Исследователи представили GGBench – комплексную платформу для оценки способности мультимодальных моделей решать геометрические задачи и генерировать наглядные решения на основе текстовых запросов.

Уравнения геометрии: смогут ли нейросети открыть секреты трехмерных поверхностей?

Оценка качества восстановления уравнений посредством конвейера Surface Bench объединяет символические и геометрические метрики: самообучающиеся языковые модели генерируют кандидаты символических выражений на основе дискретизированных данных 3D-поверхностей, а их точность оценивается тремя взаимодополняющими способами – посредством ошибок регрессии (NMSE), проверки символической эквивалентности и геометрически обоснованных метрик расстояния, таких как расстояния Чамфера и Хаусдорфа.

Новое исследование представляет SurfaceBench – платформу для оценки способности моделей искусственного интеллекта находить математические формулы, описывающие сложные трехмерные поверхности.