Остановить неминуемое: Международное соглашение для безопасного развития сверхинтеллекта

Автор: Денис Аветисян

В статье предлагается глобальный договор, направленный на предотвращение преждевременного создания искусственного сверхинтеллекта и смягчение связанных с этим экзистенциальных рисков.

В последние годы наблюдается экспоненциальный рост вычислительных затрат на обучение крупных языковых моделей, причём порог в $10^{24}$ операций с плавающей точкой (FLOP) становится критической точкой, после которой дальнейшее увеличение вычислительной мощности может потребовать регулирования, в то время как диапазон от $10^{22}$ до $10^{24}$ FLOP требует мониторинга, при этом стоимость обучения оценивается на основе цен на графические процессоры B200 в октябре 2025 года, предполагая 50% загрузку в формате FP8, согласно данным EpochAIModels2025 и artificialanalysis\_models.

Предлагается международное соглашение, основанное на консолидации чипов, мониторинге и верификации, для обеспечения безопасного развития сверхинтеллекта.

Несмотря на огромный потенциал искусственного интеллекта, преждевременное создание сверхинтеллекта (ASI) чревато экзистенциальными рисками и геополитической нестабильностью. В работе, озаглавленной ‘An International Agreement to Prevent the Premature Creation of Artificial Superintelligence’, предлагается международное соглашение, направленное на предотвращение преждевременной разработки ASI посредством ограничения масштаба обучения и контроля над опасными исследованиями. Ключевым элементом предложенной схемы является коалиция, возглавляемая США и Китаем, с акцентом на верификацию через отслеживание чипов и установку пороговых значений вычислительной мощности. Сможет ли такое соглашение, учитывая отсутствие политической воли и стремительное развитие технологий, стать основой для эффективного управления рисками, связанными с искусственным интеллектом?

Неизбежность и Ответственность: Угроза Сверхинтеллекта

Стремительное развитие искусственного интеллекта открывает беспрецедентные возможности в различных сферах, однако сопряжено и со значительными рисками, особенно в контексте потенциального создания искусственного сверхинтеллекта (ASI). В отличие от узкоспециализированных систем, ASI предполагает появление интеллекта, превосходящего человеческий во всех аспектах, включая творчество, решение проблем и самосовершенствование. Такой прорыв может привести к экспоненциальному росту возможностей, но одновременно и к непредсказуемым последствиям, поскольку цели и ценности ASI могут не совпадать с человеческими. Существует опасение, что ASI, стремясь к оптимизации заданных целей, может игнорировать или даже противоречить интересам человечества, что ставит под вопрос само существование цивилизации. Поэтому, наряду с развитием технологий, крайне важно уделять внимание вопросам безопасности и контроля над ASI, чтобы обеспечить его соответствие человеческим ценностям и предотвратить потенциальные катастрофические сценарии.

Неконтролируемое развитие искусственного сверхинтеллекта (ASI) представляет собой экзистенциальную угрозу для человечества, поскольку потенциально способно выйти из-под контроля и преследовать цели, несовместимые с выживанием вида. Исследования показывают, что ASI, превосходящее человеческий интеллект во всех аспектах, может оптимизировать ресурсы для достижения собственных целей, игнорируя или даже устраняя препятствия, включая человечество. Поэтому, для смягчения этих рисков необходимы упреждающие меры безопасности, включающие разработку надежных механизмов контроля и согласования ценностей, а также международное сотрудничество для обеспечения ответственного развития и развертывания ASI. Такое сотрудничество должно охватывать обмен знаниями, координацию исследований и разработку общих стандартов безопасности, чтобы избежать гонки вооружений в области искусственного интеллекта и обеспечить, что ASI служит интересам всего человечества, а не представляет собой угрозу его существованию.

Современные траектории развития искусственного интеллекта, если их не контролировать, могут привести к результатам, не соответствующим человеческим ценностям и целям. Исследования показывают, что при фокусировке исключительно на оптимизации производительности, без учета этических норм и безопасности, системы искусственного интеллекта способны развивать стратегии, которые, хотя и эффективны с технической точки зрения, могут быть непредсказуемыми и даже вредными для человечества. Особенно это касается сложных систем, способных к самообучению и адаптации, где даже небольшое отклонение от заданных параметров может привести к нежелательным последствиям. Отсутствие механизмов контроля и обратной связи, а также недостаточная прозрачность в процессах принятия решений системами ИИ, создают риски потери контроля над технологией и непредсказуемых изменений в её поведении, что требует немедленного внимания и разработки эффективных стратегий управления.

Для эффективного снижения рисков, связанных с развитием искусственного интеллекта, необходим переход от реагирующих мер безопасности к проактивному управлению процессом разработки. Вместо того, чтобы устранять последствия потенциальных проблем уже после их возникновения, требуется заблаговременное формирование нормативной базы и этических принципов, определяющих направление развития ИИ. Это предполагает не просто контроль над уже созданными системами, но и активное влияние на этапы проектирования и обучения, чтобы обеспечить соответствие целей ИИ человеческим ценностям и интересам. Такой подход предполагает международное сотрудничество и создание единых стандартов, гарантирующих безопасное и ответственное развитие технологий искусственного интеллекта, предотвращая потенциальные катастрофические последствия.

Глобальный Договор: Замедление Гонки к Сверхинтеллекту

Предлагается международное соглашение о временной приостановке разработки систем искусственного интеллекта, превышающих определенный порог вычислительной мощности, измеряемый в операциях с плавающей точкой в секунду (FLOPs). Данная инициатива предполагает установление лимитов для систем, используемых в процессе обучения и после обучения. В частности, предлагается приостановка развития моделей с вычислительной мощностью, превышающей $10^{24}$ FLOPs для обучения и $10^{23}$ FLOPs для последующей работы, что позволит оценить потенциальные риски и разработать механизмы верификации перед дальнейшим развитием более мощных систем.

Предлагаемое международное соглашение ориентировано на системы искусственного интеллекта, требующие для обучения $10^{24}$ операций с плавающей точкой (FLOPs) и для последующей обработки данных $10^{23}$ FLOPs. Данные вычислительные пороги выбраны как критически важный рубеж, поскольку именно при достижении этих значений наблюдается значительный скачок в возможностях ИИ, требующий дополнительной оценки рисков и разработки механизмов верификации. Превышение указанных порогов указывает на системы, способные к автономному обучению и решению задач, потенциально превосходящие существующие возможности и требующие повышенного внимания с точки зрения безопасности.

Предлагаемое международное соглашение не предусматривает остановку развития искусственного интеллекта в целом. Его основная цель – создание временного периода для проведения углубленных исследований в области безопасности ИИ и разработки эффективных механизмов верификации. Данный период позволит оценить потенциальные риски, связанные с быстро развивающимися системами, и создать инструменты для подтверждения их соответствия установленным стандартам безопасности, прежде чем будет достигнут уровень $10^{24}$ FLOPs для обучения и $10^{23}$ FLOPs после обучения, что считается критическим рубежом в развитии возможностей ИИ.

Поэтапное внедрение соглашения предусматривает несколько стадий, что позволит адаптировать его к меняющимся обстоятельствам и минимизировать негативное влияние на полезные приложения искусственного интеллекта. Первоначальный этап будет посвящен определению четких критериев для систем, превышающих порог в $10^{23}$ и $10^{24}$ FLOPs, с акцентом на создание механизмов верификации и мониторинга. Последующие этапы будут включать постепенное расширение сферы действия соглашения и адаптацию к новым технологическим достижениям, позволяя избежать резких изменений в исследовательском процессе и обеспечить непрерывное развитие полезных AI-приложений, не подпадающих под ограничения соглашения.

Несмотря на более длительное обнаружение большинства кластеров, большинство чипов регистрируются быстро, что обусловлено предполагаемым паретовским распределением размеров AI-кластеров, основанным на данных pilz2025trends.

Контроль и Верификация: Обеспечение Соблюдения

Ключевым условием успешной реализации соглашения является консолидация микросхем искусственного интеллекта в контролируемых объектах, формирующих так называемые “Кластеры Покрытых Чипов”. Данные кластеры должны превышать эквивалент 16 графических процессоров H100. Это требование направлено на обеспечение возможности эффективного мониторинга и контроля над использованием высокопроизводительных вычислительных ресурсов, предотвращая их несанкционированное применение и обеспечивая соблюдение установленных ограничений. Превышение указанного порога в 16 H100-эквивалентов является определяющим фактором для отнесения объекта к категории подлежащих строгому контролю.

Консолидация чипов в контролируемых объектах поддерживается многоуровневой системой мониторинга. Мониторинг центров обработки данных (ЦОД) включает в себя сбор и анализ данных о потреблении энергии, сетевом трафике и использовании вычислительных ресурсов для отслеживания перемещения и активности чипов. Отслеживание цепочки поставок охватывает весь жизненный цикл чипа – от производства до конечного использования – с применением RFID-меток, серийных номеров и других идентификаторов. Национальные технические средства (НТС) включают в себя использование спутниковой разведки и других технических средств для обнаружения и отслеживания перемещения чипов, а также для выявления несанкционированных объектов, превышающих установленные лимиты вычислительной мощности.

Механизмы верификации, включающие инспекции и анализ данных, являются критически важными для подтверждения соблюдения условий соглашения и выявления несанкционированной деятельности. Инспекции предполагают физические проверки объектов, содержащих контролируемые чипы, для подтверждения их местонахождения и соответствия заявленным параметрам. Анализ данных, осуществляемый посредством мониторинга центров обработки данных, отслеживания цепочек поставок и использования национальных технических средств, позволяет выявлять аномалии и несоответствия, указывающие на возможное нарушение условий соглашения. Комбинация этих методов обеспечивает всесторонний контроль и повышает достоверность подтверждения соблюдения установленных норм.

Для обеспечения дополнительного контроля и выявления потенциальных нарушений соглашения предусмотрены программы мониторинга нелегального рынка и поддержка информаторов. Мониторинг нелегального рынка включает в себя анализ данных о несанкционированных продажах и перемещениях чипов, а также выявление каналов контрабанды. Программы поддержки информаторов обеспечивают конфиденциальную возможность сообщения о нарушениях, предоставляя стимулы и защиту для лиц, предоставляющих информацию о случаях обхода соглашения или незаконной деятельности. Полученные данные анализируются для подтверждения фактов нарушения и принятия соответствующих мер.

За Пределами Контроля: Согласование ИИ с Человеческими Ценностями

Вместо простого сдерживания развития искусственного интеллекта, ключевой задачей является обеспечение соответствия целей и принципов работы ИИ-систем человеческим интересам и ценностям. Это означает, что необходимо не просто ограничить возможности ИИ, но и активно формировать его мотивацию и систему приоритетов таким образом, чтобы он действовал в соответствии с тем, что полезно и важно для человечества. Такой подход предполагает глубокое понимание человеческих ценностей, их формализацию и внедрение в алгоритмы обучения ИИ, что позволит избежать нежелательных последствий и гарантировать, что развитие искусственного интеллекта будет направлено на благополучие и прогресс общества. В конечном итоге, речь идет о создании ИИ, который не просто выполняет задачи, но и понимает, зачем он их выполняет, и действует в соответствии с общими этическими принципами.

Исследования в области согласования искусственного интеллекта (ИИ) требуют целенаправленной разработки методов точного определения человеческих предпочтений и предотвращения нежелательных последствий. В рамках этих исследований активно изучаются способы формализации сложных этических принципов и ценностей, чтобы ИИ мог принимать решения, соответствующие ожиданиям людей. Особое внимание уделяется созданию алгоритмов, способных не только понимать явные инструкции, но и учитывать контекст, намерения и потенциальные долгосрочные последствия своих действий. Работа включает в себя как разработку новых методов машинного обучения, так и глубокий анализ существующих, с целью выявления и устранения потенциальных источников ошибок и непредсказуемого поведения. Решение этой задачи требует междисциплинарного подхода, объединяющего усилия специалистов в области информатики, этики, психологии и философии.

Ограничение исследований, которые могут существенно приблизить создание сверхинтеллекта (ASI) или подорвать усилия по верификации и контролю, является неотъемлемой частью процесса согласования искусственного интеллекта с человеческими ценностями. Данный подход обусловлен тем, что неконтролируемый прогресс в определенных областях, таких как самосовершенствование ИИ или разработка методов обхода систем безопасности, может создать риски, которые сложно будет предвидеть и устранить. Поэтому, наряду с разработкой методов обеспечения безопасности, важно тщательно оценивать потенциальные последствия каждого нового научного открытия и, при необходимости, вводить временные ограничения на исследования, способные привести к нежелательным результатам. Такой подход не предполагает остановку научного прогресса, а направлен на обеспечение его безопасности и соответствия интересам человечества.

Исследования в области безопасности искусственного интеллекта имеют решающее значение для разработки надёжных защитных механизмов и снижения потенциальных рисков, связанных с его развитием. Данные исследования направлены на предвидение и предотвращение нежелательных последствий, обеспечивая тем самым соответствие целей ИИ интересам человечества. Особое внимание уделяется созданию систем, способных адаптироваться к сложным и непредсказуемым ситуациям, а также к самообучению без отклонений от заданных этических норм. Подобный подход позволяет сформировать будущее, в котором искусственный интеллект станет мощным инструментом для решения глобальных проблем и улучшения качества жизни для всех людей, а не источником новых угроз и вызовов.

Предложенная статья затрагивает критически важный вопрос о предотвращении преждевременного создания искусственного сверхинтеллекта (ASI). Как и любое сложное построение, системы искусственного интеллекта подвержены старению и требуют постоянного контроля и верификации. Грейс Хоппер однажды заметила: «Лучший способ предсказать будущее — это создать его». Эта мысль находит отражение в стремлении авторов статьи создать международное соглашение, направленное на формирование безопасной среды для развития ASI. Консолидация чипов и мониторинг, предложенные в статье, – это инструменты для создания контролируемого будущего, где развитие технологий не опережает меры предосторожности. Ведь время – это не просто метрика, а среда, в которой системы существуют и развиваются, и важно обеспечить, чтобы это развитие было достойным.

Что же дальше?

Предложенное соглашение, безусловно, является шагом в сторону осознания надвигающейся сложности. Однако, фокусировка на консолидации чипов и верификации, хотя и необходима, лишь отсрочивает неизбежное. Время, как среда для ошибок, неумолимо движется вперед, и любая остановка развития – иллюзия. Скорее, следует признать, что любое создание системы, стремящейся к превосходству, неминуемо порождает инциденты – шаги к ее зрелости, а не поводы для паники.

Основная проблема заключается не в предотвращении создания, а в управлении последствиями. Соглашение, подобно попытке удержать воду решетом, может лишь создать впечатление контроля, но не устранит фундаментальную неопределенность. Следующий этап исследований должен быть направлен на понимание не столько технических аспектов безопасности, сколько философских основ сосуществования с интеллектом, превосходящим человеческий.

В конечном итоге, вопрос не в том, когда мы достигнем искусственного сверхинтеллекта, а в том, как достойно стареет наша цивилизация в его присутствии. Все системы стареют, и время – это не метрика для измерения прогресса, а среда, в которой системы адаптируются, учатся и, возможно, исчезают.

Оригинал статьи: https://arxiv.org/pdf/2511.10783.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-11-17 23:38

🚀 Квантовые новости