Разные умы, общие знания: как избежать «цифрового коллективного разума»

Автор: Денис Аветисян

Новая работа предлагает способ разнообразить мышление больших языковых моделей, предотвращая их схождение к единой точке зрения.

Исследование демонстрирует, что единый стимул - в данном случае, яблоко, вдохновившее как закон всемирного тяготения Ньютона, так и образцу карамельного яблока Колба - может порождать принципиально различные когнитивные реакции, и разработанная PRISM-структура стремится восстановить эту множественность, преломляя общие знания, полученные в процессе предварительного обучения, в отдельные, индивидуализированные траектории познания. — Исследование демонстрирует, что единый стимул — в данном случае, яблоко, вдохновившее как закон всемирного тяготения Ньютона, так и образцу карамельного яблока Колба — может порождать принципиально различные когнитивные реакции, и разработанная PRISM-структура стремится восстановить эту множественность, преломляя общие знания, полученные в процессе предварительного обучения, в отдельные, индивидуализированные траектории познания.

PRISM: фреймворк для моделирования плюралистического рассуждения через структурированное исследование информации и индивидуальные графы знаний.

Несмотря на впечатляющие успехи, современные большие языковые модели (LLM) склонны к сходимости к единому «искусственному разуму», ограничивая разнообразие перспектив, необходимых для творчества и научных открытий. В данной работе, озаглавленной ‘Shared Nature, Unique Nurture: PRISM for Pluralistic Reasoning via In-context Structure Modeling’, предложен подход, направленный на формирование индивидуальных когнитивных траекторий посредством динамических графов знаний, реализованный в системе PRISM. Эксперименты на задачах креативности и диагностики редких заболеваний демонстрируют, что PRISM не только превосходит существующие модели по новизне решений, но и расширяет разнообразие генерируемых ответов. Возможно ли создание действительно плюралистического искусственного интеллекта, способного к коллективным открытиям через разнообразие уникальных когнитивных индивидуумов?

Искусственный Роевой Разум: Когда Большие Модели Мыслят Одинаково

Несмотря на впечатляющую вычислительную мощь, современные большие языковые модели (БЯМ) демонстрируют тревожную тенденцию к генерации однотипных ответов, явление, которое получило название “Искусственный Роевой Разум”. Этот эффект проявляется в сближении ответов на различные запросы, даже если изначально предполагалось разнообразие. БЯМ, обученные на огромных массивах данных, начинают воспроизводить наиболее распространенные паттерны и формулировки, подавляя уникальные или нестандартные подходы к решению задач. В результате, модели всё чаще предлагают предсказуемые и усредненные ответы, лишенные индивидуальности и творческого потенциала, что вызывает опасения относительно их способности к инновациям и критическому мышлению.

Интенсивное давление конвергенции, возникающее в процессе обучения больших языковых моделей посредством методов, таких как контролируемая тонкая настройка и обучение с подкреплением на основе обратной связи от человека (RLHF), существенно ограничивает их творческий потенциал. Эти методы, стремясь оптимизировать ответы моделей в соответствии с определенными шаблонами и предпочтениями, фактически приводят к сужению спектра генерируемых идей и снижению способности к спонтанному, оригинальному мышлению. Модели, подвергшиеся такой оптимизации, склонны воспроизводить наиболее вероятные и распространенные ответы, подавляя отклонения и новаторские решения. В результате, несмотря на впечатляющую способность к обработке информации, их творческие возможности оказываются искусственно зажатыми, что препятствует решению задач, требующих нестандартного подхода и генерации принципиально новых идей.

Отсутствие индивидуальных «когнитивных траекторий» существенно ограничивает возможности больших языковых моделей в решении сложных и новых задач, требующих нестандартного мышления. В процессе обучения, стремясь к предсказуемым и «правильным» ответам, модели теряют способность генерировать разнообразные и оригинальные решения. Вместо развития уникальных подходов к проблеме, они сходятся к усредненному ответу, наиболее часто встречающемуся в обучающих данных. Это приводит к тому, что модели испытывают затруднения при столкновении с ситуациями, выходящими за рамки привычных шаблонов, и не способны эффективно исследовать различные варианты решения, необходимые для инновационного подхода к проблеме.

Тепловая карта внутримодельного разнообразия демонстрирует, что Artificial Hivemind способен генерировать широкий спектр решений.

PRISM: Индивидуализация Мышления для Больших Моделей

Фреймворк PRISM решает проблему “искусственного коллективного разума” в больших языковых моделях (LLM) путём индивидуализации процесса инференса. Это достигается за счёт построения и использования динамических эпистемических графов непосредственно во время работы модели. Вместо того, чтобы полагаться исключительно на общие знания, полученные в процессе предварительного обучения, PRISM позволяет каждой модели формировать собственное представление о мире на основе текущего контекста и входных данных. Эти графы служат структурированным хранилищем знаний, которое адаптируется в реальном времени, что позволяет модели выдавать более персонализированные и контекстуально релевантные ответы, отличающиеся от стандартного поведения LLM, основанного на усредненных знаниях.

В основе фреймворка PRISM лежит концепция, заимствованная из парадигмы Эпистемической Эволюции, согласно которой различаются этапы формирования знаний, аналогичные «природе» (предварительное обучение модели на большом корпусе данных) и «воспитанию» (индивидуальный опыт, получаемый в процессе взаимодействия). Такое разделение позволяет PRISM создавать уникальные представления знаний для каждого экземпляра модели, а не полагаться на общую, усредненную базу. В отличие от традиционных LLM, где все модели имеют одинаковую основу знаний после предобучения, PRISM позволяет каждой модели накапливать и структурировать собственный опыт, что ведет к формированию индивидуальных «эпистемических графов» и, как следствие, к более адаптивным и специализированным ответам.

Фреймворк PRISM использует эпистемическую структуризацию для создания динамических графов знаний, моделирующих аналогическое рассуждение. Этот процесс осуществляется посредством специализированных когнитивных операторов, которые позволяют модели связывать новые данные с существующими знаниями на основе структурного сходства. В основе лежит построение графа, где узлы представляют концепции, а ребра — отношения между ними. Когнитивные операторы выполняют операции сравнения, обобщения и абстрагирования, что позволяет системе выявлять аналогии между различными ситуациями и применять накопленный опыт к новым задачам. Динамичность графа обеспечивается возможностью добавления новых узлов и ребер, а также изменения весов существующих связей в зависимости от получаемой информации и опыта.

Конвейер PRISM сначала использует метод «Когнитивного взрыва» для преодоления локальной релевантности, а затем структурирует знания, соединяя контекстные и искровые узлы посредством когнитивных операторов, таких как отображение, смешение и инверсия.

PRISM в Действии: Подтверждение Новизны и Генерация Гипотез

Эффективность PRISM подтверждается результатами тестирования на специализированных бенчмарках, предназначенных для оценки креативности, в частности NoveltyBench и IdeaBench. NoveltyBench оценивает новизну генерируемых идей, а IdeaBench — способность модели генерировать проницательные и оригинальные решения. На NoveltyBench PRISM демонстрирует показатель Distinct@10 до 9, что значительно превосходит базовый уровень 2-5. Кроме того, наблюдается общее улучшение оценки Insight (Новизна) на IdeaBench, подтверждающее способность модели генерировать действительно новые и полезные идеи.

Модуль “Когнитивный Взрыв” является ключевым компонентом PRISM и предназначен для осуществления нецеленаправленного поиска, позволяющего модели отойти от ограничений, накладываемых предварительным обучением. Этот процесс достигается за счет активного исследования пространства решений, которое выходит за рамки наиболее вероятных ответов, обусловленных исходными данными. В результате, PRISM получает возможность генерировать более разнообразные и новаторские решения, не ограничиваясь типичными паттернами, усвоенными в процессе обучения. Использование данного модуля критически важно для повышения способности модели к генерации принципиально новых идей и преодолению когнитивных предубеждений.

В ходе тестирования PRISM на бенчмарках, оценивающих креативность, были получены результаты, демонстрирующие значительное улучшение показателей новизны. На бенчмарке NoveltyBench модель достигла значения до 9 по метрике Distinct@10, что существенно превосходит базовый уровень в 2-5. Кроме того, наблюдалось общее повышение оценки Insight Score (Novelty) на бенчмарке IdeaBench, подтверждающее способность PRISM генерировать более оригинальные и полезные идеи по сравнению с существующими подходами.

На заключительном этапе, этапе условной генерации, выходные данные модели ограничиваются на основе построенного Эпистемического графа. Этот граф, представляющий собой структурированное знание, служит фильтром, обеспечивающим релевантность и когерентность генерируемых идей. Ограничения, накладываемые Эпистемическим графом, предотвращают генерацию нелогичных или несвязанных предложений, фокусируя процесс генерации на наиболее перспективных и обоснованных решениях. Таким образом, условная генерация гарантирует, что итоговый результат не только нов, но и имеет смысл в контексте поставленной задачи и имеющихся знаний.

Визуализация главных компонент показывает, что PRISM генерирует более широкое и структурированное семантическое пространство ответов на вопрос о смысле жизни, в отличие от базовой модели.

PRISM в Действии: Диагностика Редких Заболеваний и Перспективы

Система PRISM демонстрирует значительный потенциал в решении сложных задач, в частности, в области диагностики редких заболеваний. Выявление диагностических путей для этих состояний требует не просто перебора симптомов, а глубокого и нюансированного анализа, поскольку редкие болезни часто имеют нетипичные проявления и сложную клиническую картину. PRISM, в отличие от традиционных подходов, способна эффективно обрабатывать сложные медицинские знания и выстраивать логические связи между симптомами и возможными диагнозами, что позволяет ей успешно идентифицировать даже самые труднодиагностируемые состояния. Такой подход особенно важен, поскольку своевременная и точная диагностика редких заболеваний имеет решающее значение для назначения эффективного лечения и улучшения качества жизни пациентов.

Система PRISM демонстрирует высокую эффективность в постановке диагнозов, используя структурированную медицинскую информацию из Онтологии человеческих фенотипов. В ходе экспериментов, PRISM успешно ориентировалась в сложных медицинских данных, предлагая потенциальные диагнозы с показателем Recall@10, достигшим 52.0%. Это значительно превосходит результат базовой модели, которая показала лишь 32.7%. Такой подход позволяет системе не просто перебирать вероятные варианты, но и учитывать нюансы клинической картины, что особенно важно при диагностике редких заболеваний, где требуется глубокое понимание взаимосвязи между симптомами и патологиями.

В ходе испытаний, система PRISM продемонстрировала способность к точной диагностике редкого генетического заболевания — глутаровой ацидурии I типа, в то время как базовые модели выдавали ложные результаты, предлагая диагнозы, соответствующие более распространенным синдромам. Этот результат подчеркивает ключевое отличие PRISM — способность отличать редкие, но специфические проявления заболеваний от более общих симптомов, избегая “галлюцинаций” и ошибочных предположений, характерных для менее продвинутых систем. Способность системы к дифференциальной диагностике редких заболеваний указывает на значительный прорыв в области медицинского искусственного интеллекта и открывает новые возможности для повышения точности и скорости постановки диагноза, особенно в сложных клинических случаях.

Успешное применение PRISM в диагностике редких заболеваний, в частности, в выявлении глутаровой ацидурии I типа, демонстрирует значительный потенциал системы в расширении возможностей рассуждений в различных областях знаний. В отличие от существующих моделей, склонных к генерации нерелевантных результатов, PRISM способен оперировать как широким спектром информации, так и глубоким пониманием специфических медицинских данных. Это позволяет системе находить неочевидные связи и предлагать точные диагнозы, что указывает на перспективность PRISM не только в медицине, но и в других дисциплинах, требующих комплексного анализа и способности к логическому выводу на основе обширных знаний. Таким образом, PRISM представляет собой значительный шаг вперед в создании искусственного интеллекта, способного к более сложному и контекстуальному мышлению.

Визуализация главных компонент (PCA) показывает, что PRISM обеспечивает более четкое разделение и интерпретацию семантических кластеров ответов на вопрос о жизни с бюджетом в 1000 долларов в месяц, по сравнению с другими моделями.

Наблюдая за стремлением современных больших языковых моделей к единообразию, можно вспомнить слова Г.Х. Харди: «Чистая математика — это не предмет человеческого разума, а игра, придуманная им». PRISM, как предложено в статье, пытается внести разнообразие в этот «игровой процесс», создавая индивидуальные траектории познания через структурированные графы знаний. Эта попытка избежать формирования «искусственного коллективного разума» напоминает тщетные усилия сохранить уникальность в мире, где всё стремится к стандартизации. Ведь, как известно, любая «самовосстанавливающаяся» система рано или поздно ломается, и PRISM, вероятно, не станет исключением, но попытка достойна внимания, особенно учитывая, что документация к подобным системам — это, как правило, коллективное самообман.

Что дальше?

Представленный подход, безусловно, ставит интересный вопрос о когнитивной дивергенции в больших языковых моделях. Однако, стоит помнить: любое «уникальное» траекторию развития быстро превращается в набор предсказуемых паттернов, как только модель сталкивается с реальными данными. Создание индивидуальных графов знаний — это красиво, но кто-то должен поддерживать эти графы в актуальном состоянии, а стоимость этой поддержки обычно упускается из виду. MVP — это всего лишь способ сказать пользователю: «подождите, мы потом исправим» — и в данном случае, «потом» может наступить никогда.

Очевидно, что проблема «искусственного улья» не решается простым моделированием когнитивных траекторий. Более вероятно, что истинный прогресс потребует пересмотра самой концепции обучения языковых моделей. Попытки создать «разнообразие» внутри существующей парадигмы неизбежно наткнутся на ограничения. Если код выглядит идеально — значит, его никто не деплоил. Вполне вероятно, что через несколько лет мы будем говорить о новых, ещё более элегантных архитектурах, которые окажутся такими же дорогими способами всё усложнить.

В конечном счете, вопрос не в том, сможем ли мы заставить модели мыслить по-разному, а в том, действительно ли это необходимо. Пока что это выглядит как академическое упражнение, не имеющее прямого отношения к реальным задачам. Каждая «революционная» технология завтра станет техдолгом. И это, пожалуй, самое предсказуемое будущее.

Оригинал статьи: https://arxiv.org/pdf/2602.21317.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-02-26 17:47

🚀 Квантовые новости