Автор: Денис Аветисян
Новая модель CNRE анализирует цепочку поведения пользователя, чтобы объяснить, почему система предлагает именно эти товары или услуги.

Разработка модели причинно-следственного нейро-символического рассуждения для объяснимых рекомендаций, учитывающих множественные действия пользователя.
Существующие системы рекомендаций, основанные на анализе множественных действий пользователя, часто жертвуют прозрачностью ради повышения производительности. В данной работе, посвященной ‘Modeling Endogenous Logic: Causal Neuro-Symbolic Reasoning Model for Explainable Multi-Behavior Recommendation’, предложена модель CNRE, использующая причинно-следственный вывод и нейро-символический подход для построения объяснимых рекомендаций, основанных на внутренней логике последовательности действий пользователя. Модель CNRE выделяет и моделирует эту логику, имитируя процесс принятия решений человеком и генерируя объяснимые причинно-следственные связи, свободные от ложных корреляций. Возможно ли, используя подобный подход, создать действительно понятные и надежные системы рекомендаций, способные предсказывать и объяснять предпочтения пользователей?
За гранью разреженных данных: Потребность в объяснимых рекомендациях
Традиционные системы рекомендаций часто сталкиваются с проблемой разреженности данных, что существенно ограничивает их способность точно определять индивидуальные предпочтения пользователей. Эта разреженность возникает из-за того, что большинство пользователей взаимодействуют лишь с небольшой частью доступного контента, оставляя недостаточно информации для построения надёжных моделей. В результате, системам сложно выявить скрытые закономерности и предложить действительно релевантные рекомендации, особенно для новых пользователей или в случаях, когда предпочтения пользователя меняются со временем. Недостаток данных приводит к упрощённым моделям, которые не учитывают тонкие нюансы вкусов и интересов, что снижает общую эффективность и полезность рекомендаций для конечного пользователя.
В настоящее время пользователи всё чаще требуют от рекомендательных систем не только точных предложений, но и понятного обоснования этих рекомендаций. Это связано с растущим недоверием к “черным ящикам” алгоритмов и желанием контролировать процесс принятия решений, влияющих на их выбор. Подобный запрос на прозрачность подталкивает исследователей к разработке методов объяснимого искусственного интеллекта (XAI) в контексте рекомендаций. Вместо простого представления списка предложений, системы должны уметь аргументировать свой выбор, например, указывая на схожесть с ранее оцененными товарами или на общие предпочтения пользователей с похожим профилем. Разработка объяснимых рекомендательных систем — это не только вопрос доверия, но и возможность для пользователей более осознанно взаимодействовать с сервисами и улучшать качество получаемых предложений.
Исследования показывают, что использование разнообразных поведенческих данных пользователей — не только история просмотров или покупок, но и время, проведенное на странице, взаимодействие с различными элементами интерфейса, использование фильтров и сортировок, а также даже последовательность действий — значительно снижает проблему разреженности данных. Такой подход позволяет системе более полно и точно формировать профиль предпочтений каждого пользователя, даже при ограниченном количестве явных оценок или взаимодействий. Вместо того чтобы полагаться исключительно на редкие сигналы, алгоритмы могут выводить предпочтения, анализируя неявные паттерны поведения, что приводит к более релевантным и персонализированным рекомендациям. Более того, учет множества поведенческих факторов обеспечивает более глубокое понимание мотивации пользователя, позволяя системе не просто предсказывать, что ему понравится, но и объяснять, почему именно эта рекомендация была сделана.
Выявление причинно-следственных связей в поведении пользователей
Понимание причинно-следственных связей, определяющих поведение пользователей, является основополагающим для точного прогнозирования их предпочтений. Традиционные методы анализа, основанные на корреляциях, часто не позволяют отличить причинно-следственные связи от случайных совпадений, что приводит к неточным предсказаниям. Для повышения точности необходимо выявлять факторы, непосредственно влияющие на выбор пользователя, и учитывать последовательность действий, поскольку именно она отражает динамику формирования предпочтений. Игнорирование этих механизмов приводит к ошибкам в персонализации, рекомендациях и других приложениях, требующих прогнозирования поведения пользователей.
Последовательность действий пользователя, именуемая ‘Цепочкой Поведения’, отражает нарастающую интенсивность предпочтений. Начальные действия в цепочке указывают на ‘Слабое Предпочтение’, характеризующееся низкой вероятностью повторного взаимодействия. По мере выполнения дополнительных действий, предпочтение усиливается, переходя в стадию ‘Умеренного Предпочтения’, а затем и ‘Сильного Предпочтения’, что выражается в повышенной вероятности конверсии или повторного обращения. Анализ последовательности действий позволяет выявить динамику формирования предпочтений и оценить степень заинтересованности пользователя в конкретном продукте или сервисе.
Внутренняя, или эндогенная логика, последовательности действий пользователя (цепочки поведения) отражает интенсивность его предпочтений и определяется наличием посредника причинности. Этот посредник представляет собой конкретное действие или событие в цепочке, которое усиливает или ослабляет связь между предыдущими действиями и формированием предпочтения. Например, повторный просмотр карточки товара (действие-посредник) усиливает связь между первоначальным интересом и вероятностью покупки, тем самым демонстрируя рост предпочтения. Анализ этих посредников причинности позволяет выявить ключевые факторы, влияющие на формирование предпочтений, и оценить степень их влияния на конечное решение пользователя.

Причинно-символьное рассуждение для объяснимых рекомендаций
Предлагаемая модель ‘Causal Neuro-Symbolic Reasoning’ представляет собой новый подход к построению объяснимых рекомендаций, объединяющий методы причинно-следственного вывода и нейро-символического рассуждения. Интеграция этих двух направлений позволяет не только повысить точность рекомендаций, но и обеспечить возможность многоуровневого объяснения принимаемых решений. Модель позволяет выявлять причинно-следственные связи между пользовательскими предпочтениями и предлагаемыми товарами, что способствует более прозрачной и понятной системе рекомендаций по сравнению с традиционными подходами. Результаты экспериментов на датасетах Beibei, Taobao и Tmall демонстрируют превосходство предложенной модели по ключевым метрикам, таким как HR@20 и NDCG@20, подтверждая ее эффективность и практическую значимость.
В предложенной модели ‘Иерархическое распространение предпочтений’ (Hierarchical Preference Propagation) эффективно моделирует взаимосвязи между различными действиями пользователя, учитывая, что предпочтения могут проявляться и изменяться в зависимости от контекста каждого действия. Этот подход позволяет улавливать сложные паттерны поведения и более точно прогнозировать будущие интересы. Параллельно, ‘Кодирование с учетом поведения’ (Behavior-Aware Parallel Encoding) позволяет независимо обрабатывать различные типы поведения пользователя, выявляя специфические предпочтения, характерные для каждого типа. Такое раздельное кодирование, в отличие от унифицированного подхода, способствует более детальному и точному представлению профиля пользователя и улучшает качество рекомендаций.
Механизм адаптивной проекции (Adaptive Projection Mechanism) предназначен для подавления вмешивающихся факторов (confounders) в процессе оценки причинно-следственных связей. Для обеспечения устойчивости оценок используется метод «front-door adjustment», позволяющий получить надежные результаты даже при наличии неконтролируемых переменных. Экспериментальные результаты на наборах данных Beibei, Taobao и Tmall демонстрируют значительное улучшение ключевых метрик, включая HR@20 и NDCG@20, по сравнению с базовыми моделями, что подтверждает эффективность предложенного подхода к причинно-следственному моделированию для рекомендательных систем.

Усиление вывода предпочтений с помощью логических операций
Для обработки неполных сигналов предпочтений используются логические операции: ‘Подтверждающее Сочетание’ (Confirmatory Conjunction) и ‘Дизъюнктивное Выведение’ (Disjunctive Inference). Подтверждающее Сочетание применяется для валидации определенных предпочтений, требуя одновременного наличия нескольких признаков, что повышает уверенность в выявленной потребности. Дизъюнктивное Выведение, напротив, усиливает слабые сигналы, предполагая, что наличие хотя бы одного из нескольких признаков указывает на предпочтение. Эти операции позволяют более эффективно обрабатывать неоднозначные данные, повышая точность определения пользовательских намерений при наличии неполной информации.
Операции логического вывода позволяют уточнить интерпретацию сигналов “Средней Предпочтительности”, снижая уровень неопределенности в оценке намерений пользователя. В ситуациях, когда входные данные не позволяют однозначно определить предпочтение, применение логических операций, таких как конъюнкция и дизъюнкция, позволяет объединить несколько слабых сигналов или подтвердить существующие, повышая уверенность в выводе. Таким образом, “Средняя Предпочтительность” перестает быть просто промежуточным состоянием между уверенностью и неуверенностью, а становится результатом логического анализа и уточнения доступной информации, что обеспечивает более точное определение предпочтений пользователя.
Комбинирование логических выводов, полученных посредством операций ‘Конъюнктивной Подтвержденности’ и ‘Дизъюнктивной Инференции’, с нашей причинно-следственной моделью позволяет значительно повысить надежность и точность оценки намерений пользователя. Причинно-следственная модель предоставляет контекст и позволяет учитывать взаимосвязи между различными факторами, влияющими на предпочтения, в то время как логические выводы уточняют и усиливают слабые или неполные сигналы. Такой подход позволяет более эффективно разрешать неоднозначности и формировать более полное представление о желаниях пользователя, что приводит к более релевантным результатам и персонализированному опыту.
К надёжным и прозрачным рекомендательным системам
Разработанный подход демонстрирует значительное повышение точности рекомендаций, одновременно решая критически важную задачу обеспечения объяснимости. В отличие от традиционных «черных ящиков», новая система позволяет не только предсказывать предпочтения пользователя, но и раскрывать логику, лежащую в основе этих предсказаний. Это достигается за счет анализа взаимосвязей между различными факторами, влияющими на выбор пользователя, и представления этих связей в понятной форме. Такой подход позволяет пользователям лучше понимать, почему им предлагается тот или иной продукт, и повышает их доверие к системе, а также открывает возможности для более осознанного принятия решений.
Системы рекомендаций, раскрывающие лежащие в основе принятия решений причинно-следственные связи, предоставляют пользователям не просто список предложений, но и понимание почему эти предложения были сделаны. Это принципиально отличается от «черных ящиков», где рекомендации кажутся произвольными. Пользователи, осознающие факторы, влияющие на выбор системы — будь то схожие предпочтения других пользователей, характеристики товара или контекст ситуации — получают возможность контролировать процесс и влиять на результаты. Такой подход способствует укреплению доверия к системе, поскольку пользователь видит, что рекомендации не случайны, а основаны на логичной и понятной цепочке рассуждений, что, в свою очередь, повышает вероятность принятия этих рекомендаций и удовлетворенность от использования системы.
Исследование открывает новые перспективы в создании рекомендательных систем, отличающихся повышенной надёжностью, прозрачностью и персонализацией, что приносит пользу как пользователям, так и компаниям. В частности, разработанная модель CNRE демонстрирует минимальное снижение эффективности даже при неполноте данных — ситуации, часто встречающейся на практике. Это превосходящее устойчивость к разреженности данных свойство существенно отличает CNRE от других моделей, обеспечивая более стабильные и точные рекомендации, несмотря на ограниченность информации о пользователях и предметах. Такая устойчивость является ключевым фактором для успешного внедрения рекомендательных систем в различных областях, где данные могут быть неполными или шумными.

В этой работе, где авторы пытаются обуздать хаос пользовательского поведения, прослеживается знакомая закономерность. Модель CNRE, стремясь объяснить рекомендации через цепочки действий, лишь подтверждает старую истину: каждая «революционная» технология завтра станет техдолгом. Ведь рано или поздно, продакшен найдёт способ сломать даже самую элегантную теорию причинно-следственных связей. Как метко заметил Анри Пуанкаре: «Наука не состоит из ряда истин, а из методов». В данном случае, метод выстраивания логической цепочки поведения пользователя — это лишь временное затишье перед новой волной непредсказуемости, которую ещё предстоит обуздать. И это, пожалуй, самое увлекательное.
Что дальше?
Предложенная модель, стремясь объяснить рекомендации через цепочку действий пользователя, неизбежно наталкивается на проблему масштабируемости эндогенной логики. Каждая добавленная операция в цепочке экспоненциально усложняет процесс вывода, превращая элегантную теорию в практический кошмар для продакшена. Оптимизировано ли это? Рано или поздно, оптимизируют обратно. Впрочем, это закономерность.
Настоящий вызов — не в точности моделирования поведения, а в её устойчивости к непредвиденным действиям пользователя. Идеальная цепочка действий — это иллюзия. В реальном мире всегда найдётся действие, которое разрушит всю логику. Поэтому, вероятно, стоит сместить фокус с поиска «правильной» цепочки на создание модели, способной адекватно реагировать на её нарушение — не столько объяснять, сколько предсказывать последствия отклонения.
В конечном итоге, задача не в том, чтобы построить идеальный «мозг» рекомендательной системы, а в том, чтобы создать систему, способную адаптироваться к непредсказуемости человеческого поведения. Мы не рефакторим код — мы реанимируем надежду. И в этом есть своя печальная, но неизбежная логика.
Оригинал статьи: https://arxiv.org/pdf/2601.21335.pdf
Связаться с автором: https://www.linkedin.com/in/avetisyan/
Смотрите также:
- Искусственный интеллект: расшифровка паттернов инноваций
- Точность симуляций: Как правильно оценить истинные значения в причинно-следственных исследованиях
- Искусственный исследователь: Новые горизонты автономных агентов
- Время видеть: как агенты раскрывают многомерное мышление в языковых моделях.
- Квантовые игры: поиск равновесия на нейтральных атомах
- Адаптация моделей к новым данным: квантильная коррекция для нейросетей
- Сердце музыки: открытые модели для создания композиций
- Где «смотрят» большие языковые модели: новый взгляд на визуальное понимание
- Ищем закономерности: Новый пакет TSQCA для R
- Эффективная память для больших языковых моделей: новый подход LOOKAT
2026-02-01 20:16