Визуальное убеждение: оценка влияния на большие языковые модели.

В эпоху всепроникающих визуальных коммуникаций, когда убеждение все чаще формируется не только словами, но и изображениями, видео и другими мультимодальными сигналами, возникает критический вопрос: достаточно ли мы понимаем, как эти новые формы убеждения влияют на наши решения и насколько уязвимы современные языковые модели перед тщательно продуманными мультимодальными манипуляциями? В работе ‘MMPersuade: A Dataset and Evaluation Framework for Multimodal Persuasion’ авторы осмеливаются исследовать эту сложную проблему, но действительно ли существующие инструменты позволяют нам полностью разгадать механизмы мультимодального убеждения и предсказать, сможет ли искусственный интеллект стать как мощным инструментом убеждения, так и оружием дезинформации?








