Под контролем: Как обезопасить поведение ИИ-агентов

Новая разработка позволяет автоматически формировать правила доступа и контролировать исполнение, снижая риски, связанные с вредоносными запросами и непредсказуемостью больших языковых моделей.

Новая разработка позволяет автоматически формировать правила доступа и контролировать исполнение, снижая риски, связанные с вредоносными запросами и непредсказуемостью больших языковых моделей.
Исследователи разработали эффективные процедуры принятия решений для вариантов GKAT, значительно превосходящие существующие инструменты по производительности.

Исследователи предлагают инновационную систему VQ-Seg, использующую векторизацию и структурированные возмущения для повышения точности сегментации медицинских изображений при недостатке размеченных данных.

Новый взгляд на взаимодействие человека и ИИ рассматривает не просто совместную работу, а обоснование надежности принимаемых решений.
![Эффективность различных моделей демонстрирует зависимость производительности от архитектурных особенностей, где [latex]F_1[/latex] score служит ключевым показателем, позволяющим оценить точность и полноту обнаружения, а сравнительный анализ выявляет оптимальные конфигурации для конкретных задач.](https://arxiv.org/html/2601.09972v1/x3.png)
Исследователи представили новый эталонный набор данных для оценки возможностей больших языковых моделей в области китайского трудового законодательства.

Новый подход позволяет создавать реалистичные и последовательные характеры для языковых моделей, основываясь на анализе повествования.

Статья предлагает переосмыслить изучение коллективного поведения систем, основанных на больших языковых моделях, с точки зрения социальных взаимодействий и теории информации.
Новый подход объединяет непредсказуемость фаззинга, точность символьного исполнения и эффективность сэмплирования для всестороннего анализа кода.
Квантовая криптография: от теории к практике Знаете, всегда смешно наблюдать, как люди строят сложные теории, а потом оказывается, что реальность гораздо проще – или, наоборот, сложнее, чем они думали. Вот и с квантовой криптографией: долгое время это была область для энтузиастов, а теперь оказывается, что пора переходить к реальным действиям. Представьте себе сейф, замок которого … Читать далее
Статья рассматривает риски использования искусственного интеллекта для оценки научных исследований и предлагает новый подход к обеспечению надежности этих инструментов.