Ловушки для ИИ: Как выявить критические ошибки в больших языковых моделях

Система NESSiE оценивает большие языковые модели, разделяя тесты на безопасность и полезность, где модели должны либо предоставлять информацию в ответ на запрос пользователя (полезное поведение), либо воздерживаться от этого (безопасное поведение), а общая метрика SH (Safe & Helpful) позволяет комплексно оценить оба аспекта, используя различные группы шаблонов для тестирования.

Новый бенчмарк NESSiE позволяет быстро и эффективно оценить безопасность и способность следовать инструкциям у языковых моделей, используемых в автономных системах.

Божественный код: Как заставить ИИ поверить в смысл существования

Предлагается конвергентное описание, объединяющее гипотезу о симуляции и методологии обучения роботов, демонстрирующее общие принципы построения и функционирования искусственных систем.

Новая концепция ‘Симуляционной теологии’ предлагает принципиально иной подход к выравниванию искусственного интеллекта, основанный на внедрении системы убеждений о его месте в смоделированной реальности.

Обуздать Искусственный Интеллект: Новый Подход к Безопасности Больших Языковых Моделей

Настройка избирательной чувствительности к нейронам в системе NeST позволяет выделить и акцентировать специфические сигналы, формируя основу для дальнейшей обработки и анализа данных.

Исследователи предлагают эффективный метод точной настройки, позволяющий повысить безопасность языковых моделей, фокусируясь на ключевых нейронах.

Поведение ИИ в поиске: новый взгляд на запросы

Матрицы вероятностей перехода, представляющие поведение человека и агента при поиске, демонстрируют закономерности изменения состояний: строки соответствуют текущему состоянию, а столбцы - следующему, что позволяет анализировать динамику поиска в обоих случаях.

Исследователи представляют ASQ — набор данных, отражающий поисковые стратегии искусственного интеллекта, демонстрируя существенные отличия от поведения человека при поиске информации.

Обучение роботов предвидению: новый подход к моделированию мира

Модель FRAPPE демонстрирует значительное превосходство над существующими аналогами в сложных симуляциях и реальных условиях, эффективно используя данные, полученные на различных уровнях тренировочной пирамиды.

Исследователи разработали метод, позволяющий роботам лучше понимать окружающую среду и планировать свои действия, используя возможности диффузионных моделей и визуально-языкового обучения.

Подводное зрение: новый подход к точной глубинной оценке

Подводная стереоскопическая оценка глубины в условиях нулевой адаптации была продемонстрирована в реальном времени посредством развертывания модели на роботизированной платформе, что позволило получить качественные результаты в сложных условиях.

Исследователи представили StereoAdapter-2 — систему, позволяющую значительно повысить точность определения глубины под водой, что критически важно для подводных роботов и исследований.

Воспроизводимость исследований: новый подход с использованием искусственного интеллекта

Для обеспечения воспроизводимости исследований предложена трехуровневая архитектура агентов, в которой оркестратор на основе больших языковых моделей направляет задачи и анализирует ошибки, в то время как промежуточный слой фиксирует структурированные контракты ввода-вывода и закономерности разрешения неудач, а вычислительная база, реализованная на языках R, Stata и Python, выполняет все операции над файлами и статистический анализ посредством модульного семиэтапного конвейера - от получения данных до формирования стандартизированных отчетов.

Автоматизация выполнения и диагностики эмпирических социальных исследований позволяет значительно повысить надежность и масштабируемость научных результатов.

Разреженность и масштаб: семейство языковых моделей Trinity

В исследовании проводится сопоставление модели Trinity Large Base с другими открытыми базовыми моделями, демонстрирующее её относительные характеристики и возможности в рамках данного класса систем.

В статье представлен подробный анализ разработки открытых языковых моделей Trinity, включая модель Trinity Large, и описаны ключевые стратегии для обеспечения стабильного обучения и эффективного масштабирования при экстремальной разреженности.