Интеллектуальный анализ знаний: ускорение работы графовых нейронных сетей

KG-WISE организует обучение и вывод для больших графов знаний, используя извлечение подграфов под управлением больших языковых моделей, детальное хранение моделей и инстанцирование моделей с учетом запроса.

Новая система KG-WISE использует возможности больших языковых моделей для выделения релевантных подграфов и оптимизации работы с большими графами знаний.

Лица в алгоритмах: Как понять, насколько точно нас видят машины

Новый подход к оценке алгоритмических решений позволяет проверить, соответствуют ли представления о человеке, используемые машиной, тому, как он сам себя описывает.

Контекст без границ: новая архитектура для больших языковых моделей

Архитектура SharedLLM, подобная общей схеме кодировщика-декодировщика, как в T5 (Raffel et al., 2020), обеспечивает взаимодействие на первом уровне MM посредством общих ключей-значений, которые кодируются и сжимаются из текстового фрагмента в последовательность деревьев.

Исследователи предлагают инновационный подход к расширению контекстного окна больших языковых моделей, позволяющий обрабатывать значительно больший объем информации.

Термодинамика под контролем: ИИ-помощник для обучения и преподавания

Новая разработка предоставляет студентам и преподавателям инструменты на базе искусственного интеллекта для углубленного изучения и эффективного преподавания термодинамики в химической инженерии.

Температура информации: новый взгляд на языковые модели

Функция корреляции [latex]K(r)[/latex] аддитивной марковской цепи, построенной с использованием функции памяти [latex]F(r)[/latex] (вставлена на рисунке) при длине памяти [latex]r = N = 10[/latex] и параметрах [latex]\overline{a} = 1/2[/latex] и [latex]F\_0 = 0.15[/latex], демонстрирует соответствие между численным решением уравнения (9) и вычислениями, выполненными непосредственно по определению (8) для генерации числовой последовательности с CPDF (7), подтверждая корректность используемого подхода.

Исследование предлагает теоретическую основу для измерения ‘температуры информации’ в цепях Маркова, что может помочь понять, как большие языковые модели избегают проблемы экспоненциального роста сложности.

Всевидящее око и нейросети: готовы ли мультимодальные модели к задачам видеонаблюдения?

В предлагаемой системе обнаружения аномалий в видеопотоке, необработанные видеоданные преобразуются в сегментированные фрагменты, которые затем анализируются мультимодальными моделями с использованием различных запросов, что позволяет получить классификацию, непосредственно сопоставимую с эталонными данными на уровне всего видео.

Новое исследование проверяет возможности современных искусственных интеллектов в обнаружении аномалий на видео, выявляя ограничения и необходимые условия для их эффективного применения в системах безопасности.

Диагностика заболеваний печени: новый подход с использованием искусственного интеллекта

Система MedCoRAG, объединяя извлечение аномальных данных из клинических записей, гибридный поиск релевантной информации из клинических рекомендаций и графов знаний UMLS, а также многоагентный подход к рассуждениям с участием маршрутизирующего и специализированных агентов, обеспечивает формирование интерпретируемого диагноза, адаптируясь к сложности случая и при необходимости инициируя повторный поиск доказательств для достижения консенсуса.

Исследователи предлагают инновационную систему, объединяющую возможности поиска информации и экспертного консенсуса для повышения точности и прозрачности диагностики заболеваний печени.

Скрытые риски больших моделей: неустойчивость вычислений

Динамика обучения четырех мультимодальных моделей - LLaVA-v1.5-7B, Idefics3-8B, SmolVLM2-2.2B-Instruct и Janus-Pro-1B - на наборе данных Numerical-COCO демонстрирует, что оптимизация с использованием контролируемой прокси-потери на MSCOCO коррелирует с накопленной метрикой численной разности, вычисляемой на основе отклонений прямого прохода от эталонного высокоточного решения.

Новое исследование показывает, что большие мультимодальные модели могут быть подвержены неожиданным сбоям из-за незначительных изменений входных данных, что приводит к серьезной деградации производительности.