Искусственный интеллект — Страница 182

Взлом в стоге сена: как длинный контекст обходит защиту языковых моделей

10.11.2025 от Денис Аветисян

В исследовании длинных контекстов обнаружено, что модели Llama-3 и Qwen2.5 демонстрируют различную динамику компромисса между способностью и безопасностью: Llama-3 показывает последовательное снижение как успешности (ASR), так и частоты отказов по мере смещения цели запроса к концу контекста, в то время как Qwen2.5 выявляет эффект

Исследование показывает, что увеличение объема вводного текста может значительно снизить безопасность больших языковых моделей, делая их уязвимыми для атак, направленных на обход встроенных ограничений.

Машинное обучение и статистика: новый взгляд на анализ данных

10.11.2025 от Денис Аветисян

Интеграция методов машинного обучения и статистического моделирования для повышения точности прогнозов и интерпретируемости результатов.

Ожившие движения: понимание языка тела

10.11.2025 от Денис Аветисян

Производительность современных моделей, объединяющих обработку движения и языка, была оценена на подмножествах HumanML3D, разделенных на простые и сложные последовательности движений, что позволило выявить различия в их способности понимать и генерировать описания для задач с различной кинематической сложностью.

Новый подход к анализу 3D-движений человека с помощью больших языковых моделей позволяет детально описывать действия во времени.

Проверка цитат под контролем ИИ: Новый уровень академической честности

10.11.2025 от Денис Аветисян

Искусственный интеллект автоматизирует проверку ссылок в научных работах, обеспечивая беспрецедентную точность и эффективность.

Критический взгляд: как самооценка улучшает ответы больших языковых моделей

10.11.2025 от Денис Аветисян

Модель CritiCal, работающая на базе DeepSeek-R1-Distill-Qwen-7B, демонстрирует значительный потенциал в улучшении калибровки уверенности больших языковых моделей даже при использовании в качестве учителя модели с худшими показателями, что указывает на возможность повышения надежности систем в условиях неидеальных исходных данных.

Исследование показывает, что обучение моделей с использованием естественных языковых оценок помогает им лучше оценивать свою уверенность в ответах.

Причинность и обучение представлений: новый взгляд на биомедицинские данные

10.11.2025 от Денис Аветисян

Графическая модель демонстрирует, что обучение представлений, основанное на причинно-следственных связях, позволяет системам не просто адаптироваться к данным, но и понимать лежащие в их основе механизмы, обеспечивая устойчивость и гибкость в меняющейся среде.

Исследование посвящено методам выявления причинно-следственных связей и разработки эффективных алгоритмов обучения, применимых к сложным биомедицинским задачам.

Визуальные галлюцинации: Как сделать «зрение» нейросетей более надежным

10.11.2025 от Денис Аветисян

Архитектура, представленная на рисунке, демонстрирует модификацию подхода к слиянию визуальных и языковых представлений, где усредненное визуальное представление последовательно присоединяется к каждому токеновому вложению перед проецированием, что способствует обучению модели визуально информированным текстовым вложениям и улучшает её способность к вниманию к визуальному входу.

Исследование посвящено проблеме ложных утверждений, генерируемых моделями, работающими с изображениями и текстом, и предлагает способ повысить точность их ответов.

Искусственный интеллект на службе редких болезней

10.11.2025 от Денис Аветисян

Система, использующая скоординированных агентов для извлечения и интеграции медицинских знаний из внешних баз данных, демонстрирует прирост точности до 10.2% в диагностике редких заболеваний по сравнению с традиционными подходами, подтверждая необходимость адаптации к реальным ограничениям и сложностям клинической практики.

Новая система помогает врачам диагностировать редкие заболевания мозга, используя знания из медицинских баз данных.

Глубокий взгляд: Новое поколение мультимодальных агентов

10.11.2025 от Денис Аветисян

Глубокая система DeepEyesV2 осуществляет итеративный многомодальный вывод, последовательно вызывая инструменты и интегрируя полученные результаты в последующие этапы рассуждений, что позволяет ей динамически расширять свои возможности анализа.

Исследователи представляют DeepEyesV2 – модель, способную решать сложные задачи, объединяя зрение, язык и инструменты.

Городской интеллект: Планирование на основе рассуждений

10.11.2025 от Денис Аветисян

Искусственный интеллект в городском планировании выполняет двойственную функцию: он не только предсказывает будущие сценарии, но и предлагает обоснованные рекомендации, обеспечивая поддержку принятия решений на основе четкой логической цепочки.

Новый подход к искусственному интеллекту в градостроительстве, основанный на логических выводах, а не только на прогнозах.