Рассуждения и Знания: Новое поколение систем генерации ответов

Обучение системы на графах знаний с использованием потерь ранжирования позволяет выявлять надёжные связи между сущностями и отфильтровывать шумные, формируя обоснованные пути рассуждений для ответа на запросы, при этом совместная оптимизация обхода графа знаний и поиска релевантных документов с использованием FAISS и ранжирования [latex]q(x)[/latex] обеспечивает прозрачность происхождения ответа и семантическую привязку, подобно подходу, реализованному в MentalLLAMA для обработки запросов в области психического здоровья.

Исследователи представляют нейросимволические системы поиска и генерации, объединяющие преимущества нейронных сетей и символьных знаний для повышения точности и интерпретируемости.

Различия в воздействии: два подхода к изучению неравенства

В сложном нелинейном сценарии, метод причинного леса демонстрирует значительно более точное отслеживание истинных причинно-следственных эффектов по подгруппам, чем метод наименьших квадратов, особенно в отношении женщин из числа меньшинств, где наименьшие квадраты не способны различить влияние высокого и низкого дохода; при этом, средняя абсолютная ошибка метода причинного леса в четыре раза ниже, чем у наименьших квадратов (0.17 против 0.74).

Новое исследование сравнивает дедуктивные и индуктивные методы оценки неоднородности эффектов, предлагая комбинированный подход для более точного анализа.

Зрение машин: Анализ фармацевтических видео с помощью искусственного интеллекта

Платформа для поиска по естественному языку, объединяющая большие языковые ([latex]LLM[/latex]), акустические ([latex]ALM[/latex]) и визуальные ([latex]VLM[/latex]) модели, обработала более 25 тысяч видео- и 888 аудиофайлов, охватывающих свыше двадцати языков, демонстрируя свою масштабируемость и многоязыковую функциональность.

Новая платформа позволяет масштабировать модели, объединяющие зрение и язык, для глубокого понимания длинных видеороликов в фармацевтической отрасли.

Большие языковые модели: узкие места и пути ускорения

Статья посвящена анализу проблем производительности при развертывании больших языковых моделей и предлагает перспективные направления для аппаратной оптимизации.

Обманчивая уверенность: Сравниваем способности человека и машин в обнаружении фишинга

Новое исследование показывает, как люди и алгоритмы по-разному оценивают достоверность электронных писем, выявляя сильные и слабые стороны каждой из сторон.

Один пример – и безопасность восстановлена: как спасти «обученную» нейросеть

Новое исследование показывает, что для восстановления безопасности больших языковых моделей после «обучения» достаточно всего одного специально подобранного примера.

Металлические жидкости: новый подход к машинному обучению потенциалов

На основе предсказаний, полученных с помощью моделей машинного обучения, обученных на данных PBE и r2SCAN, исследованы температурно-зависимая плотность жидкостей алюминия, кобальта, меди, магния, молибдена, никеля, титана и вольфрама, а также диффузия меди, никеля, алюминия и титана, что позволило установить соответствие теоретических данных экспериментальным значениям и оценить точность предсказаний для температур плавления указанных металлов.

Исследователи разработали инновационную стратегию конструирования данных для создания стабильных и точных моделей машинного обучения, предсказывающих поведение жидких металлов.

Объемные формы и память машин: как генеративные модели учатся на 3D-данных

Исследование представляет собой разработанную систему оценки способности к запоминанию в задачах генерации трехмерных форм, позволяющую количественно оценить этот аспект в существующих методах и провести контролируемые эксперименты для изучения влияния данных и архитектуры модели на феномен запоминания.

Новое исследование посвящено анализу способности генеративных моделей запоминать обучающие данные и предлагает методы улучшения обобщающей способности без потери качества генерации 3D-форм.

Искусственный интеллект в управлении воздушным движением: проверка на практике

Наблюдаемые в ходе оценки агентов средние ошибки при выполнении трех итоговых упражнений демонстрируют зависимость от сценария, при этом каждая точка на графике представляет собой усредненные показатели по всем симуляциям, выполненным стажерами-авиадиспетчерами, а конкретный пример, выделенный звездочкой, подробно рассматривается на рисунке 10.

Новый подход к тестированию систем искусственного интеллекта для авиадиспетчеров позволяет оценить их эффективность в условиях, максимально приближенных к реальным.

Один пример – ключ к интеллекту: как обучить ИИ рассуждать?

Оценка производительности комплексного обучения (MATH и LIMR) и различных выборок полиматематического обучения (Синтетические простые, естественные примеры пред-алгебры, [latex]\pi_{1}[/latex]) на базе Qwen2.5-7b-base демонстрирует, что применение жадного декодирования и скользящего усреднения с окном в 5 точек для AIME2024, AIME2025 и других эталонов позволяет выявить различия в эффективности различных подходов к обучению.

Новое исследование показывает, что для существенного улучшения способности больших языковых моделей к логическому мышлению достаточно всего одного, тщательно подобранного или сгенерированного примера.