Денис Аветисян — Страница 453

Ускорение работы больших языковых моделей: новый подход к разреженности

08.11.2025 от Денис Аветисян

Применение инновационной схемы с зигзагообразным расположением и сбалансированным ядром позволило добиться ускорения разреженного умножения матриц на векторы (GEMV) на 1,51–1,78 раза для моделей Llama-3-8B, Llama-2-13B и Llama-2-70B, преодолев значительное замедление, вызванное ветвлением в наивных реализациях, и обеспечив умеренное улучшение по сравнению с другими оптимизациями.

Исследование предлагает инновационный метод повышения эффективности вычислений в нейронных сетях за счет динамического использования разреженности данных.

Знания из Графа: Новый Подход к Ответам на Вопросы

08.11.2025 от Денис Аветисян

Результаты поиска по запросам WebQSP и CWQ демонстрируют, что KGFR эффективно выделяет только наиболее релевантные фрагменты информации из топ-kk результатов.

Исследователи предлагают систему, объединяющую знания из графов и мощь современных языковых моделей для более точного и эффективного ответа на вопросы.

Тайский язык и зрение машин: новый вызов для искусственного интеллекта

08.11.2025 от Денис Аветисян

Распределение тринадцати типов задач в наборе данных ThaiOCRBench демонстрирует разнообразие сложностей, с которыми сталкивается система оптического распознавания символов, и определяет спектр необходимых возможностей для эффективной работы в реальных условиях.

Представлен комплексный набор данных для оценки возможностей моделей, работающих с текстом и изображениями на тайском языке.

SmaraQ: Hummingbirds and the Quantum Realm

08.11.2025 от Денис Аветисян

SmaraQ: Hummingbirds and the Quantum Realm Знаете, в квантовой физике часто кажется, что мы пытаемся поймать свет в кулак. Чем больше мы узнаем, тем больше понимаем, насколько всё хитро закручено. Вот и немецкий проект SmaraQ пытается сделать то же самое – но с ионами и фотонами, упакованными на чип. Что это за зверь? Представьте себе, … Читать далее

Визуализация предпочтений: как изображения помогают ИИ понимать покупателей

08.11.2025 от Денис Аветисян

Для прогнозирования следующей покупки мультимодальные большие языковые модели используют различные представления истории взаимодействия с пользователем – текстовые данные, графическое отображение в виде диаграммы рассеяния и блок-схемы, – что позволяет комплексно анализировать поведение и повышать точность предсказаний.

Исследование показывает, что представление истории покупок пользователя в виде визуальных данных повышает точность прогнозирования будущих приобретений.

Невидимые сбои: Как выявить ошибки в сложных системах искусственного интеллекта

08.11.2025 от Денис Аветисян

Создание надежных многоагентных систем требует тщательно разработанного конвейера курирования данных, обеспечивающего как качество, так и релевантность информации, используемой для обучения и функционирования этих сложных систем.

Новый анализ подходов к обнаружению скрытых отказов в системах, управляемых множеством взаимодействующих агентов.

Прогнозирование времени выполнения: новый подход к масштабируемому обучению

08.11.2025 от Денис Аветисян

Прогнозирование времени выполнения задач глубоких нейронных сетей позволяет оптимизировать ресурсы и повысить эффективность вычислений, выявляя ключевые параметры, влияющие на производительность системы.

Разработка системы, предсказывающей время выполнения задач глубокого обучения в распределенных системах, для повышения эффективности и масштабируемости.

Ускорение работы больших языковых моделей: новый подход к разреженности

Знания из Графа: Новый Подход к Ответам на Вопросы

Тайский язык и зрение машин: новый вызов для искусственного интеллекта

SmaraQ: Hummingbirds and the Quantum Realm

Визуализация предпочтений: как изображения помогают ИИ понимать покупателей

Невидимые сбои: Как выявить ошибки в сложных системах искусственного интеллекта

Прогнозирование времени выполнения: новый подход к масштабируемому обучению

Квантовая маскировка: как помехи могут усилить защиту данных

Превращая слова в музыку: новый подход к генерации MIDI

Квантовая память: Новые горизонты защиты данных