Искусство Рассуждений: Как Оптимизировать ‘Ум’ Машин

В данной работе представлена систематическая оценка влияния данных, вознаграждения и оптимизации на эффективность обучения с подкреплением, направленная на формирование кратких и точных траекторий рассуждений, достигаемых посредством грамотного проектирования функции вознаграждения.

Новое исследование показывает, что обучение моделей на более простых задачах и грамотная настройка системы вознаграждений позволяет значительно повысить эффективность их рассуждений и снизить вычислительные затраты.

Белки говорят иначе: новые горизонты языковых моделей

Схема раннего выхода, основанная на работе Шварца и коллег, позволяет модели предсказывать результат на каждом слое обработки последовательности белка, прекращая дальнейшее вычисление, как только уверенность в предсказании достигает заданного порога, что обеспечивает эффективное использование ресурсов и ускорение анализа.

Исследование показывает, что модели, обученные на последовательностях аминокислот, отличаются от тех, что работают с человеческим языком, что открывает возможности для оптимизации их работы.

Текст под прицелом: Новая система оценки качества визуального рендеринга

На представленных образцах демонстрируется способность TextPecker выявлять структурные аномалии в тексте при различных сценариях рендеринга, при этом визуализация оценки структурного качества осуществляется с использованием параметра [latex] \omega = 1 [/latex].

Исследователи предлагают инновационный подход к оценке и улучшению качества сгенерированного текста, основанный на выявлении структурных аномалий.

Экосистема разумного ПО: новый подход к разработке

В статье представлен комплексный проект экосистемы, объединяющей язык программирования, инструменты и среду выполнения для создания безопасных и надежных приложений с искусственным интеллектом.

Текст под маской: адаптивная анонимизация с помощью языковых моделей

Результаты, представленные в таблице, демонстрируют, что оптимизация запросов обеспечивает более выгодный баланс между конфиденциальностью и полезностью по сравнению со статическими методами анонимизации и специализированными запросами, часто значительно повышая уровень конфиденциальности при сохранении или даже улучшении полезности в различных задачах и моделях.

Новый подход позволяет гибко настраивать процесс анонимизации текста, находя оптимальный баланс между защитой данных и сохранением их полезности.

Сжатие без потерь: Эффективная квантизация моделей для обработки видео, текста и действий

Разработанный фреймворк QuantVLA для визуальных языковых моделей сохраняет исходную архитектуру и график операций, используя селективную квантизацию линейных и MLP-слоев при сохранении операций внимания в формате с плавающей точкой, а также механизмы выравнивания логитов Attention Temperature Matching (ATM) посредством скалярных коэффициентов α и балансировки энергии выходных слоев Output Head Balancing (OHB) с использованием скалярных коэффициентов β, что позволяет проводить обучение без необходимости дополнительной настройки.

Новая методика позволяет значительно уменьшить размер и повысить скорость работы мультимодальных моделей, не жертвуя точностью.

Наука в движении: как искусственный интеллект обретает «тело» для открытий

Система EmbodiedAct объединяет агента, основанного на больших языковых моделях, и среду симуляции посредством асинхронного протокола синхронизации состояния, организуя быстрый внутренний цикл, управляемый движком восприятия в реальном времени для немедленного исправления ошибок, и медленный внешний цикл, управляемый рефлексивным механизмом принятия решений для перепланирования действий.

Новый подход позволяет большим языковым моделям взаимодействовать с научными симуляциями, получая опыт «в процессе» и повышая достоверность результатов.

Визуальные сообщения: Новый подход к структурированию изображений

В модели COMiT наблюдается спонтанное формирование токенов, ориентированных на объекты, что проявляется в структуре карт внимания на глубоких слоях сети во время декодирования, где эти токены естественным образом концентрируются на объектах и их частях.

Исследователи предлагают инновационный метод токенизации изображений, вдохновленный принципами коммуникации, для создания более осмысленных и организованных визуальных представлений.

Искажения восприятия в мультимодальных сетях: физика предвзятости

Динамика трансформатора исследовалась на физическом стенде, где предсказание хаотического временного ряда Лоренца на многоосцилляторной системе позволило количественно оценить предпочтения модальности посредством разности значений SHAP для само- и кросс-внимания [latex]\phi(Y) - \phi(X)[/latex], представленной направлением стрелки в диапазоне [-90°, 90°] - от полного вклада [latex]X[/latex] до [latex]Y[/latex] - при этом цвет стрелки отражает нормированную среднеквадратичную ошибку между целевым [latex]z(t)[/latex] и предсказанным значением, что продемонстрировано на примере низких ([latex]\beta_{self}, \beta_{cross} = (10^{-4}, 10^{-4})[/latex]) и высоких ([latex]\beta_{self}, \beta_{cross} = (10^{0}, 10^{0})[/latex]) уровней внимания, фокусируясь на временном интервале [latex]50 \leq t \leq 70[/latex].

Новое исследование показывает, как динамика трансформаторов влияет на предвзятость мультимодальных моделей, приводя к доминированию отдельных модальностей.

Прогнозирование задержек контейнеров: Синергия ИИ и машинного обучения

Новый подход объединяет генеративный искусственный интеллект для стандартизации данных и алгоритмы машинного обучения для повышения точности прогнозирования времени простоя контейнеров.