Химическое мышление машин: новый подход к обучению

Многоступенчатый процесс обучения языковой модели для химического анализа включает предварительное обучение на специализированном корпусе, содержащем как обычный текст, так и информацию о соединениях и синтезе, последующую контролируемую тонкую настройку для понимания молекулярных структур, ответов на вопросы с учетом структуры и логических цепочек рассуждений, а также дальнейшую специализацию с использованием обучения с подкреплением на основе экспертной оценки или контролируемой тонкой настройки, ориентированной на стиль рассуждений, что позволяет итеративно улучшать модель для достижения более точного химического анализа.

Исследование демонстрирует, как целенаправленное обучение на научных данных позволяет улучшить способность искусственного интеллекта решать сложные химические задачи.

Архитектурная эрудиция под вопросом: как нейросети «угадывают» возраст зданий

Архитектура YearCLIP извлекает признаки фасада изображения размером 224×224 с помощью энкодера [latex] f_{v}(CLIP) [/latex], объединяя их с GPS-вложением, полученным из энкодера местоположения [latex] f_{l}(RFF + MLP) [/latex] посредством обучаемой нулевой свертки, в то время как параллельные текстовые ветви кодируют семь классов грубого стиля и набор рассуждений, описывающих крыши, стены и высоту, все эти замороженные энкодеры питают обучаемый регрессор [latex] g(⋅) [/latex], выполняющий грубую к тонкой ординальную регрессию для определения года постройки (в данном случае 1687) и выбора наиболее подходящих стилей и токенов рассуждений, генерируя понятное обоснование.

Новое исследование выявляет, что современные модели, связывающие изображения и текст, часто полагаются на запоминание популярных достопримечательностей, а не на понимание архитектурных стилей и особенностей.

Гравитация предсказана: Сравнение новых методов моделирования

Результаты применения нейронных обыкновенных дифференциальных уравнений (Neural ODE) для первого случая (100% обучающей выборки) демонстрируют устойчивость к различным уровням шума при анализе данных для первого тела.

Исследование показывает, как современные алгоритмы машинного обучения позволяют точнее прогнозировать движение множества взаимодействующих гравитационных объектов.

Ускорение генеративных моделей: новый подход к вычислению матричной экспоненты

Исследование демонстрирует, что предложенный метод вычисления экспоненты матрицы ([latex] expm\_flow\_sastre [/latex]) превосходит оригинальный ([latex] expm\_flow [/latex]) по времени выполнения для матриц различного размера ([latex] n \in \{2,4,8,16,32,64,128,256,512,1024\} [/latex]), особенно заметно при обработке как отдельных матриц ([latex] n \times n [/latex]), так и тензоров размера ([latex] n \times 16 \times 16 [/latex]).

Исследователи предлагают оптимизированный алгоритм на основе разложения в ряд Тейлора, значительно повышающий эффективность вычислений в генеративных моделях потоков.

Видео как диалог: обучение моделей понимать живой поток

Новое исследование представляет Streamo — модель, способную обрабатывать видео в реальном времени и взаимодействовать с ним как с непрерывным потоком инструкций.

Искусственный интеллект на службе экономики: как растут доходы

Новое исследование показывает, что совершенствование систем искусственного интеллекта напрямую связано с увеличением производительности труда в консалтинге, анализе данных и управлении.

Видео по заказу: Новый подход к генерации видеороликов

Модель DreaMontage позволяет создавать длинные видеоролики по одному запросу, управляемые произвольными ключевыми кадрами или видеоклипами, точно привязанными ко временным меткам.

Исследователи представили DreaMontage — систему, способную создавать длинные видеоролики из произвольных промежуточных изображений или видео, открывая новые возможности для редактирования и синтеза видеоконтента.