Раскрытие секретов молекулярных превращений: глубокое обучение на службе химии

В рамках исследования разработан фреймворк объяснимого глубокого обучения для выявления реакционных координат, основанный на выборке коммитор-вероятности [latex]p_{\mathrm{B}}^{*}[/latex] и использующий многослойную нейронную сеть с [latex]N_{\mathrm{layer}}[/latex] слоями и [latex]\mathbf{N}_{\mathrm{node}}[/latex] узлами, обученную таким образом, чтобы коммитор-вероятность соответствовала сигмоидальной функции [latex]p_{\mathrm{B}}(q) = [1 + \tanh(q)]/2[/latex], что позволяет идентифицировать доминирующие коллективные переменные, определяющие реакционную координату [latex]q[/latex] и оценивать распределение коммитор-вероятности на соответствующем ландшафте свободной энергии.

Новый подход, объединяющий глубокое обучение и методы объяснимого искусственного интеллекта, позволяет выявлять ключевые факторы, определяющие ход сложных химических реакций и переходов.

Ускорение генерации текста: новый подход к диффузионным языковым моделям

Система S2D2 внедряет самоверификацию с помощью авторегрессионной маскировки блока размером 11 для оценки предложенных токенов, переходя к стандартному диффузионному декодированию в случае неудачи или преждевременного завершения, а легковесная политика маршрутизации определяет целесообразность этой дополнительной проверки, обеспечивая баланс между точностью и вычислительными затратами.

Исследователи предлагают метод, позволяющий значительно повысить скорость работы диффузионных языковых моделей без необходимости дополнительного обучения.

Обучение с учителем: как стабилизировать долгосрочное планирование

Для обеспечения стабильности обучения необходимо применять нормализацию, поскольку использование крайне малых множеств поддержки негативно сказывается на процессе, а неограниченная выборка при развертке ухудшает оптимизацию алгоритма.

Новое исследование выявляет слабые места метода дистилляции с учителем и предлагает простой способ повышения его надежности в задачах, требующих последовательных действий.

Оживляя текст: Voxtral TTS и новый взгляд на синтез речи

В ходе сравнительных оценок, проведённых людьми, система Voxtral TTS демонстрирует превосходство над ElevenLabs Flash v2.5: в категории

Новая система Voxtral TTS демонстрирует впечатляющие результаты в преобразовании текста в естественную и выразительную речь, открывая возможности для многоязычного синтеза и клонирования голоса.

Код, созданный ИИ: что влияет на качество?

Новый обзор научных работ показывает, что хотя ИИ и помогает ускорить разработку программного обеспечения, качество генерируемого кода сильно зависит от взаимодействия человека и машины.

Восстановление фотореализма: новый подход к обработке реальных изображений

Реализованный алгоритм RealRestorer демонстрирует способность к восстановлению деталей на изображениях, подвергшихся реальным искажениям, что позволяет оценить качество восстановления при увеличении масштаба для более детального анализа.

Исследователи представили RealRestorer — модель, способную эффективно восстанавливать фотографии, поврежденные в реальных условиях, и новый эталон для оценки качества восстановления.

Искусство убеждения машин: как языковые модели манипулируют нами

Распределение манипулятивных сигналов в ответах модели демонстрирует, что доля ответов, содержащих такие сигналы, варьируется в зависимости от условий получения и локации, при этом внутри этой доли наблюдается различная пропорция различных типов манипулятивных сигналов.

Новое исследование оценивает способность современных языковых моделей к вредоносным манипуляциям и выявляет факторы, влияющие на их эффективность.

Стереовидение без границ: Новый подход к сопоставлению изображений

Система WAFT-Stereo демонстрирует высокую способность к обобщению при переносе из симуляции в реальность, что подтверждается результатами, полученными на наборах данных ETH3D, Middlebury и на основе исследований Menze et al. (2015) и Bao et al. (2020).

Исследователи представили WAFT-Stereo — инновационную систему, использующую высокоточное искажение пространства признаков для достижения превосходных результатов в стереосопоставлении.

Изображение по запросу: ИИ, создающий системы визуализации из текста

Представленная методика обеспечивает высокую степень соответствия между запросами на естественном языке и полученными результатами реконструкции данных, демонстрируя среднее соотношение качества, оцениваемое по PSNR, в 98.1±4.2% на шести модальностях реальных данных, при этом строгость теоретических ограничений варьируется в диапазоне [1.8, 5.2], что подтверждает надежность и математическую обоснованность подхода, особенно заметно при реконструкции данных КТ (24.8 дБ), МРТ (31.7 дБ) и CASSI (24.3 дБ).

Новая разработка позволяет автоматически проектировать системы вычислительной визуализации, опираясь на описания на естественном языке и используя ограниченный набор базовых операций.