Текст в Изображение: Новый Подход к Визуальному Редактированию

Предложенная схема UM-Text обеспечивает многоязычную генерацию и редактирование визуального текста, используя интегрированный мультимодальный кодировщик и маски, полученные из предсказанной разметки UM-Designer, что позволяет одной модели поддерживать широкий спектр задач, определяемых инструкциями.

Исследователи представили UM-Text — модель, объединяющую возможности понимания изображений и обработки текста для точного и гибкого редактирования визуального контента по текстовым запросам.

Визуальный поиск и генерация: новый эталон для сложных задач

Набор данных ViDoRe V3 демонстрирует сложность реальных сценариев поиска информации, охватывая разнообразные типы запросов и визуально насыщенные форматы документов из различных областей.

Исследователи представили ViDoRe V3 — комплексную платформу для оценки систем, объединяющих поиск информации и генерацию текста на основе визуальных документов.

Раскрывая скрытые мотивы: как научить ИИ понимать чужие намерения

В рамках исследования взаимодействия многоагентных больших языковых моделей выявляется пробел в традиционных методах оценки логического вывода, связанный с необходимостью вывода скрытых намерений, выходящих за рамки поверхностных утверждений; для решения этой задачи предложен метод атрибутивной логической оценки (Att-NLI) - двухэтапная абдуктивно-дедуктивная система, основанная на теории атрибуции и включающая выбор намерения с последующей проверкой вывода, реализованная посредством верифицируемой социальной дедуктивной игры Undercover-V, позволяющей эмпирически тестировать атрибуцию скрытых намерений.

Новое исследование предлагает метод оценки способности языковых моделей к выявлению намерений других агентов в сложных социальных взаимодействиях.

Восстановление по выборке: искусство приближения функций

В статье рассматриваются современные методы восстановления функций на основе дискретных выборок, стремящиеся к достижению точности, сравнимой с оптимальными аппроксимациями.

Замена персонажей в видео: новый подход без сложных настроек

MoCha демонстрирует превосходство над существующими методами, обеспечивая более согласованную анимацию персонажей, повышенную выразительность лиц и реалистичные эффекты освещения.

Исследователи представили MoCha — систему, позволяющую реалистично заменять персонажей в видео, используя лишь маску одного кадра и современные методы машинного обучения.

Искусственный интеллект и экспертные решения: как меняется принятие решений в сети

Новое исследование показывает, что при оценке информации в сложных областях, пользователи не делают принципиальной разницы между текстами, созданными искусственным интеллектом, и экспертным контентом, написанным человеком.

Ускорение квантохимических расчётов: новый подход к плотностной аппроксимации

Применение адаптивной точности к вычислениям дискретного преобразования Фурье (ДПФ) демонстрирует ускорение по сравнению со стандартным алгоритмом FP64, при этом все этапы, включая вычисление интегралов [latex](i_j|p)[/latex] и построение тензора [latex]B_{ij}^{q}[/latex], учтены; отсутствие данных в некоторых точках обусловлено нехваткой памяти GPU для проведения соответствующих вычислений.

Исследователи разработали адаптивный алгоритм, использующий 8-битные целочисленные вычисления на AI-ускорителях для значительного повышения скорости вычислений плотностной аппроксимации.

Разумная Память: Как Мозг Управляет Сложными Рассуждениями

MemoBrain асинхронно преобразует мимолётные цепочки рассуждений в компактные, взаимосвязанные блоки памяти, формируя глобальную память рассуждений, и, достигнув лимита памяти, конструирует управляемый контекст путём сжатия или удаления устаревшей информации, обеспечивая тем самым последовательное мышление на большом горизонте.

Новая модель MemoBrain предлагает принципиально новый подход к организации памяти для искусственного интеллекта, позволяя агентам последовательно и эффективно решать многоэтапные задачи.

Материалы будущего: Платформа для интеллектуального дизайна и открытий

Данные о материалах, полученные из разнородных источников - экспериментальных измерений, симуляций и структурной информации - интегрируются посредством DataScribe, отслеживающего их происхождение и взаимосвязи, что позволяет создавать структурированные таблицы и онтологические графы знаний, необходимые для построения цифрового двойника - виртуальной модели, отражающей реальную или гипотетическую материальную систему, в которой физические образцы идентифицируются по штрих-кодам и автоматически включаются в рабочий процесс, связывая лабораторные процедуры с моделями, управляемыми искусственным интеллектом.

Новая AI-платформа DataScribe объединяет данные, рабочие процессы и оптимизацию для ускорения разработки материалов с использованием автоматизированных экспериментов.