Роботы, которые понимают время: Новый подход к управлению манипуляторами

Система VLA-4D, состоящая из двух этапов, кодирует трехмерные позиции и одномерное время в четырехмерные пространственно-временные вложения, объединяя их с визуальными признаками посредством механизма перекрестного внимания, а затем расширяет параметры действий в пространственно-временную область для согласования мультимодальных представлений и прогнозирования действий робота с помощью большой языковой модели.

Исследователи разработали модель VLA-4D, позволяющую роботам более эффективно планировать и выполнять сложные манипуляции, учитывая не только пространство, но и время.

Текстуры миров: Создаем интерактивные 3D-ландшафты из слов

Мир, воссозданный моделью WorldGen, демонстрирует значительно более высокую детализацию по сравнению с результатами современных методов реконструкции трёхмерных сцен из изображений, что указывает на качественно новый уровень реализма и сложности генерируемых объектов.

Новая система WorldGen позволяет преобразовывать текстовые описания в детализированные и проходимые трехмерные миры, открывая новые горизонты для игровых движков и виртуальной реальности.

Искусственный интеллект и звук: Новые горизонты музыкальной педагогики

Статья исследует новаторский подход к обучению искусственному интеллекту в музыке, акцентируя внимание на критическом осмыслении и творческом эксперименте.

Искусственный интеллект и наука: новая эра сотрудничества

Система OmniScientist представляет собой развивающуюся экосистему, в которой архитектурные решения формируют будущее поведение, а каждый выбор влияет на устойчивость к потенциальным сбоям и определяет возможности системы в целом.

В статье представлена концепция комплексной системы, объединяющей возможности искусственного интеллекта и традиционную научную инфраструктуру для совершения открытий и проведения экспериментов.

Стабилизация обучения языковых моделей: новый подход к контролю энтропии

В ходе эксперимента, демонстрирующего принцип «plug-and-play», EntroPIC стабилизирует энтропию на поздних стадиях обучения, что приводит к повышению производительности модели.

Исследователи предлагают инновационный метод динамической регуляции энтропии в процессе обучения больших языковых моделей, обеспечивающий более стабильные и предсказуемые результаты.

Робот учится на собственных успехах: новый подход к обучению с подкреплением

В рамках обучения с подкреплением для задач «Видение-Язык-Действие» предложен алгоритм SRPO, использующий успешные траектории внутри пакета данных и латентные представления мира для построения вознаграждений, отражающих прогресс, что позволяет эффективно использовать неудачные попытки и обеспечивает превосходную производительность, эффективность обучения, обобщающую способность и результаты в реальных условиях, в отличие от существующих методов, полагающихся на разреженные вознаграждения или требующих трудоемкой ручной разработки моделей вознаграждений.

Исследователи разработали метод, позволяющий роботам использовать опыт успешного выполнения задач для более эффективного обучения и улучшения навыков.