Искусственный интеллект: рождение творчества из ограничений

Новое исследование показывает, что творческие способности ИИ возникают не как запрограммированная функция, а как побочный эффект взаимодействия узкоспециализированных моделей с окружающей средой.

Изображения на ладони: Новая эра генерации контента для мобильных устройств

Демонстрация генерации изображений непосредственно на устройстве, выполненная на iPhone 16 Pro Max, показывает, что даже компактная модель с 0.4 миллиардами параметров способна создавать визуальный контент, в то время как полноразмерная версия, оптимизированная 4-битной квантизацией, обеспечивает еще более детализированные результаты, раскрывая возможности локального исполнения ресурсоемких задач.

Исследователи представили архитектуру Diffusion Transformer, позволяющую создавать высококачественные изображения непосредственно на смартфонах и других устройствах с ограниченными ресурсами.

Видео, Рассуждения и Поиск: Новый Эталон для Интеллекта в Видео

На основе статистического анализа видеоданных VideoDR установлено, что распределение видео по категориям, длина вопросов и продолжительность видео демонстрируют разнообразие и сложность набора данных, что представляет собой важную характеристику для оценки и совершенствования моделей обработки видеовопросов.

Исследователи представляют VideoDR — платформу для оценки способности моделей понимать видео, искать информацию в сети и находить ответы на сложные вопросы.

Поиск по древу возможностей с учетом законов физики: новый подход к оптимизации

Поиск по дереву Монте-Карло (MCTS) демонстрирует широкую применимость, охватывая как стратегическое планирование в играх, так и задачи оптимизации и проектирования в реальном мире, при этом большинство существующих реализаций ориентированы на дискретные пространства действий.

Исследователи разработали инновационный алгоритм, сочетающий методы Монте-Карло и знания о физических принципах, для эффективного решения сложных задач в области проектирования и оптимизации.

Химические процессы: от идеи до симуляции за считанные часы

Разработка химических процессов традиционно требует значительных ручных усилий на всех этапах, в то время как существующие автоматизированные методы ограничиваются различными графическими представлениями, тогда как предлагаемый подход обеспечивает сквозную автоматизацию и охватывает различные измерения, выходя за рамки стандартных диаграмм технологических процессов [latex] (Douglas1988) [/latex] и используя гиперграфы с параметрическими аннотациями [latex] (Mannet al.2024) [/latex].

Новый подход объединяет возможности больших языковых моделей и многоагентных систем для автоматического создания рабочих химических процессов по текстовому описанию.

Разумный агент: Настройка поведения ИИ для эффективной работы с инструментами

Саморазвивающийся цикл данных и структура обучения для калибровки поведения совместно формируют основу ET-Agent, обеспечивая итеративное улучшение и адаптацию агента к изменяющимся условиям.

Новая методика позволяет обучать ИИ-агентов, использующих внешние инструменты, достигать оптимального баланса между точностью и скоростью выполнения задач.

Электрические поля в мире молекул: точные расчеты и новые возможности

В статье представлен всесторонний анализ электрических градиентов полей в молекулах и твердых телах, охватывающий современные вычислительные методы и факторы, влияющие на точность расчетов.