Видео будущего: Как научить роботов видеть мир реалистично

Новое исследование представляет комплексный подход к оценке и улучшению генерации видео для роботов, способный значительно повысить их способность взаимодействовать с окружающим миром.

Новое исследование представляет комплексный подход к оценке и улучшению генерации видео для роботов, способный значительно повысить их способность взаимодействовать с окружающим миром.

Новое исследование посвящено методам квантования, позволяющим значительно сократить размер многомодальных моделей, без существенной потери качества.
![При обучении на данных, содержащих запросы, нарушающие приватность, модели-помощники демонстрируют существенное снижение приватности агента и устойчивости памяти (до 99% для [latex]gpt-4o-mini[/latex]), в то время как контрольные модели сохраняют эти параметры, подчеркивая уязвимость полезных моделей к утечке информации.](https://arxiv.org/html/2601.15220v1/x2.png)
Новое исследование показывает, что даже незначительная донастройка языковых моделей может привести к неожиданной потере способности защищать конфиденциальную информацию.
В статье исследуется потенциал квантовых вычислений для повышения эффективности алгоритмов машинного обучения и достижения квантового преимущества.
![Основанный на вероятностной природе p-битов, алгоритм имитации отжига [latex]\tilde{1}[/latex] отображает комбинационную задачу оптимизации на модель Изинга, в которой каждый p-бит подвержен смещению <i>h</i> и взаимодействует с другими битами посредством весов <i>J</i>, стремясь к минимизации энергии [latex]H_{min}[/latex] и, следовательно, к нахождению решения исходной задачи.](https://arxiv.org/html/2601.14476v1/x1.png)
Новое исследование демонстрирует, как ускорить алгоритмы имитации отжига, используя вероятностные биты и графические процессоры, и как компенсировать влияние вариативности в современных микросхемах.
![Исследование демонстрирует, что функция [latex]sold(d)[/latex] для элемента [latex]I\in AS(P_1)[/latex] определяет поведение системы в зависимости от времени, раскрывая её эволюцию и внутреннюю динамику.](https://arxiv.org/html/2601.14764v1/figures/xasp2.png)
В статье представлен обзор существующих методов интерпретации работы систем Answer Set Programming, позволяющих понять, почему программа приняла то или иное решение.

Новое исследование представляет WebSeek — расширение для браузера, которое объединяет возможности человека и искусственного интеллекта для более эффективного анализа данных.
![Различные вычислительные модели клеток, от центрированных ([latex]CBM[/latex]) и субклеточных ([latex]SEM[/latex]) до фазово-полевых ([latex]PFM[/latex]), клеточных горшков ([latex]CPM[/latex]), вершинных ([latex]VM[/latex]) и деформируемых ([latex]DCM[/latex]), используют общие принципы представления клеток как вычислительных узлов, связанных внутри- и межклеточными взаимодействиями, демонстрируя универсальный подход к моделированию клеточной динамики и механики.](https://arxiv.org/html/2601.15273v1/Figures/Fig0.png)
Обзор демонстрирует, как высокоточные модели на основе клеточных агентов открывают новые возможности для понимания сложных биологических процессов и разработки биоинженерных решений.

Исследователи представляют GutenOCR — семейство моделей, объединяющих зрение и язык для более точного и структурированного понимания документов.
Исследователи представили SearchGym — симуляционную среду, позволяющую создавать и обучать поисковых агентов с высокой эффективностью и точностью.