Перевод нового поколения: TranslateGemma
Новая модель TranslateGemma значительно улучшает качество и эффективность машинного перевода на нескольких языках, сохраняя возможности работы с мультимодальными данными.
Новая модель TranslateGemma значительно улучшает качество и эффективность машинного перевода на нескольких языках, сохраняя возможности работы с мультимодальными данными.

Исследователи разработали систему SkinFlow, оптимизирующую визуальное представление данных для повышения точности и скорости дерматологической диагностики.
Обзор посвящен растущей роли искусственного интеллекта и машинного обучения в значительном ускорении процесса открытия и применения новых материалов.

Новый метод позволяет значительно улучшить качество и скорость генерации текста на основе извлеченных данных, используя параллельную обработку контекста.
Новая формальная система позволяет создавать надежные и предсказуемые автономные ИИ, эффективно управляя их ресурсами и взаимодействием.

Новая модель VLingNav позволяет роботам ориентироваться в сложных пространствах, используя визуальные подсказки, лингвистическую память и способность к адаптивному планированию.
В статье рассматривается вопрос подготовки педагогов к эффективному и осознанному использованию инструментов искусственного интеллекта в учебном процессе.

Исследователи представили UM-Text — модель, объединяющую возможности понимания изображений и обработки текста для точного и гибкого редактирования визуального контента по текстовым запросам.
![Исследование демонстрирует, что внедрение структурированного подхода к поиску, в отличие от неструктурированного ([latex]Search-o1[/latex]), и динамического исследования пространства состояний ([latex]GraphSearch[/latex]) позволяет значительно повысить эффективность обучения на графах по сравнению с методами, использующими статическое внедрение информации о соседях ([latex]GraphICL[/latex]).](https://arxiv.org/html/2601.08621v1/figures/motivation.png)
Новый подход позволяет моделям рассуждать над графовыми данными, извлекая знания даже без предварительного обучения.

Исследователи представили ViDoRe V3 — комплексную платформу для оценки систем, объединяющих поиск информации и генерацию текста на основе визуальных документов.