3D-Сцены без обучения: новый взгляд на понимание пространства
![Разработанная система OpenVoxel строит воксельное групповое поле [latex]\mathcal{F}_{1:N}[/latex] на основе сегментационных масок [latex]M_{1:K}[/latex], полученных из предварительно обученной разреженной воксельной модели [latex]V_{1:N}[/latex] и соответствующих камерных позиций [latex]\xi_{1:K}[/latex], что позволяет рендерить изображения и маски для всех групп, конструировать карту сцены [latex]SS[/latex], кодирующую их положение и подписи, и, в конечном итоге, выполнять сложные задачи сегментации, такие как сегментация по текстовому запросу, посредством уточнения запроса и поиска по тексту в карте [latex]SS[/latex].](https://arxiv.org/html/2601.09575v1/x2.png)
Исследователи представили OpenVoxel — систему, способную группировать и описывать трехмерные сцены, используя только воксельную геометрию и возможности больших языковых моделей.
![Разработанная система OpenVoxel строит воксельное групповое поле [latex]\mathcal{F}_{1:N}[/latex] на основе сегментационных масок [latex]M_{1:K}[/latex], полученных из предварительно обученной разреженной воксельной модели [latex]V_{1:N}[/latex] и соответствующих камерных позиций [latex]\xi_{1:K}[/latex], что позволяет рендерить изображения и маски для всех групп, конструировать карту сцены [latex]SS[/latex], кодирующую их положение и подписи, и, в конечном итоге, выполнять сложные задачи сегментации, такие как сегментация по текстовому запросу, посредством уточнения запроса и поиска по тексту в карте [latex]SS[/latex].](https://arxiv.org/html/2601.09575v1/x2.png)
Исследователи представили OpenVoxel — систему, способную группировать и описывать трехмерные сцены, используя только воксельную геометрию и возможности больших языковых моделей.
![Нейронная сеть с одним скрытым слоем, функционирующая как регрессор [latex]h(\cdot)[/latex], используется для сведения задачи 3-SAT к задаче WACHTER-CFE (определение 2), при этом дизъюнкция [latex]\neg x\_{1}\vee x\_{2}\vee\neg x\_{3}[/latex] представляет собой клаузу в КНФ-формуле, определяющей экземпляр 3-SAT, а связи без указанного веса в схеме имеют вес 1.](https://arxiv.org/html/2601.09455v1/x1.png)
Новое исследование показывает, что генерация понятных объяснений для моделей машинного обучения, основанных на изменении входных данных, может быть вычислительно непосильной задачей.

Исследователи предлагают единую генеративную модель, способную объединить различные визуальные навыки и демонстрировать впечатляющие результаты в решении задач, даже без обширного обучения.

Новая система объединяет данные спектроскопии Рамана и научную литературу, чтобы помочь исследователям быстрее и эффективнее анализировать информацию.

Новая архитектура OpenDecoder позволяет учитывать качество извлеченных документов при генерации текста, делая ответы искусственного интеллекта более точными и устойчивыми к шуму.
![В рамках предложенной структуры EvoFSM, исследовательский процесс формализуется как динамический конечный автомат, инициализируемый предыдущим опытом, а затем прецизионно оптимизируется посредством атомарных операций, воздействующих как на операторы навыков [latex]\mathcal{O}\_{skill}[/latex], так и на операторы потока [latex]\mathcal{O}\_{flow}[/latex] на основе обратной связи от критика, при этом успешные и неудачные траектории дистиллируются в опыт, обеспечивая непрерывное обучение и ускорение при решении новых задач.](https://arxiv.org/html/2601.09465v1/x2.png)
Представлена система, позволяющая агентам на основе больших языковых моделей самостоятельно развиваться и оптимизировать свои навыки для проведения более эффективных и глубоких исследований.

Исследователи представляют AI-NativeBench — комплексную платформу для глубокого анализа работы систем, управляемых большими языковыми моделями.
Новый подход позволяет Kubernetes более эффективно управлять задачами, интерпретируя естественный язык в инструкциях по планированию.

Исследователи представили комплексную методику оценки способности больших языковых моделей к научному мышлению, основанному на извлечении и применении знаний из памяти.

Новая система DeepResearchEval позволяет комплексно оценивать качество и достоверность отчетов, созданных интеллектуальными агентами, расширяя возможности автоматизированного анализа данных.