От науки к технологиям: как искусственный интеллект отслеживает поток знаний

На представленных моделях демонстрируется сравнительный анализ, позволяющий оценить различные подходы и выявить их сильные и слабые стороны в контексте поставленной задачи.

Новая модель на основе глубокого обучения позволяет выявлять скрытые связи между научными публикациями и патентами, выходя за рамки стандартного анализа цитирования.

Визуальное мышление: новый подход с помощью диффузионных моделей

В DiffThinker реализован механизм параллельного рассуждения, позволяющий модели одновременно исследовать множество потенциальных путей решения, а затем итеративно уточнять их, приводя к единой корректной траектории.

Исследователи предлагают принципиально новый способ решения задач мультимодального рассуждения, переходя от текстовых подсказок к генерации изображений.

От снимка к заключению: Искусственный интеллект в расшифровке рентгеновских снимков

Новый подход объединяет возможности компьютерного зрения и больших языковых моделей для автоматического формирования клинически понятных заключений по рентгенограммам грудной клетки.

Дискретность и языковые модели: где теряется смысл?

Диффузионные языковые модели (DLM) превосходят авторегрессионные (AR) модели благодаря своей способности к параллельной генерации и более эффективному моделированию сложных распределений вероятностей, что позволяет достичь превосходных результатов в задачах генерации текста и преодолеть ограничения последовательной обработки, свойственные AR-моделям.

Новое исследование анализирует, как принципы диффузионных моделей, успешно применяемые в генерации изображений, сталкиваются с особенностями дискретной структуры и зависимостей в естественном языке.

Искусственный интеллект в школе: взгляд бразильских учителей

Основываясь на ответах трехсот сорока шести респондентов, исследование выявило многогранное восприятие искусственного интеллекта в образовании, охватывающее уровень осведомленности участников, их представления о потенциальных преимуществах и степень вовлеченности в соответствующие технологии.

Новое исследование показывает, как бразильские преподаватели видят перспективы и трудности внедрения искусственного интеллекта в образовательный процесс.

Восстановление 3D-сцен по обрывочным данным: новый подход к детализации

Геометрически-ориентированная многовидовая диффузия позволяет расширять поле зрения изображения путём кодирования разреженных входных видов в латентные представления и их комбинирования с условиями, включающими в себя эмбеддинги лучей Плюккера [latex]\mathcal{P}\_{r}[/latex] для входных видов и целевого вида с расширенным полем зрения [latex]\mathcal{P}\_{t}^{\*}[/latex], а также оригинальную и дополненную Каноническую Карту Координат (CCM) и RGB, что обеспечивает как геометрические, так и визуальные подсказки для диффузионной модели, направляя процесс шумоподавления посредством смешивания латентных масок на нескольких временных шагах [latex]t\_{1},t\_{2},...,t\_{N}[/latex] с прогрессивным расширением и ресемплированием шума.

Исследователи разработали метод, позволяющий создавать полные 3D-модели объектов и сцен, даже если исходные данные содержат лишь небольшое количество видов.

Батарея под контролем: Искусственный интеллект на страже долговечности

В рамках разработанной архитектуры BatteryAgent, состоящей из слоёв физического восприятия, обнаружения и атрибуции (с использованием GBDT и SHAP для классификации неисправностей и анализа вклада признаков) и логического вывода, большая языковая модель формирует диагностические отчёты с анализом первопричин и рекомендациями по техническому обслуживанию посредством цифро-семантического моста.

Новая система диагностики объединяет физические модели аккумуляторов и возможности больших языковых моделей для точного определения неисправностей.