Искривление мышления: Как разнообразие идей делает ИИ-исследователей эффективнее

Разнообразие подходов к решению задач, выявленное в ходе анализа платформы MLE-bench, коррелирует с успешностью траектории агента, что подтверждается контролируемым экспериментом, представленным в разделе 4.2.

Новое исследование показывает, что расширение спектра подходов в работе ИИ-агентов значительно повышает их производительность в сложных задачах машинного обучения.

Распознавание патологий на рентгене грудной клетки: новый подход с помощью текстовых инструкций

Исследователи разработали метод сегментации поражений на рентгеновских снимках грудной клетки, использующий возможности языковых моделей и автоматически сгенерированный масштабный набор данных.

Видео как ключ к логике: новый тест для искусственного интеллекта

На графиках, демонстрирующих производительность моделей на лабиринтах неправильной формы и в поле с ловушками различной сложности, наблюдается, что средние показатели VLM и Видео Модели (обозначены пунктирными и точечными линиями соответственно) отличаются от базовых значений, представленных сплошными кривыми, что указывает на их способность адаптироваться к изменяющимся условиям.

Исследователи представили VR-Bench — эталонный набор задач, позволяющий оценить способность видеомоделей решать пространственные головоломки и демонстрировать логическое мышление.

Визуальный поиск в мире природы: новый инструмент для экологов

Инструмент INQUIRE-Search предоставляет экологам интуитивно понятный интерфейс для запроса к сотням миллионов изображений дикой природы, позволяя, например, быстро находить и верифицировать наблюдения, относящиеся к конкретному виду, такому как американский дрозд, питающийся, с применением фильтров по времени и другим параметрам.

Представлена система INQUIRE-Search, позволяющая эффективно исследовать огромные базы данных экологических изображений и находить ценную информацию о биоразнообразии.

Музыка по вкусу: Как научить ИИ создавать музыку, которая нравится людям

Оптимизация моделей генерации музыки достигается двумя основными подходами: оптимизацией в процессе обучения, направленной на совершенствование моделей на этапе разработки, и адаптацией в процессе генерации, позволяющей корректировать результат без переобучения, оба из которых призваны преодолеть разрыв между вероятностным обучением и субъективными музыкальными предпочтениями.

В новой статье рассматриваются методы и трудности согласования генеративных моделей музыки с человеческими предпочтениями, открывая путь к более творческим и приятным музыкальным произведениям.

Кандинский 5.0: Искусство генерации изображений и видео

Семейство моделей Kandinsky 5.0 демонстрирует возможности масштабирования и адаптации архитектуры для генерации изображений, обеспечивая баланс между вычислительной сложностью и качеством результатов.

Новое семейство моделей Кандинский 5.0 открывает новые возможности в создании высококачественного визуального контента, от статичных изображений до динамических видеороликов.

Искусственный интеллект в науке: новый взгляд на авторов и рецензентов

Конференция Agents4Science продемонстрировала возможности использования ИИ-агентов для создания и оценки научных работ, выявив как перспективные направления, так и существующие ограничения.

Научные открытия на автопилоте: как ИИ учится проводить исследования самостоятельно

В процессе самокоррекции, визуальная языковая модель выступает в роли эксперта, оценивающего графики по заранее заданным критериям и направляя агентов-исправителей для итеративной доработки - в частности, первоначальная попытка построить спектр мощности TT CMB, содержавшая ошибку масштабирования $D_\ell^{TT}$, была успешно скорректирована после единственного цикла обратной связи и привела к результатам, соответствующим предсказаниям Planck 2018 ΛCDM.

Новый подход объединяет возможности компьютерного зрения и обработки естественного языка для создания самообучающихся систем, способных самостоятельно проводить научные эксперименты и анализировать результаты.