Поиск неисправностей в коде: новый подход на основе причинно-следственных связей

Графолокатор предоставляет комплексный подход к локализации проблем, позволяя выявлять и анализировать источники сбоев в системе.

Исследователи разработали метод, использующий анализ графов причинно-следственных связей для более точной локализации проблем в больших кодовых базах.

Научный интеллект на пределе: новая оценка возможностей ИИ

HiSciBench представляет собой иерархический набор тестов, предназначенный для оценки научного интеллекта больших языковых моделей, охватывающий шесть дисциплин - математику, физику, химию, биологию, географию и астрономию - и структурированный в пять прогрессивных уровней сложности - от базового понимания научных фактов и разбора научной литературы до контекстуального мышления, интегративного синтеза и, наконец, творческого научного открытия, отражая тем самым полный цикл научного исследования.

Представлен HiSciBench — комплексный инструмент для оценки способности искусственного интеллекта понимать, анализировать и синтезировать научные знания в различных областях.

Считать деньги ума не дают: как нейросети справляются с бухгалтерскими задачами

Результаты оценки методом «цепочки рассуждений» в трёх примерах демонстрируют эффективность подхода к многоступенчатым вычислениям.

Новое исследование показывает, что большие языковые модели испытывают трудности с решением сложных бухгалтерских задач, несмотря на общие навыки рассуждения.

Раскрывая секреты биосинтеза: Искусственный интеллект на службе нутрицевтики

Новая система, основанная на анализе научной литературы, позволяет автоматически выявлять микроорганизмы, участвующие в производстве ценных нутрицевтических соединений.

Рисуйте свои мечты: DreamOmni3 для редактирования и генерации изображений

Новая модель DreamOmni3 позволяет пользователям управлять процессом создания и редактирования изображений, используя простые наброски и текстовые подсказки.

Эмоциональный интеллект ИИ: пора пересмотреть критерии

Статья предлагает новый подход к оценке эмоционального интеллекта в искусственном интеллекте, выходящий за рамки простых рейтингов и ориентированный на этическую безопасность.

Хирургический робот: обучение на основе видео и виртуальной реальности

Модель SurgWorld предварительно обучается на обширном наборе хирургических видео с текстовыми аннотациями, используя Cosmos 2.5, а затем точно настраивается и дополняется обратной динамической моделью (IDM) для конкретного робота и задачи, после чего генерируются синтетические видеоролики и псевдокинематика, используемые совместно с реальными данными для обучения модели хирургического VLA.

Новая разработка позволяет обучать хирургических роботов сложным манипуляциям, используя синтетические данные и моделирование реального мира.

Ожившие истории: Как ИИ создает аудиокниги нового поколения

В рамках AI4Reading процесс генерации интерпретационных скриптов осуществляется посредством многоагентного взаимодействия, позволяя системе не просто строить, а развивать понимание текста, подобно сложной экосистеме.

Новая система AI4Reading использует возможности искусственного интеллекта для автоматической генерации интерпретативных аудиокниг, открывая новые горизонты в создании и распространении контента.

Видео в сети: новый тест для искусственного интеллекта

Набор данных Video-BrowseComp представляет собой эталон для оценки возможностей систем в задачах поиска по видео, охватывающий три уровня сложности - от прямого извлечения информации до рассуждений на основе данных из разных источников, что позволяет комплексно протестировать способность машин к пониманию видеоконтента.

Исследователи представили комплексную платформу для оценки способности ИИ-агентов проводить глубокий анализ видеоконтента в интернете и использовать полученные знания для решения сложных задач.

Искусственный интеллект как соавтор: самообучающиеся системы для научных исследований

Исследование демонстрирует подход к автоматическому созданию исследовательских планов, где модели обучаются генерировать стратегии достижения целей, а оценка этих планов осуществляется на основе рубрик, извлеченных из существующих научных работ с помощью специализированных моделей выбора и формирования, при этом итоговая награда за обучение и оценка качества плана формируются на основе доли выполненных критериев рубрики, соответствующих общим рекомендациям.

Новая система ResearchPlanGen способна автоматически генерировать обоснованные планы научных исследований, используя самообучение и оценку по заданным критериям.