Научный интеллект на пределе: новая оценка возможностей ИИ

HiSciBench представляет собой иерархический набор тестов, предназначенный для оценки научного интеллекта больших языковых моделей, охватывающий шесть дисциплин - математику, физику, химию, биологию, географию и астрономию - и структурированный в пять прогрессивных уровней сложности - от базового понимания научных фактов и разбора научной литературы до контекстуального мышления, интегративного синтеза и, наконец, творческого научного открытия, отражая тем самым полный цикл научного исследования.

Представлен HiSciBench — комплексный инструмент для оценки способности искусственного интеллекта понимать, анализировать и синтезировать научные знания в различных областях.

Считать деньги ума не дают: как нейросети справляются с бухгалтерскими задачами

Результаты оценки методом «цепочки рассуждений» в трёх примерах демонстрируют эффективность подхода к многоступенчатым вычислениям.

Новое исследование показывает, что большие языковые модели испытывают трудности с решением сложных бухгалтерских задач, несмотря на общие навыки рассуждения.

Раскрывая секреты биосинтеза: Искусственный интеллект на службе нутрицевтики

Новая система, основанная на анализе научной литературы, позволяет автоматически выявлять микроорганизмы, участвующие в производстве ценных нутрицевтических соединений.

Геометрическая точность: Новый подход к оценке состояния в фильтре Калмана

Исследование предлагает методологию валидации модифицированного фильтра Калмана на реальных данных, обеспечивающую повышенную точность оценки состояния за счет учета геометрических ограничений.

Эмоциональный интеллект ИИ: пора пересмотреть критерии

Статья предлагает новый подход к оценке эмоционального интеллекта в искусственном интеллекте, выходящий за рамки простых рейтингов и ориентированный на этическую безопасность.

Рисуйте свои мечты: DreamOmni3 для редактирования и генерации изображений

Новая модель DreamOmni3 позволяет пользователям управлять процессом создания и редактирования изображений, используя простые наброски и текстовые подсказки.

Квантовые модели для моделирования потоков: новый взгляд на сжатие данных

Визуализация пространства скрытых состояний, полученного с помощью VQ-VAE и представленная с помощью t-SNE, демонстрирует структуру латентного кодекса, позволяющую эффективно кодировать и представлять данные в сжатом виде.

Исследователи изучают возможности применения квантовых генеративных моделей для обучения и сэмплирования сжатых представлений данных гидродинамики, открывая потенциал для более эффективных симуляций.

Хирургический робот: обучение на основе видео и виртуальной реальности

Модель SurgWorld предварительно обучается на обширном наборе хирургических видео с текстовыми аннотациями, используя Cosmos 2.5, а затем точно настраивается и дополняется обратной динамической моделью (IDM) для конкретного робота и задачи, после чего генерируются синтетические видеоролики и псевдокинематика, используемые совместно с реальными данными для обучения модели хирургического VLA.

Новая разработка позволяет обучать хирургических роботов сложным манипуляциям, используя синтетические данные и моделирование реального мира.

Ожившие истории: Как ИИ создает аудиокниги нового поколения

В рамках AI4Reading процесс генерации интерпретационных скриптов осуществляется посредством многоагентного взаимодействия, позволяя системе не просто строить, а развивать понимание текста, подобно сложной экосистеме.

Новая система AI4Reading использует возможности искусственного интеллекта для автоматической генерации интерпретативных аудиокниг, открывая новые горизонты в создании и распространении контента.