Самообучающийся бизнес: Искусственный интеллект на службе у гибкости

Новая система AUTOBUS объединяет возможности больших языковых моделей и логического программирования для автоматизации бизнес-процессов и ускорения выхода продуктов на рынок.

Сплетение логики и нейросетей: новый подход к искусственному интеллекту

Исследователи предлагают унифицированную формальную систему для объединения преимуществ нейронных сетей, символьной логики и вероятностных моделей.

Код, рожденный диффузией: новая эра генерации программ

Модель Stable-DiffCoder-8B-Instruct демонстрирует выдающиеся результаты в бенчмарках, подтверждая свою эффективность в задачах генерации кода и решения инструкций.

Исследователи представили Stable-DiffCoder, модель, использующую принципы диффузии для создания кода, демонстрирующую впечатляющие результаты среди моделей аналогичного масштаба.

Физика и логика: новый подход к автоматическому доказательству теорем

В рамках разработки системы автоматической проверки физических утверждений, обучающий набор данных формируется из 5541 утверждения, полученных из PhysLean и сгенерированных моделью Claude-4.5-Sonnet, после чего, с использованием алгоритма GRPO, происходит обучение базовой модели, оцениваемой по корректности доказательств, предоставляемых системой Lean.

Исследователи разработали систему, способную автоматически доказывать физические и математические теоремы, используя возможности больших языковых моделей и обучение с подкреплением.

Диалог с рецензентами: Новый подход к ответам на критику в научных статьях

Система RebuttalAgent, получив научную статью и отзывы рецензентов, структурирует входные данные, извлекая конкретные замечания и создавая контекст для поиска доказательств, включая релевантную внешнюю литературу, а затем формирует последовательный и аргументированный план ответа, который может быть дополнен автором и преобразован в официальный ответ, обеспечивая согласованность и точность изложения.

Исследователи представили систему, помогающую авторам структурированно отвечать на замечания рецензентов, повышая качество и обоснованность аргументов.

Из хаоса данных – к чёткой медицинской информации

Структурная сложность научных PDF-документов представляет собой значительный вызов для автоматизированного извлечения доказательств, поскольку неоднородность форматирования и отсутствие семантической разметки затрудняют надежное определение и извлечение релевантной информации.

Новая система позволяет автоматически извлекать структурированные данные из научных PDF-документов, значительно облегчая процесс синтеза доказательной базы в медицине.

Искусственный интеллект в роли исследователя: новый критерий оценки

MMDR-Bench оценивает возможности глубокого обучения в мультимодальных исследованиях как на интегрированном, так и на атомарном уровнях, позволяя комплексно оценить производительность систем.

Представлен комплексный инструмент для проверки способности ИИ-агентов проводить глубокий анализ информации из различных источников и формировать достоверные отчеты.

Молекулярный интеллект: проверка химического мышления

Новый тест MolecularIQ позволяет оценить способность современных моделей искусственного интеллекта рассуждать о структуре молекул и выявляет пробелы в их понимании химии.

Видео будущего: Как научить роботов видеть мир реалистично

Представлен комплексный эталонный набор и датасет для генерации видеороботов, включающий в себя оценочный набор, основанный на воплощении, и автоматизированные метрики оценки, подтвержденные высокой степенью соответствия результатов 25 видеомоделей субъективным оценкам человека, а также крупномасштабный, высококачественный роботизированный датасет RoVid-X, предназначенный для обучения моделей генерации видео, данные для которого получены из интернет-видео и видео, полученных из воплощенных источников.

Новое исследование представляет комплексный подход к оценке и улучшению генерации видео для роботов, способный значительно повысить их способность взаимодействовать с окружающим миром.