Физика и логика: новый подход к автоматическому доказательству теорем

В рамках разработки системы автоматической проверки физических утверждений, обучающий набор данных формируется из 5541 утверждения, полученных из PhysLean и сгенерированных моделью Claude-4.5-Sonnet, после чего, с использованием алгоритма GRPO, происходит обучение базовой модели, оцениваемой по корректности доказательств, предоставляемых системой Lean.

Исследователи разработали систему, способную автоматически доказывать физические и математические теоремы, используя возможности больших языковых моделей и обучение с подкреплением.

Квантовая Диагонализация: Ускорение Вычислений на GPU и Многопоточных Процессорах

На вычислительной платформе Frontier наблюдается устойчивое масштабирование производительности GPU-ускоренного кода при увеличении числа узлов от одного до 128 и графических процессоров от 8 до 1024, что демонстрирует эффективность параллельных вычислений в задачах, требующих высокой производительности.

Новая реализация метода Sample-based Quantum Diagonalization позволяет значительно ускорить расчеты электронного строения молекул, открывая возможности для моделирования более сложных систем.

Диалог с рецензентами: Новый подход к ответам на критику в научных статьях

Система RebuttalAgent, получив научную статью и отзывы рецензентов, структурирует входные данные, извлекая конкретные замечания и создавая контекст для поиска доказательств, включая релевантную внешнюю литературу, а затем формирует последовательный и аргументированный план ответа, который может быть дополнен автором и преобразован в официальный ответ, обеспечивая согласованность и точность изложения.

Исследователи представили систему, помогающую авторам структурированно отвечать на замечания рецензентов, повышая качество и обоснованность аргументов.

Из хаоса данных – к чёткой медицинской информации

Структурная сложность научных PDF-документов представляет собой значительный вызов для автоматизированного извлечения доказательств, поскольку неоднородность форматирования и отсутствие семантической разметки затрудняют надежное определение и извлечение релевантной информации.

Новая система позволяет автоматически извлекать структурированные данные из научных PDF-документов, значительно облегчая процесс синтеза доказательной базы в медицине.

Искусственный интеллект в роли исследователя: новый критерий оценки

MMDR-Bench оценивает возможности глубокого обучения в мультимодальных исследованиях как на интегрированном, так и на атомарном уровнях, позволяя комплексно оценить производительность систем.

Представлен комплексный инструмент для проверки способности ИИ-агентов проводить глубокий анализ информации из различных источников и формировать достоверные отчеты.

Молекулярный интеллект: проверка химического мышления

Новый тест MolecularIQ позволяет оценить способность современных моделей искусственного интеллекта рассуждать о структуре молекул и выявляет пробелы в их понимании химии.

Искусство Самоперерождения: Рекурсивность в Эпоху ИИ

Новая статья исследует концепцию ‘Рекурсивизма’ как художественной парадигмы, описывающей искусство, способное к самомодификации и эволюции в эпоху искусственного интеллекта.