Улучшение поиска: как подготовить данные для RAG

После применения ретрофитинга, векторное пространство представлений претерпевает значительную оптимизацию: если до ретрофитинга поиск по трем ближайшим соседям выявлял лишь один релевантный термин (точность 33%), то после оптимизации все три извлеченных термина оказываются релевантными, достигая точности в 100%, что свидетельствует об улучшении семантической близости представлений.

Новое исследование показывает, что качество предварительной обработки данных является ключевым фактором успеха при использовании техники Embedding Retrofitting в системах генерации ответов на основе поиска.

Внутреннее устройство адронов: от распределений партонов к новым измерениям

В этой статье представлен всесторонний обзор функций распределения партонов и их обобщений, раскрывающих сложную структуру адронов в рамках квантовой хромодинамики.

Искусственный интеллект осваивает командную строку: новый полигон для испытаний

Задача Terminal-Bench состоит из инструкции, Dockerfile, набора тестов и эталонного решения, в рамках которой агенты выполняют тесты внутри контейнера, обеспечивая тем самым автоматизированную проверку и воспроизводимость результатов.

Исследователи представили Terminal-Bench — платформу для оценки возможностей ИИ-агентов в реалистичных сценариях работы с интерфейсом командной строки.

Рамановская спектроскопия и глубокое обучение: испытание на прочность

В рамках исследования рассматривались три спектроскопических набора данных Рамана: минералов (MLROD), бактериальных видов и штаммов (Bacteria-ID) и активных фармацевтических ингредиентов (API), каждый из которых характеризуется уникальным масштабом и структурой меток, что позволяет оценить разнообразие спектральных профилей в различных областях, представленных в виде интенсивности в зависимости от сдвига Рамана (см⁻¹).

Новое исследование сравнивает эффективность различных моделей глубокого обучения для классификации рамановских спектров, выявляя ключевые проблемы, связанные с переносом знаний между наборами данных.

Оценка инженерных заданий: Искусственный интеллект на службе критериальной аттестации

Новый подход объединяет возможности генеративного ИИ и структурированные критерии оценки, позволяя автоматизировать проверку математических работ в инженерном образовании.

Квантовая когерентность: новый взгляд сквозь призму алгебр фон Неймана

В статье представлена оригинальная математическая модель квантовых когерентных пространств, объединяющая методы алгебр фон Неймана и категорной теории.

Управляемое автодополнение кода: новые вызовы и решения

Инструмент контролируемого завершения кода расширяет стандартный контекст, добавляя детальные инструкции, что позволяет направлять процесс генерации кода и, таким образом, отличается от традиционных методов.

Исследование оценивает способность современных языковых моделей генерировать код, соответствующий заданным инструкциям, и представляет новый бенчмарк для более точной оценки.

Химический синтез под контролем искусственного интеллекта: новые горизонты

Исследование демонстрирует возможность представления химических реакций в виде направленного двудольного графа, где узлы соответствуют реакциям и молекулам, а схема знаний о реакциях используется для решения задач ретросинтеза, включающих поиск одно- и многоступенчатых реакций ([latex]n\in\{2,3,4\}[/latex]), посредством обработки естественного языка.

Исследователи предлагают метод использования больших языковых моделей для поиска оптимальных путей химического синтеза на основе графов знаний о реакциях.

Физика в Машинах: Проверка на Понимание Мира

Разработанная структура PhysicsMind объединяет в себе базовую модель с набором данных, сформированным с учётом законов физики, экспертно проверенными аннотациями и разнообразными контролируемыми сценариями, что позволяет достичь надёжного понимания видео и оценки, учитывающей физические принципы.

Новый бенчмарк PhysicsMind позволяет оценить, насколько хорошо современные модели искусственного интеллекта понимают законы физики и предсказывают поведение объектов в реальном мире.