Прямой доступ к ответам: новый подход к запросам в базах данных
![Эксперименты с трёхсторонним соединением [latex]R(A,B) \bowtie_{B} S(B,C) \bowtie_{C} T(C,D)[/latex] с использованием синтетических данных показали, что при контролируемом размере результирующего набора, время доступа к медианному ответу при полном лексикографическом порядке [latex]A \rightarrow B \rightarrow C \rightarrow D[/latex] существенно зависит от значения [latex]k[/latex] при размере отношений в [latex]10^4[/latex], при этом отношение прямого доступа ко времени единичного доступа к медианному ответу остаётся стабильным.](https://arxiv.org/html/2601.06013v1/x1.png)
Исследование демонстрирует, как алгоритмы прямого доступа позволяют значительно ускорить обработку сложных запросов к базам данных, особенно при небольшом количестве обращений.
![Эксперименты с трёхсторонним соединением [latex]R(A,B) \bowtie_{B} S(B,C) \bowtie_{C} T(C,D)[/latex] с использованием синтетических данных показали, что при контролируемом размере результирующего набора, время доступа к медианному ответу при полном лексикографическом порядке [latex]A \rightarrow B \rightarrow C \rightarrow D[/latex] существенно зависит от значения [latex]k[/latex] при размере отношений в [latex]10^4[/latex], при этом отношение прямого доступа ко времени единичного доступа к медианному ответу остаётся стабильным.](https://arxiv.org/html/2601.06013v1/x1.png)
Исследование демонстрирует, как алгоритмы прямого доступа позволяют значительно ускорить обработку сложных запросов к базам данных, особенно при небольшом количестве обращений.
Новое исследование показывает, что современные ИИ-системы способны восстановить личности участников публичного датасета интервью, несмотря на предпринятые меры по анонимизации.

Исследователи представили масштабный мультимодальный датасет, призванный улучшить понимание культурных вопросов на 15 африканских языках.

В статье представлен критический анализ методов активного обучения, применяемых в материаловедении, и их влияние на эффективность поиска и генерации данных.
![Шаблон промпта, разработанный для задачи определения релевантности запроса и элемента, позволяет структурировать входные данные таким образом, чтобы максимизировать точность сопоставления между запросом [latex]q[/latex] и соответствующим элементом [latex]i[/latex].](https://arxiv.org/html/2601.05259v1/x2.png)
В статье подробно описан подход, позволивший добиться выдающихся результатов в задаче оценки релевантности поисковых запросов на нескольких языках в рамках соревнований CIKM 2025.

Новое исследование показывает, что даже минимальные, точно рассчитанные вмешательства в шахматные партии между компьютерными программами способны существенно повысить вероятность победы.
![Традиционные агенты машинного обучения совершенствуются посредством дорогостоящих вычислений и внешней обратной связи, что приводит к значительным задержкам, в то время как данное исследование направлено на выявление превосходных, основанных на данных решений до их фактического выполнения, используя концепцию «скрытых приоритетов, вытекающих из данных» [latex] \implies [/latex] для повышения эффективности и скорости обучения.](https://arxiv.org/html/2601.05930v1/x1.png)
Исследование показывает, что модели, способные предсказывать результаты работы алгоритмов машинного обучения без их фактического выполнения, открывают путь к созданию более эффективных и быстрых систем искусственного интеллекта.

Исследование показывает, что использование «личностей» в медицинских языковых моделях может улучшить результаты в одних сценариях, но и привести к непредсказуемым последствиям в других.

Исследователи представляют масштабный набор данных, призванный улучшить способность ИИ рассуждать и синтезировать знания из научных публикаций.
![Исследование траекторий диалогового процесса для задачи контроля формальности речи демонстрирует, что модели SmolLM3-3B, Qwen3-4B и Gemma3-4B, при использовании 5-шаговой подсказки, показывают различную степень управляемости, при этом Qwen3-4B и Gemma3-4B проявляют наибольшую способность к контролю формальности ([latex]\delta = 0.05[/latex]) и соответствие запросам пользователя ([latex]cvg = 1.0[/latex], медианное [latex]MAE = 0.09[/latex]), в то время как абсолютная управляемость не достигнута ни одной из моделей в условиях нулевой подсказки.](https://arxiv.org/html/2601.05637v1/x2.png)
Исследователи предлагают формальный инструментарий для оценки степени контроля над выходными данными генеративных моделей, подчеркивая, что управляемость не является само собой разумеющейся.