Прямой доступ к ответам: новый подход к запросам в базах данных

Эксперименты с трёхсторонним соединением [latex]R(A,B) \bowtie_{B} S(B,C) \bowtie_{C} T(C,D)[/latex] с использованием синтетических данных показали, что при контролируемом размере результирующего набора, время доступа к медианному ответу при полном лексикографическом порядке [latex]A \rightarrow B \rightarrow C \rightarrow D[/latex] существенно зависит от значения [latex]k[/latex] при размере отношений в [latex]10^4[/latex], при этом отношение прямого доступа ко времени единичного доступа к медианному ответу остаётся стабильным.

Исследование демонстрирует, как алгоритмы прямого доступа позволяют значительно ускорить обработку сложных запросов к базам данных, особенно при небольшом количестве обращений.

Раскрытие личностей: Как искусственный интеллект «взломал» анонимные интервью

Новое исследование показывает, что современные ИИ-системы способны восстановить личности участников публичного датасета интервью, несмотря на предпринятые меры по анонимизации.

Интеллектуальный отбор данных: как ускорить открытие новых материалов

Активное обучение значительно снижает избыточность в материаловедческих базах данных: модели XGBoost и случайных лесов, обученные на подмножествах, отобранных с использованием стратегий, основанных на неопределённости, демонстрируют сравнимую точность прогнозирования ширины запрещенной зоны, используя лишь 10% исходного объёма данных из OQMD14, что указывает на существенный резерв избыточности; при этом, для минимизации систематических ошибок, связанных с нарушением предположения о независимой и одинаково распределённой выборке, применяется метод активного обучения, управляемый информационной энтропией (ETAL), улучшающий покрытие менее симметричных кристаллических систем в наборе дескрипторов, вдохновлённых классическим силовым полем JARVIS, и, как следствие, повышающий эффективность моделей машинного обучения, обученных на подобранных данных.

В статье представлен критический анализ методов активного обучения, применяемых в материаловедении, и их влияние на эффективность поиска и генерации данных.

Шах и мат: Как небольшая помощь меняет исход игры

После

Новое исследование показывает, что даже минимальные, точно рассчитанные вмешательства в шахматные партии между компьютерными программами способны существенно повысить вероятность победы.

Предвидеть Действия: Новая Эра Автономных Агентов

Традиционные агенты машинного обучения совершенствуются посредством дорогостоящих вычислений и внешней обратной связи, что приводит к значительным задержкам, в то время как данное исследование направлено на выявление превосходных, основанных на данных решений до их фактического выполнения, используя концепцию «скрытых приоритетов, вытекающих из данных» [latex] \implies [/latex] для повышения эффективности и скорости обучения.

Исследование показывает, что модели, способные предсказывать результаты работы алгоритмов машинного обучения без их фактического выполнения, открывают путь к созданию более эффективных и быстрых систем искусственного интеллекта.

Личность в диагнозе: о подводных камнях медицинских языковых моделей

В рамках исследования клинических больших языковых моделей, персоны внедряются посредством системных запросов для анализа их влияния как априорных убеждений на поведение моделей, при этом оценка осуществляется на двух клинических задачах с использованием автоматизированных метрик, качественной оценки, основанной на ранжировании, выполненном моделью, и валидации экспертами-клиницистами.

Исследование показывает, что использование «личностей» в медицинских языковых моделях может улучшить результаты в одних сценариях, но и привести к непредсказуемым последствиям в других.

Управляемость генеративных моделей: новый взгляд на контроль

Исследование траекторий диалогового процесса для задачи контроля формальности речи демонстрирует, что модели SmolLM3-3B, Qwen3-4B и Gemma3-4B, при использовании 5-шаговой подсказки, показывают различную степень управляемости, при этом Qwen3-4B и Gemma3-4B проявляют наибольшую способность к контролю формальности ([latex]\delta = 0.05[/latex]) и соответствие запросам пользователя ([latex]cvg = 1.0[/latex], медианное [latex]MAE = 0.09[/latex]), в то время как абсолютная управляемость не достигнута ни одной из моделей в условиях нулевой подсказки.

Исследователи предлагают формальный инструментарий для оценки степени контроля над выходными данными генеративных моделей, подчеркивая, что управляемость не является само собой разумеющейся.