Денис Аветисян — Страница 77

Прямой доступ к ответам: новый подход к запросам в базах данных

12.01.2026 от Денис Аветисян

$Эксперименты с трёхсторонним соединением [latex]R(A,B) \bowtie_{B} S(B,C) \bowtie_{C} T(C,D)[/latex] с использованием синтетических данных показали, что при контролируемом размере результирующего набора, время доступа к медианному ответу при полном лексикографическом порядке [latex]A \rightarrow B \rightarrow C \rightarrow D[/latex] существенно зависит от значения [latex]k[/latex] при размере отношений в [latex]10^4[/latex], при этом отношение прямого доступа ко времени единичного доступа к медианному ответу остаётся стабильным.$

Исследование демонстрирует, как алгоритмы прямого доступа позволяют значительно ускорить обработку сложных запросов к базам данных, особенно при небольшом количестве обращений.

Раскрытие личностей: Как искусственный интеллект «взломал» анонимные интервью

12.01.2026 от Денис Аветисян

Новое исследование показывает, что современные ИИ-системы способны восстановить личности участников публичного датасета интервью, несмотря на предпринятые меры по анонимизации.

Африканские языки в фокусе: новый вызов для искусственного интеллекта

12.01.2026 от Денис Аветисян

В рамках исследования представлены примеры данных Afri-MCQA, состоящие из параллельных пар вопросов и ответов, как в текстовом, так и в устном формате, привязанных к культурно значимым изображениям на английском и различных африканских языках.

Исследователи представили масштабный мультимодальный датасет, призванный улучшить понимание культурных вопросов на 15 африканских языках.

Интеллектуальный отбор данных: как ускорить открытие новых материалов

12.01.2026 от Денис Аветисян

В статье представлен критический анализ методов активного обучения, применяемых в материаловедении, и их влияние на эффективность поиска и генерации данных.

Покоряя Multilingual Search: Второе место на AnalytiCup 2025

12.01.2026 от Денис Аветисян

Шаблон промпта, разработанный для задачи определения релевантности запроса и элемента, позволяет структурировать входные данные таким образом, чтобы максимизировать точность сопоставления между запросом [latex]q[/latex] и соответствующим элементом [latex]i[/latex].

В статье подробно описан подход, позволивший добиться выдающихся результатов в задаче оценки релевантности поисковых запросов на нескольких языках в рамках соревнований CIKM 2025.

Шах и мат: Как небольшая помощь меняет исход игры

12.01.2026 от Денис Аветисян

После

Новое исследование показывает, что даже минимальные, точно рассчитанные вмешательства в шахматные партии между компьютерными программами способны существенно повысить вероятность победы.

Предвидеть Действия: Новая Эра Автономных Агентов

12.01.2026 от Денис Аветисян

$Традиционные агенты машинного обучения совершенствуются посредством дорогостоящих вычислений и внешней обратной связи, что приводит к значительным задержкам, в то время как данное исследование направлено на выявление превосходных, основанных на данных решений до их фактического выполнения, используя концепцию «скрытых приоритетов, вытекающих из данных» [latex] \implies [/latex] для повышения эффективности и скорости обучения.$

Исследование показывает, что модели, способные предсказывать результаты работы алгоритмов машинного обучения без их фактического выполнения, открывают путь к созданию более эффективных и быстрых систем искусственного интеллекта.

Личность в диагнозе: о подводных камнях медицинских языковых моделей

12.01.2026 от Денис Аветисян

В рамках исследования клинических больших языковых моделей, персоны внедряются посредством системных запросов для анализа их влияния как априорных убеждений на поведение моделей, при этом оценка осуществляется на двух клинических задачах с использованием автоматизированных метрик, качественной оценки, основанной на ранжировании, выполненном моделью, и валидации экспертами-клиницистами.

Исследование показывает, что использование «личностей» в медицинских языковых моделях может улучшить результаты в одних сценариях, но и привести к непредсказуемым последствиям в других.

Наука из первых рук: новый вызов для искусственного интеллекта

12.01.2026 от Денис Аветисян

Распределение вопросов по поддоменам в WildSci демонстрирует неоднородность тематического охвата, указывая на потенциальную предвзятость или пробелы в знаниях, отраженные в структуре данных.

Исследователи представляют масштабный набор данных, призванный улучшить способность ИИ рассуждать и синтезировать знания из научных публикаций.

Управляемость генеративных моделей: новый взгляд на контроль

12.01.2026 от Денис Аветисян

$Исследование траекторий диалогового процесса для задачи контроля формальности речи демонстрирует, что модели SmolLM3-3B, Qwen3-4B и Gemma3-4B, при использовании 5-шаговой подсказки, показывают различную степень управляемости, при этом Qwen3-4B и Gemma3-4B проявляют наибольшую способность к контролю формальности ([latex]\delta = 0.05[/latex]) и соответствие запросам пользователя ([latex]cvg = 1.0[/latex], медианное [latex]MAE = 0.09[/latex]), в то время как абсолютная управляемость не достигнута ни одной из моделей в условиях нулевой подсказки.$

Исследователи предлагают формальный инструментарий для оценки степени контроля над выходными данными генеративных моделей, подчеркивая, что управляемость не является само собой разумеющейся.