Искусственный интеллект — Страница 66

Искусственный интеллект на службе правосудия: поиск расовой предвзятости в судебных решениях

08.03.2026 от Денис Аветисян

Анализ, представленный на платформе redoio.info, позволяет оценить силу связи между демографическими характеристиками и исходами вынесения приговоров, например, в случаях применения принципа

Новое исследование оценивает возможности использования ИИ для выявления и представления статистических доказательств расовой предвзятости в уголовном судопроизводстве, особенно в контексте Закона о расовой справедливости штата Калифорния.

Что думают люди: Новый взгляд на оценку языковых моделей

08.03.2026 от Денис Аветисян

Разнородность предпочтений пользователей проявляется в расхождениях между группами, измеряемых как средняя разница в рангах, и в степени их нерешительности, отражаемой частотой возникновения ничьих в зависимости от возраста.

Исследование предлагает более точный и учитывающий различия между группами пользователей подход к оценке качества больших языковых моделей, выходящий за рамки автоматических тестов.

Раскрытие причинно-следственных связей: новый подход на основе анализа повторяющихся паттернов

08.03.2026 от Денис Аветисян

$Основываясь на анализе направленной сети символических паттернов, исследование демонстрирует, что определенные подстроки из управляющей последовательности способны обусловить детерминированное поведение целевой последовательности - чем ближе значение взвешенной энтропии к нулю, тем более предсказуемым становится переход, в то время как более высокие значения указывают на возрастающую неопределенность в индуцированных переходах, причем анализ направленности [latex]X \rightarrow Y[/latex] и [latex]Y \rightarrow X[/latex] позволяет сравнить степень детерминизма в обоих направлениях.$

В статье представлен инновационный метод выявления причинно-следственных связей во временных рядах, использующий концепцию словарного анализа и энтропии паттернов.

Мультимодальное обучение: Новый рубеж возможностей

08.03.2026 от Денис Аветисян

Обзор UniMbenchmark демонстрирует комплексную платформу для оценки универсальности мультимодальных моделей, позволяющую выявить их сильные и слабые стороны в различных задачах и областях знаний.

Представлен UniM — комплексный набор данных и методология оценки для обучения моделей, способных эффективно взаимодействовать с различными типами информации.

Рассуждения ИИ: Как логика помогает понять действия пациентов

08.03.2026 от Денис Аветисян

Новая модель Logi-PAR объединяет глубокое обучение и логические правила для более точного анализа поведения пациентов и поддержки клинических решений.

Проверка на прочность: Как оценить логическое мышление больших языковых моделей

08.03.2026 от Денис Аветисян

Возможности моделей GPT-4o и GPT-4-mini оценивались посредством зондирования покрытия штампов, демонстрируя пример реструктуризации пространства решений для оптимизации производительности.

Новая методика позволяет всесторонне протестировать способность нейросетей к структурному рассуждению и выявить слабые места в их логике.

Искусственный интеллект учится понимать наши желания

08.03.2026 от Денис Аветисян

Наблюдения показывают, что предлагаемая модель Vrm демонстрирует повышенную точность по сравнению с традиционной моделью вознаграждения, что подтверждается сравнительными кривыми точности, представленными на рисунке.

Новый подход к обучению моделей вознаграждения позволяет нейросетям лучше соответствовать человеческим предпочтениям и выдавать более качественные результаты.

Химический компас: Искусственный интеллект на службе создания долговечных фотокатализаторов

08.03.2026 от Денис Аветисян

Новый подход, основанный на использовании больших языковых моделей, позволяет эффективно проектировать ковалентные органические каркасы (COF) с улучшенной устойчивостью к гидролизу и высокой фотокаталитической активностью.

Искусственный интеллект в огне: новый подход к моделированию горения

07.03.2026 от Денис Аветисян

Предложенная база знаний позволила сформировать целостную картину области науки о горении, выявляя взаимосвязи и структуру ключевых концепций, что позволяет рассматривать эту область как взаимосвязанную систему, а не набор разрозненных фактов и исследований.

Исследователи предлагают комплексную систему для внедрения и оценки знаний в больших языковых моделях, применяемых к сложным задачам в науке о горении.

В поисках истины: как оценить способность ИИ собирать информацию из разных источников

07.03.2026 от Денис Аветисян

Для создания iAgentBench используется конвейер, который начинается с отбора высокочастотных запросов из общедоступных источников данных (GDELT), затем извлекает тематически связанные истории из веб-корпуса, классифицирует их на основные, связующие и вспомогательные сообщества, и, наконец, генерирует пары вопросов и ответов, отфильтрованные с помощью судей на основе больших языковых моделей.

Новый бенчмарк iAgentBench призван проверить, насколько эффективно искусственный интеллект может анализировать большие объемы данных и отвечать на сложные вопросы, требующие интеграции информации из множества документов.