Искусственный интеллект на службе правосудия: поиск расовой предвзятости в судебных решениях

Анализ, представленный на платформе redoio.info, позволяет оценить силу связи между демографическими характеристиками и исходами вынесения приговоров, например, в случаях применения принципа

Новое исследование оценивает возможности использования ИИ для выявления и представления статистических доказательств расовой предвзятости в уголовном судопроизводстве, особенно в контексте Закона о расовой справедливости штата Калифорния.

Что думают люди: Новый взгляд на оценку языковых моделей

Разнородность предпочтений пользователей проявляется в расхождениях между группами, измеряемых как средняя разница в рангах, и в степени их нерешительности, отражаемой частотой возникновения ничьих в зависимости от возраста.

Исследование предлагает более точный и учитывающий различия между группами пользователей подход к оценке качества больших языковых моделей, выходящий за рамки автоматических тестов.

Раскрытие причинно-следственных связей: новый подход на основе анализа повторяющихся паттернов

Основываясь на анализе направленной сети символических паттернов, исследование демонстрирует, что определенные подстроки из управляющей последовательности способны обусловить детерминированное поведение целевой последовательности - чем ближе значение взвешенной энтропии к нулю, тем более предсказуемым становится переход, в то время как более высокие значения указывают на возрастающую неопределенность в индуцированных переходах, причем анализ направленности [latex]X \rightarrow Y[/latex] и [latex]Y \rightarrow X[/latex] позволяет сравнить степень детерминизма в обоих направлениях.

В статье представлен инновационный метод выявления причинно-следственных связей во временных рядах, использующий концепцию словарного анализа и энтропии паттернов.

Проверка на прочность: Как оценить логическое мышление больших языковых моделей

Возможности моделей GPT-4o и GPT-4-mini оценивались посредством зондирования покрытия штампов, демонстрируя пример реструктуризации пространства решений для оптимизации производительности.

Новая методика позволяет всесторонне протестировать способность нейросетей к структурному рассуждению и выявить слабые места в их логике.

Искусственный интеллект учится понимать наши желания

Наблюдения показывают, что предлагаемая модель Vrm демонстрирует повышенную точность по сравнению с традиционной моделью вознаграждения, что подтверждается сравнительными кривыми точности, представленными на рисунке.

Новый подход к обучению моделей вознаграждения позволяет нейросетям лучше соответствовать человеческим предпочтениям и выдавать более качественные результаты.

Химический компас: Искусственный интеллект на службе создания долговечных фотокатализаторов

Исследование представляет автоматизированный подход к открытию фотокатализаторов COF, использующий агентный рабочий процесс Ara, который исследует пространство из 820 комбинаторных кандидатов, сформированных из тригональных узлов, дитопических линкеров и ароматических заместителей, оценивая их с помощью фрагмент-ориентированного скрининга на основе оптимизации GFN1-xTB и анализа полосы запрещения, и сравнивая эффективность случайной выборки, байесовской оптимизации и итеративного поиска на основе больших языковых моделей, демонстрируя возможность химически обоснованного проектирования новых материалов.

Новый подход, основанный на использовании больших языковых моделей, позволяет эффективно проектировать ковалентные органические каркасы (COF) с улучшенной устойчивостью к гидролизу и высокой фотокаталитической активностью.

Искусственный интеллект в огне: новый подход к моделированию горения

Предложенная база знаний позволила сформировать целостную картину области науки о горении, выявляя взаимосвязи и структуру ключевых концепций, что позволяет рассматривать эту область как взаимосвязанную систему, а не набор разрозненных фактов и исследований.

Исследователи предлагают комплексную систему для внедрения и оценки знаний в больших языковых моделях, применяемых к сложным задачам в науке о горении.

В поисках истины: как оценить способность ИИ собирать информацию из разных источников

Для создания iAgentBench используется конвейер, который начинается с отбора высокочастотных запросов из общедоступных источников данных (GDELT), затем извлекает тематически связанные истории из веб-корпуса, классифицирует их на основные, связующие и вспомогательные сообщества, и, наконец, генерирует пары вопросов и ответов, отфильтрованные с помощью судей на основе больших языковых моделей.

Новый бенчмарк iAgentBench призван проверить, насколько эффективно искусственный интеллект может анализировать большие объемы данных и отвечать на сложные вопросы, требующие интеграции информации из множества документов.