Личность в диагнозе: о подводных камнях медицинских языковых моделей

В рамках исследования клинических больших языковых моделей, персоны внедряются посредством системных запросов для анализа их влияния как априорных убеждений на поведение моделей, при этом оценка осуществляется на двух клинических задачах с использованием автоматизированных метрик, качественной оценки, основанной на ранжировании, выполненном моделью, и валидации экспертами-клиницистами.

Исследование показывает, что использование «личностей» в медицинских языковых моделях может улучшить результаты в одних сценариях, но и привести к непредсказуемым последствиям в других.

Ускорение расчётов в квантовой хромодинамике: от архитектуры до алгоритмов

Наблюдения производительности одноузловых вычислений оператора Вильсона-Дирака для решетки [latex]64 \times 16^3[/latex] на вычислительных системах JUWELS, Ookami и HAICGU позволяют оценить сравнительную эффективность различных архитектур при решении задач квантовой хромодинамики.

В статье представлен комплексный подход к оптимизации Lattice QCD симуляций, включающий в себя новые методы блокировки правой части и использование современных SIMD инструкций.

Управляемость генеративных моделей: новый взгляд на контроль

Исследование траекторий диалогового процесса для задачи контроля формальности речи демонстрирует, что модели SmolLM3-3B, Qwen3-4B и Gemma3-4B, при использовании 5-шаговой подсказки, показывают различную степень управляемости, при этом Qwen3-4B и Gemma3-4B проявляют наибольшую способность к контролю формальности ([latex]\delta = 0.05[/latex]) и соответствие запросам пользователя ([latex]cvg = 1.0[/latex], медианное [latex]MAE = 0.09[/latex]), в то время как абсолютная управляемость не достигнута ни одной из моделей в условиях нулевой подсказки.

Исследователи предлагают формальный инструментарий для оценки степени контроля над выходными данными генеративных моделей, подчеркивая, что управляемость не является само собой разумеющейся.

Квантовое Превосходство: Достигнуто или Иллюзия?

Квантовое Превосходство: Достигнуто или Иллюзия? Представьте себе, что вы пытаетесь разгадать сложный лабиринт, а ваш соперник использует совершенно другой подход – он просто проходит сквозь стены. Это, в сущности, и есть квантовое превосходство – способность квантовой машины решать задачу, невозможную для классического компьютера. Но что, если лабиринт сам по себе бессмысленен? Суть квантового превосходства, как … Читать далее

Финансовые мифы в разных языках: где модели ошибаются?

Большие языковые модели демонстрируют способность выявлять финансоческую дезинформацию в различных контекстах, что указывает на их потенциал в автоматизированном контроле достоверности информации.

Новое исследование выявляет систематические ошибки в работе крупных языковых моделей при выявлении финансоческой дезинформации на разных языках и в различных ситуациях.

Геометрия на пределе: как алгоритмы оптимизации превосходят языковые модели

Решение задачи оптимальной упаковки шестиугольников представлено в виде графической визуализации, демонстрирующей возможные конфигурации и их взаимосвязь.

Новое исследование показывает, что современные алгоритмы глобальной оптимизации эффективно решают сложные задачи комбинаторной геометрии, зачастую обходя решения, полученные с помощью больших языковых моделей.

Самообучающиеся системы и кибербезопасность: новая реальность

Агентивные системы искусственного интеллекта формируют комплексную экосистему для кибербезопасности, охватывающую автономную защиту, разведывательную деятельность, автоматизацию корпоративных процессов и моделирование, демонстрируя потенциал для комплексного подхода к решению проблем информационной безопасности.

В статье представлен обзор перспективного направления — автономных агентов искусственного интеллекта — и его влияния на ландшафт кибербезопасности, рассматриваются возможности и возникающие угрозы.

Реальный опыт против виртуальной лаборатории: как лучше учить науке?

Изучение учебного процесса выявило, что механика, электричество, оптика и химия наиболее эффективно осваиваются посредством реальных экспериментов, в то время как цифровое моделирование предоставляет преимущества в доступности, скорости проведения, повторяемости и наглядности невидимых явлений, что позволяет оптимизировать обучение через комбинированный подход.

Новое исследование сравнивает эффективность практических экспериментов и цифровых симуляций в обучении естественным наукам, выявляя оптимальные стратегии для повышения успеваемости учащихся.