Личность в диагнозе: о подводных камнях медицинских языковых моделей

В рамках исследования клинических больших языковых моделей, персоны внедряются посредством системных запросов для анализа их влияния как априорных убеждений на поведение моделей, при этом оценка осуществляется на двух клинических задачах с использованием автоматизированных метрик, качественной оценки, основанной на ранжировании, выполненном моделью, и валидации экспертами-клиницистами.

Исследование показывает, что использование «личностей» в медицинских языковых моделях может улучшить результаты в одних сценариях, но и привести к непредсказуемым последствиям в других.

Предвидеть Действия: Новая Эра Автономных Агентов

Традиционные агенты машинного обучения совершенствуются посредством дорогостоящих вычислений и внешней обратной связи, что приводит к значительным задержкам, в то время как данное исследование направлено на выявление превосходных, основанных на данных решений до их фактического выполнения, используя концепцию «скрытых приоритетов, вытекающих из данных» [latex] \implies [/latex] для повышения эффективности и скорости обучения.

Исследование показывает, что модели, способные предсказывать результаты работы алгоритмов машинного обучения без их фактического выполнения, открывают путь к созданию более эффективных и быстрых систем искусственного интеллекта.

Управляемость генеративных моделей: новый взгляд на контроль

Исследование траекторий диалогового процесса для задачи контроля формальности речи демонстрирует, что модели SmolLM3-3B, Qwen3-4B и Gemma3-4B, при использовании 5-шаговой подсказки, показывают различную степень управляемости, при этом Qwen3-4B и Gemma3-4B проявляют наибольшую способность к контролю формальности ([latex]\delta = 0.05[/latex]) и соответствие запросам пользователя ([latex]cvg = 1.0[/latex], медианное [latex]MAE = 0.09[/latex]), в то время как абсолютная управляемость не достигнута ни одной из моделей в условиях нулевой подсказки.

Исследователи предлагают формальный инструментарий для оценки степени контроля над выходными данными генеративных моделей, подчеркивая, что управляемость не является само собой разумеющейся.

Самообучающиеся системы и кибербезопасность: новая реальность

Агентивные системы искусственного интеллекта формируют комплексную экосистему для кибербезопасности, охватывающую автономную защиту, разведывательную деятельность, автоматизацию корпоративных процессов и моделирование, демонстрируя потенциал для комплексного подхода к решению проблем информационной безопасности.

В статье представлен обзор перспективного направления — автономных агентов искусственного интеллекта — и его влияния на ландшафт кибербезопасности, рассматриваются возможности и возникающие угрозы.

Финансовые мифы в разных языках: где модели ошибаются?

Большие языковые модели демонстрируют способность выявлять финансоческую дезинформацию в различных контекстах, что указывает на их потенциал в автоматизированном контроле достоверности информации.

Новое исследование выявляет систематические ошибки в работе крупных языковых моделей при выявлении финансоческой дезинформации на разных языках и в различных ситуациях.

Самообучающийся алгоритм находит критические точки Изинговской модели

Алгоритм AMPPI, примененный к двумерной треугольной решетке Изинга (L=(32,64)), демонстрирует возможность точного определения критических параметров [latex]T_c = \frac{4}{\ln(3)}[/latex] и [latex]\beta = 0.125[/latex] посредством переноса обучения, при этом последующая донастройка в течение 20 итераций на основе данных физической среды позволяет достичь высокой точности, подтвержденной соответствием теоретическим значениям.

Новый подход, основанный на обучении с подкреплением, позволяет автоматически определять критические параметры Изинговской модели с высокой точностью и эффективностью.

Геолокация с помощью карт: новый взгляд на определение местоположения

В рамках предложенной схемы «Мышление с картой» агент функционирует в цикле взаимодействия с картой, неявно поддерживая пул гипотез, при этом обучение с подкреплением, ориентированное на агента, позволяет масштабировать процесс проверки гипотез параллельно во время выполнения, обеспечивая эффективность и адаптивность системы.

Исследователи предлагают инновационный подход к геолокации изображений, объединяющий возможности больших языковых моделей и интерактивное взаимодействие с картами.