Разумные языковые модели: новый подход к логическому мышлению

В отличие от существующих подходов, ограничивающихся генерацией цепочек рассуждений на основе вопроса, представленный метод CoVRL объединяет выборку априорных цепочек, обусловленных вопросом, с выборкой апостериорных цепочек, обусловленных ответом, посредством гибридной вариационной схемы, что обеспечивает эффективное исследование пространства решений при сохранении высокой согласованности между цепочкой рассуждений и окончательным ответом.

Исследователи предлагают инновационный метод обучения языковых моделей, позволяющий им самостоятельно улучшать свои навыки рассуждения и находить ответы на сложные вопросы.

Данные в движении: Автоматизация подготовки данных с помощью искусственного интеллекта

DataFlow представляет собой комплексную систему, включающую в себя основной вычислительный движок, повторно используемые конвейеры, пользовательские интерфейсы и расширяемую экосистему, предназначенную для создания высококачественных, ориентированных на задачи наборов данных, потребляемых приложениями, использующими большие языковые модели.

Новая система DataFlow позволяет значительно упростить и ускорить процесс подготовки данных для обучения моделей искусственного интеллекта, повышая их точность и надежность.

Seedance 1.5 Pro: Создание видео со звуком нового поколения

Представлена модель Seedance 1.5 Pro, способная генерировать реалистичные видеоролики с синхронизированным звуковым сопровождением, открывая новые возможности для мультимедийного контента.

Как истории захватывают умы: новый взгляд на восприятие онлайн-нарративов

Посредством формализма SocialStoryFrames осуществляется моделирование намерения и восприятия повествований в социальных сетях, что позволяет анализировать разнообразные формы отклика аудитории на истории.

Исследователи предлагают новый подход к пониманию того, как люди реагируют на истории в социальных сетях, и представляют инструмент для сравнительного анализа повествовательных практик.

Искусственный интеллект и предвзятость: как персонализация влияет на отбор кандидатов

В системе персонализированного подбора персонала, использующей память для улучшения результатов, предвзятость не только возникает, но и усиливается с течением времени, что указывает на необходимость тщательного контроля и смягчения подобных эффектов для обеспечения справедливого и объективного отбора.

Новое исследование показывает, что стремление к персонализации в системах искусственного интеллекта, используемых для подбора персонала, может приводить к усилению существующих предубеждений и дискриминации.

Ядерный синтез и Искусственный Интеллект: Новый подход к проектированию реакторов

Рассмотрена методика ReactorFold, преобразующая задачу проектирования топливных сборок в задачу языкового моделирования путем растеризации двумерной решетки и последующего обучения модели в два этапа: сначала на большом корпусе низкоточных макетов для усвоения геометрического синтаксиса, затем с использованием адаптации LoRA на высокоточных данных для уточнения физических корреляций, при этом выравнивание модели с многоцелевыми ограничениями безопасности ($k_{eff}$, $F_q$, $F_{\Delta H}$) осуществляется посредством прямого обучения по предпочтениям (DPO) с использованием симуляций OpenMC, что обеспечивает замкнутый цикл обратной связи на основе физики.

Ученые разработали систему, использующую возможности больших языковых моделей для автоматического создания оптимальных конструкций ядерных реакторов, превосходящих традиционные решения.

Предсказывая будущее изображения: новый подход к обучению зрения

Визуализация дополнительных механизмов внимания и векторных представлений позволяет увидеть, как модель фокусируется на релевантных признаках и формирует внутреннее представление данных, раскрывая сложную взаимосвязь между входными данными и процессами принятия решений.

Исследователи предлагают инновационный метод самообучения для компьютерного зрения, основанный на предсказании последовательности векторных представлений.

Различия, которые имеют значение: Автоматический поиск и исправление ошибок в мультимодальных моделях

Архитектура AuditDM предполагает тонкую настройку многомодальной большой языковой модели (MLLM) для функционирования в роли аудитора, генерирующего сложные вопросы и контрфактические изображения, что позволяет выявить расхождения в ответах между целевой моделью и ансамблем MLLM, тем самым обнажая пробелы в возможностях и характерные ошибки целевой модели посредством максимизации расхождений в предсказаниях.

Новый подход позволяет выявлять слабые места в сложных системах искусственного интеллекта, анализируя расхождения между различными моделями и автоматически генерируя данные для их устранения.

Марс и магнитное поле: новый взгляд с помощью нейросетей

Исследователи успешно применили нейронные сети, основанные на физических принципах, для точного моделирования магнитного поля, индуцированного вокруг Марса, под воздействием солнечного ветра.