Обучение языковых моделей по предпочтениям: новый подход к повышению точности

Оптимизация предпочтений в режиме офлайн, такая как DPO, использует неявную награду, определяемую данными о предпочтениях, в то время как GANPO расширяет эту задачу, добавляя дискриминатор в латентном пространстве, чье состязательное взаимодействие индуцирует регуляризацию между распределениями латентных представлений модели политики и референсной модели.

Исследователи предлагают инновационный метод оптимизации языковых моделей, основанный на состязательном обучении в латентном пространстве, для улучшения соответствия заданным предпочтениям.

Искусственный интеллект предсказывает рецидив рака простаты по снимкам биопсии

Новая модель машинного обучения, обученная на изображениях биопсии предстательной железы, способна предсказать биохимический рецидив после радикальной простатэктомии.

Визуальный след: Сжатие рассуждений для мощных языковых моделей

В отличие от существующих подходов к эффективному рассуждению, требующих дополнительного обучения или использования внешних моделей, предложенный метод, основанный на визуальной компрессии текста (VTC), преобразует длинные текстовые цепочки рассуждений в компактные визуальные представления, позволяя визуально-языковым моделям кодировать информацию с существенно меньшим количеством визуальных токенов - достигается компрессия в 3-4 раза, при этом сохраняется легковесность и независимость от конкретных моделей.

Новый подход позволяет эффективно обрабатывать длинные контексты, преобразуя сложные цепочки логических выводов в компактные визуальные представления.

Искусственный интеллект на страже чистоты: точное распознавание химических веществ в сложных условиях

Разработанная модель условной генерации на основе внимания к пикам позволяет осуществлять обнаружение с помощью газовой хромато-масс-спектрометрии, обеспечивая эффективный анализ данных.

Новая разработка позволяет создавать реалистичные синтетические данные для газовой хромато-масс-спектрометрии, значительно повышая надежность и точность обнаружения химических веществ даже при наличии помех.

Глубина восприятия: Масштабирование 3D-моделирования с помощью данных

Метрика Anything демонстрирует чёткую зависимость масштабируемости и высокую общую производительность в задачах, что указывает на её способность эффективно адаптироваться к различным условиям и объёмам данных.

Новый подход к предварительному обучению позволяет создавать более точные и универсальные 3D-модели, используя огромные объемы разнородных данных.

Эволюция мощности: Искусственный интеллект проектирует новые преобразователи энергии

Преобразователи мощности обеспечивают связь между источниками энергии и разнообразными приложениями, включая инфраструктуру искусственного интеллекта, электромобили и мобильные устройства, а разработанная система PowerGenie способна открывать топологии, превосходящие существующие границы эффективности.

Исследователи разработали систему PowerGenie, использующую алгоритмы эволюции и машинного обучения для автоматического поиска и создания высокоэффективных схем преобразователей энергии.

Треугольники и Гауссианы: Новый Подход к Быстрой 3D-Реконструкции

Разработанный метод PLANING использует гибридное представление, сочетающее в себе треугольную геометрию для моделирования сцены и нейронные Гауссианы для рендеринга внешнего вида, что позволяет создать потоковую систему реконструкции из монокулярных видеопоследовательностей, включающую отслеживание камеры, глобальную оптимизацию поз и маппер, использующий эффективную стратегию инициализации примитивов для снижения избыточности и последующего применения планарных абстракций для различных задач.

Исследователи представили гибридное представление, объединяющее треугольные сетки и нейронные Гауссианы, для создания детализированных и быстро отображаемых 3D-моделей.

Искусственный интеллект: между пользой и риском

Рисунок 3 представляет собой систематизацию рисков и вреда, связанных с искусственным интеллектом, демонстрируя, что потенциальные негативные последствия охватывают широкий спектр, от предвзятости и дискриминации до манипулирования информацией и угроз безопасности, что требует комплексного подхода к их смягчению и предотвращению.

Новая работа предлагает переосмыслить управление ответственностью в сфере ИИ, рассматривая его не как поиск компромиссов, а как управление неизбежными противоречиями.

Малые модели – большая опасность: новые угрозы от доступного ИИ

Симуляционное исследование вычислительных ресурсов, необходимых для осуществления атак с использованием моделей искусственного интеллекта с низкой вычислительной нагрузкой - дезинформации, фишинга, клонирования голоса и дипфейков - показывает, что для генерации изображений, текста и аудио требуется определенная скорость памяти и вычислительная мощность, границы которых, отображенные в виде 5-го и 95-го процентилей, позволяют оценить требуемые ресурсы, при этом производительность чипов NVIDIA V100 и Apple M2 Ultra служит ориентиром для устройств, не подпадающих под экспортный контроль.

Уменьшение размеров и повышение эффективности языковых моделей, в сочетании с доступностью вычислительных ресурсов, создают растущие риски, поскольку даже недорогое оборудование позволяет развертывать потенциально вредоносные кампании на основе ИИ.