Нейросети учатся распознавать болезни мозга, не забывая прошлое

Конвейер непрерывного обучения преобразует необработанные данные rs-fMRI в входные данные для задачи классификации, позволяя системе адаптироваться и совершенствоваться в процессе работы с данными нейронной активности.

Новый подход к анализу фМРТ-данных позволяет обучать модели распознаванию психических расстройств, сохраняя знания, полученные на предыдущих наборах данных.

Сборка конвейера: эффективное обслуживание больших языковых моделей

После размещения блоков, резервирование кэша предоставляет возможности для дальнейшей оптимизации: для множества [latex]\mathcal{J}=\{j\_{1},\ldots,j\_{5}\}[/latex], при [latex]L=3[/latex], [latex]s\_{m}=1[/latex], [latex]s\_{c}=0.1[/latex], [latex]M\_{j}=3[/latex] если [latex]j=j\_{2}[/latex] и 2 в противном случае, а также [latex]\tau^{c}\_{j}=2[/latex] если [latex]j=j\_{2}[/latex] и 1 в противном случае, при условии [latex]\tau^{p}\_{j\_{l}}=l\epsilon[/latex] для [latex]0<ϵ≪1[/latex], алгоритм 1 конструирует цепочки при [latex]c=1[/latex], демонстрируя все возможные варианты цепочек при заданном размещении блоков.

В статье представлена новая стратегия распределения ресурсов и балансировки нагрузки для оптимизации работы с большими языковыми моделями, использующими параллелизм конвейера.

Редкие болезни и искусственный интеллект: новые возможности общения с пациентами

Исследование метаданных публикаций, посвященных применению больших языковых моделей (LLM) в коммуникации и обучении пациентов с редкими заболеваниями, демонстрирует стремительное развитие этой области, особенно в 2024 и 2025 годах, с явным преобладанием моделей семейства GPT, фокусировкой на задачах вопросно-ответных систем и оценкой точности, при этом разнообразие источников данных и ориентированность оценки на потребности пациентов остаются недостаточно изученными аспектами.

Обзор показывает, как современные языковые модели могут помочь в информировании и поддержке людей, страдающих редкими заболеваниями.

Сила в Модели: Ограничения Оптимизации в Математических Задачах

Масштабирование нейронной сети за пределы доступных вычислительных ресурсов оказывается контрпродуктивным: хотя модель [latex]gpt-oss-{20}b[/latex] демонстрирует точность [latex]0.61[/latex] и оценку в 31.0 при [latex]N=8[/latex], увеличение до [latex]N=32[/latex] снижает эти показатели до 26, в то время как разница в 8 баллов между [latex]gpt-oss-{120}b[/latex] ([latex]0.69[/latex], 39.3) и [latex]gpt-oss-{20}b[/latex] ([latex]0.61[/latex], 31.0) значительно превосходит любые улучшения, достигнутые оптимизацией запросов.

Новое исследование показывает, что возможности самой языковой модели являются определяющим фактором в решении математических задач, а оптимизация запросов и методов вывода дает лишь незначительный эффект.

Разумные агенты: Новая эра глубоких исследований

Система MindDR-v1.5 демонстрирует превосходство над существующими DR-системами, добиваясь наивысших результатов по всем пяти метрикам, оцениваемым на общедоступном рейтинге DeepResearch-Benchmark.

Представлен MindDR — экономичный фреймворк для глубоких исследований, использующий многоагентные системы и достигающий передовых результатов с моделями порядка 30 миллиардов параметров.

Обучение без Забывания: Новый Подход к Потоковой Обработке Данных

В разработанной структуре, именуемой OTC, последовательно выполняется характеристика каждого класса посредством смеси моделей и множественных центроидов во времени, где отображение данных в латентном пространстве сопоставляется с соответствующей гауссовой смесью моделей, осваиваемой в режиме онлайн, а затем применяется динамическая поддержка с выбором буфера памяти для усиления обучения представлений в модели инкрементального обучения классам, обеспечивая сближение представлений одного класса и удаление представлений разных классов.

Исследователи разработали метод, использующий оптимальный транспорт для адаптации скрытого пространства и эффективного обучения модели на постоянно поступающих данных без потери ранее полученных знаний.

Память извлечённых знаний: новый подход к рассуждениям в больших языковых моделях

Иерархическая организация компьютерной памяти находит поразительное отражение в процессе текстового рассуждения, где функции извлечения информации выступают в роли своеобразного аппаратного кэша, обеспечивающего быстрый доступ к релевантным данным для логических операций.

Исследователи предлагают использовать извлечение информации как динамический слой памяти для повышения точности и эффективности логических выводов в сложных задачах.

Обучение ИИ: Новый подход к пониманию человеческих предпочтений

На рисунке представлено сравнение моделей C2 и Reasoning RM, сопоставленных по вычислительным ресурсам, при использовании мажоритарного голосования на RewardBench, где средние значения и стандартные отклонения рассчитаны на основе трех повторных запусков.

Исследователи разработали масштабируемый фреймворк C2, позволяющий более эффективно согласовывать поведение больших языковых моделей с человеческими ценностями.