Предсказание способностей больших языковых моделей: новый подход

Для предсказания недостающих оценок новых моделей, система STAR объединяет статистические ожидания с логическим выводом, обеспечивая точные и интерпретируемые результаты.

Исследователи предлагают инновационную систему для оценки и прогнозирования производительности сложных нейросетей, основанную на сочетании статистического анализа и моделирования поведения.

Долгая память нейросетей: новый подход к обработке огромных текстов

Модель MiniCPM-SALA, основанная на промежуточном контрольном пункте MiniCPM-4.0, использует эффективную гибридную архитектуру, сочетающую модули InfLLM-V2 и Lightning Attention в соотношении 1:3, и преобразуется в разреженную линейную гибридную модель посредством непрерывного обучения.

Исследователи представили MiniCPM-SALA — модель, сочетающую в себе разреженное и линейное внимание для повышения скорости и эффективности обработки очень длинных последовательностей данных.

Компьютерная томография с фотонным счётом: новый взгляд на дифференцируемое изображение

В статье представлена методика, позволяющая оптимизировать весь процесс компьютерной томографии с фотонным счётом, открывая возможности для автоматической калибровки и улучшения качества изображений.

Глубже в размышлениях: новый подход к исследованию возможностей языковых моделей

Стимулирование модели к более продолжительному рассуждению демонстрирует прирост производительности, однако сопутствующее снижение коэффициента уникальности [latex]R_{context}[/latex] указывает на склонность к повторениям.

Исследователи предлагают метод, стимулирующий языковые модели к более полному осмыслению задачи, что позволяет им находить более эффективные решения в сложных сценариях.

Квантовые петли в распадах тяжелых кварков: новый уровень точности

На основе численного анализа, представленного на рисунке, величины [latex]W_1[/latex], [latex]W_2[/latex], [latex]W_3[/latex], [latex]W_4[/latex] и [latex]W_5[/latex] демонстрируют характерные распределения в фазовом пространстве [latex]R_2[/latex] с точностью до [latex]\mathcal{O}(\alpha_s^3)[/latex], что подтверждает точность моделирования распада тяжелых частиц на легкие с полулептонными каналами на следующем к следующему к следующему ведущему порядку в квантовой хромодинамике.

Исследователи впервые выполнили полное вычисление функций структуры в распадах тяжелых кварков с полулептонными распадами до следующего за следующим за следующим ведущим порядком (N3LO).

Юрист нового поколения: Искусственный интеллект на страже закона

Автономный агент для юридических исследований, LawThinker, реализует стратегию «Исследование-Проверка-Запоминание», объединяя итеративное исследование с явной проверкой в процессе рассуждений и тесным взаимодействием с модулем памяти, что обеспечивает надежность и обоснованность полученных результатов.

Исследователи представили систему LawThinker, способную самостоятельно проводить юридические исследования и обеспечивать соблюдение процессуальных норм в динамично меняющейся судебной практике.

Визуальный интеллект для электронной коммерции: как обучить модели понимать покупки

Адаптированные для электронной коммерции визуально-языковые модели демонстрируют повышенную точность извлечения атрибутов товаров, в отличие от LLaVA-OneVision аналогичного размера, при этом ошибочные предсказания, не связанные с изображением или валидными характеристиками товара, выделены красным цветом для наглядности.

В новой работе исследователи предлагают проверенный способ адаптации моделей, сочетающих зрение и язык, для решения задач, возникающих в онлайн-торговле.

Искусственный интеллект, который учится думать: новый подход к адаптивному обучению

Обучение встроено в полный конвейер обработки, имитирующий человеческое восприятие, что позволяет системе не просто реагировать на данные, а интегрировать их в сложный процесс принятия решений, подобно тому, как это происходит в живых организмах.

В статье предлагается инновационная система непрерывного обучения, позволяющая ИИ не только накапливать знания, но и совершенствовать сам процесс мышления.