Умная генерация текста: как сократить расходы на большие языковые модели

Различные провайдеры демонстрируют неоднородную экономию токенов при использовании идентичных стратегий маршрутизации, что связано со специфическими особенностями генерации ответов каждым из них; в частности, модель на основе многослойного перцептрона (MLP) обеспечивает снижение количества токенов на 33.0% для OpenAI, 33.9% для Gemini и 32.6% для Claude по сравнению с базовым уровнем, характеризующимся максимальной детализацией.

Новый подход к динамическому выбору шаблонов позволяет снизить стоимость работы с большими языковыми моделями, не жертвуя качеством генерируемого текста.

Головоломки для машин: как языковые модели решают орфографические задачи

Калибровка сложности решаемых задач для моделей искусственного интеллекта показывает, что разница в производительности между простыми и сложными головоломками значительно варьируется в зависимости от вычислительной мощности модели - для Qwen-4B этот показатель составляет 19-кратное отличие, в то время как для GPT-5-mini - всего 2,5-кратное, при этом корреляция между калибровкой и фактической сложностью задач остается умеренной (r=0.24-0.38), с лучшими показателями у проприетарных моделей.

Новое исследование показывает, как крупные языковые модели справляются с ограничениями, связанными с орфографией, при решении словесных головоломок.

3D-модели на службе у края: сжатие интеллекта для мобильных устройств

Новый подход позволяет переносить мощные трехмерные модели искусственного интеллекта на устройства с ограниченными ресурсами, открывая возможности для применения в реальном времени.

Ускорение решения эллиптических уравнений с помощью изогометрического анализа

Новый подход к построению предварителей алгебраической многосеточной схемы позволяет существенно повысить скорость решения систем линейных уравнений, возникающих при дискретизации эллиптических уравнений методом изогометрического анализа.

По следу опасных рассуждений: новый подход к оценке безопасности мультимодальных моделей

Анализ и суждение, представленные GuardTrace-VL, демонстрируют способность системы к выделению ключевых аспектов и формированию обоснованных выводов.

Исследователи разработали метод и инструмент для выявления потенциально небезопасных этапов в процессе рассуждений мультимодальных моделей, а не только оценки конечного результата.

Отражения культуры: Как языковые модели рассказывают истории

Исследование выявило категории культурной дезинформации посредством фокус-групп и опросов, что позволило создать таксономию TALES-Tax, а последующее масштабное аннотирование данных обеспечило количественную оценку частоты этих искажений и построение TALES-QA - набора данных для оценки культурной осведомленности языковых моделей.

Новое исследование анализирует, насколько точно и беспристрастно большие языковые модели воспроизводят культурные особенности в сгенерированных повествованиях.

Электронные медкарты: как научить компьютер понимать врачебные запросы

Предыдущие разработки, такие как EHRSQL, ограничивались исключительно табличными данными, в то время как данное исследование вводит в рассмотрение текстовую информацию внутри таблиц и использует мультимодальные взаимодействия для формирования запросов.

Новая разработка позволяет преобразовывать текстовые запросы врачей в SQL-запросы для работы с данными электронных медицинских карт, объединяя текстовую и табличную информацию.

Восстановление формы объекта по рассеянным волнам: новый подход с использованием нейросетей

Электромагнитное рассеяние исследуется на примере двусвязного магнитодиэлектрического цилиндра, демонстрируя трёхмерную структуру и поперечное сечение для анализа распределения поля.

В статье представлен инновационный метод реконструкции формы и свойств электромагнитных препятствий по данным рассеянного поля, основанный на глубоком обучении.