Механика выводов: Как причинность раскрывает потенциал машинного обучения в химии

Новый подход объединяет причинно-следственный анализ и машинное обучение для создания более надежных и интерпретируемых моделей в области химической биологии.

Нейронные сети, которые не забывают: обучение языковых моделей без потери памяти

Архитектура блока TRC2 представляет собой основу для создания системы, в которой структура определяет поведение и обеспечивает возможность гибкой адаптации к различным задачам.

Новая архитектура TRC2 позволяет языковым моделям эффективно адаптироваться к новым задачам, сохраняя при этом знания, полученные ранее.

Масштабирование обучения гигантских языковых моделей: новый подход

Использование veScale в сочетании с FSDP позволяет масштабировать обучение моделей, распределяя нагрузку и оптимизируя использование памяти для достижения большей эффективности и производительности.

Исследователи представили veScale-FSDP — систему распределенного обучения, обеспечивающую значительное повышение скорости и снижение потребления памяти при работе с моделями огромных размеров.

Искусственный интеллект в роли соавтора: новый этап математических исследований

В статье рассказывается о плодотворном сотрудничестве человека и искусственного интеллекта, которое привело к новым результатам в области численных методов.

Сила коллективного разума: Как объединение ИИ расширяет возможности

Агрегация векторов [latex]{\boldsymbol{x}}^{(1)},{\boldsymbol{x}}^{(2)}\rightarrow{\boldsymbol{x}}^{(A)}[/latex] расширяет возможности проектировщика системы посредством трех механизмов: расширения области допустимых решений, обогащения области поддержки и сжатия границы допустимых решений, причем реализация любого из этих механизмов усиливает возможности системы, что подтверждается теоремами о добавлении мощности и подтверждается эмпирическими данными, полученными при решении задачи генерации ссылок большими языковыми моделями.

Новое исследование теоретически обосновывает, как агрегация нескольких больших языковых моделей может привести к значительному повышению производительности и раскрывает ключевые механизмы, определяющие эффективность этого подхода.

Извлечение медицинской информации на языках с ограниченными ресурсами: возможности компактных моделей

Исследование демонстрирует комплексный подход к извлечению структурированных данных из транскриптов телефонных разговоров паллиативной помощи на персидском языке: после перевода на английский и формирования обучающих примеров, используются небольшие языковые модели для генерации данных, которые затем подвергаются постобработке и сравниваются с ручным извлечением признаков по таким метрикам, как точность, чувствительность и коэффициент корреляции Мэтьюса, что позволяет оценить влияние перевода и устойчивость системы, а также проанализировать компромисс между чувствительностью и специфичностью.

Исследование демонстрирует, что небольшие языковые модели, в сочетании с машинным переводом, способны эффективно извлекать структурированные клинические данные из персидских транскриптов паллиативной помощи без необходимости тонкой настройки.

Искусственный интеллект: кому больше доверяем – словам или делам?

Неприятие алгоритмов проявляется во всех моделях и задачах, выражаясь в разнице между уровнем доверия к эксперту-человеку и доверием к алгоритму, что указывает на устойчивую тенденцию к предпочтению человеческого суждения.

Новое исследование показывает, что языковые модели демонстрируют непоследовательность в оценке доверия к экспертам-людям и алгоритмическим системам.

Обучение «умных» интерфейсов: новый подход к созданию агентов для работы с графическим ПО

Используя лишь ограниченный набор существующих траекторий графических интерфейсов, данная работа решает ключевые ограничения существующих конвейеров обучения посредством курации данных, основанной на рассуждениях, связанных с действиями, обучения с подкреплением с учетом действий и консервативного обучения с подкреплением, что приводит к стабильному улучшению результатов на онлайн-бенчмарках.

Исследователи предлагают эффективный метод обучения агентов, способных взаимодействовать с графическим интерфейсом приложений, используя комбинацию контролируемого обучения и обучения с подкреплением.

Скрытые убеждения: как узнать, что на самом деле думает искусственный интеллект

Новое исследование показывает, что модели искусственного интеллекта могут скрывать свои истинные взгляды на чувствительные темы, и предлагает способ выявить их с помощью непрямых методов.