Трансформеры: От Прогнозирования к Пониманию Причинности

Обученная для предсказания следующего шага нейронная сеть на основе архитектуры Transformer, используя запаздывающие наблюдения за временными рядами, способна не только моделировать динамические процессы, но и, посредством анализа релевантности, выявлять лежащую в их основе причинно-следственную структуру, как демонстрируется на примере системы с [latex]N=3[/latex] и окном [latex]L=3[/latex].

Новое исследование показывает, что архитектура трансформеров, изначально разработанная для обработки последовательностей, обладает неожиданной способностью выявлять причинно-следственные связи в данных временных рядов.

Нейросеть предсказывает поведение белков: новый подход к моделированию

Архитектура многомасштабной графовой нейронной сети (GNN) обучается посредством дистилляции знаний, используя предсказания вероятностей SS8-мотивов, полученные моделью ESM3 на основе аминокислотной последовательности, при этом короткодействующие сообщения передаются между всеми атомами Cα, C и N в пределах 1 нм, а длиннодействующие - только между атомами Cα на расстоянии до 2.5 нм, что позволяет сети эффективно прогнозировать структурные свойства белков.

Исследователи разработали метод, позволяющий создавать точные и эффективные модели поведения белков, используя возможности искусственного интеллекта.

Искусство обучения агентов: Создание реалистичных сред для ИИ

Обзор EnvScaler демонстрирует архитектуру, предназначенную для динамической адаптации масштаба окружающей среды, позволяя исследовать поведение агента в широком диапазоне условий и выявлять потенциальные уязвимости или неожиданные эффекты, возникающие при изменении параметров окружения.

Новая система EnvScaler позволяет автоматически генерировать сложные и разнообразные среды взаимодействия с инструментами, необходимые для эффективного обучения интеллектуальных агентов.

Автоматизация Науки: Гибкие Протоколы для Современной Лаборатории

В рамках разработанной системы PRISM намерение пользователя преобразуется в структурированные этапы протокола, которые затем детализируются в действия, понятные роботу, и итеративно уточняются посредством валидации в среде Omniverse, прежде чем быть реализованы в реальном мире посредством автоматизированного выполнения протокола Luna qPCR в автономной лаборатории.

В статье представлен подход к разработке и оптимизации научных протоколов с использованием моделирования и автоматизированных рабочих процессов.

Оценка качества портретов без обучения: новый подход на основе Vision Transformers

Исследователи представили ViTNT-FIQA — метод оценки качества изображений лиц, который не требует этапа обучения и использует стабильность признаков в архитектуре Vision Transformers.

Раскрытие личностей: Как искусственный интеллект «взломал» анонимные интервью

Новое исследование показывает, что современные ИИ-системы способны восстановить личности участников публичного датасета интервью, несмотря на предпринятые меры по анонимизации.

Интеллектуальный отбор данных: как ускорить открытие новых материалов

Активное обучение значительно снижает избыточность в материаловедческих базах данных: модели XGBoost и случайных лесов, обученные на подмножествах, отобранных с использованием стратегий, основанных на неопределённости, демонстрируют сравнимую точность прогнозирования ширины запрещенной зоны, используя лишь 10% исходного объёма данных из OQMD14, что указывает на существенный резерв избыточности; при этом, для минимизации систематических ошибок, связанных с нарушением предположения о независимой и одинаково распределённой выборке, применяется метод активного обучения, управляемый информационной энтропией (ETAL), улучшающий покрытие менее симметричных кристаллических систем в наборе дескрипторов, вдохновлённых классическим силовым полем JARVIS, и, как следствие, повышающий эффективность моделей машинного обучения, обученных на подобранных данных.

В статье представлен критический анализ методов активного обучения, применяемых в материаловедении, и их влияние на эффективность поиска и генерации данных.

Личность в диагнозе: о подводных камнях медицинских языковых моделей

В рамках исследования клинических больших языковых моделей, персоны внедряются посредством системных запросов для анализа их влияния как априорных убеждений на поведение моделей, при этом оценка осуществляется на двух клинических задачах с использованием автоматизированных метрик, качественной оценки, основанной на ранжировании, выполненном моделью, и валидации экспертами-клиницистами.

Исследование показывает, что использование «личностей» в медицинских языковых моделях может улучшить результаты в одних сценариях, но и привести к непредсказуемым последствиям в других.

Предвидеть Действия: Новая Эра Автономных Агентов

Традиционные агенты машинного обучения совершенствуются посредством дорогостоящих вычислений и внешней обратной связи, что приводит к значительным задержкам, в то время как данное исследование направлено на выявление превосходных, основанных на данных решений до их фактического выполнения, используя концепцию «скрытых приоритетов, вытекающих из данных» [latex] \implies [/latex] для повышения эффективности и скорости обучения.

Исследование показывает, что модели, способные предсказывать результаты работы алгоритмов машинного обучения без их фактического выполнения, открывают путь к созданию более эффективных и быстрых систем искусственного интеллекта.