Вода под микроскопом: как машинное обучение предсказывает таяние льда

Разность химических потенциалов льда Ih и воды, рассчитанная с использованием моделей, основанных на теории функционала плотности, демонстрирует температурные точки, в которых [latex]\Delta\mu\_{\mathrm{ice}-\mathrm{liq}}(T)=0[/latex], определяющие температуры плавления [latex]T\_{\mathrm{m}}[/latex].

Новое исследование сравнивает точность различных методов машинного обучения при моделировании поведения воды и льда, раскрывая ключевые факторы, влияющие на предсказание фазовых переходов.

Прогнозирование структуры белков: новый масштаб

Разработанная модель SeedFold, масштабируемая по ширине ([latex]Pairformer[/latex]), архитектуре - за счет линейного треугольного внимания, снижающего вычислительную сложность, и объему данных - благодаря дистилляции до 26.5 миллионов примеров, демонстрирует передовые результаты на FoldBench, превосходя AlphaFold3 и другие открытые модели в различных задачах, при этом SeedFold с шириной 512 использует стандартное треугольное внимание, а SeedFold-Linear с шириной 384 - линейное.

Исследователи представили SeedFold — модель, способную предсказывать структуру биомолекул с беспрецедентной эффективностью благодаря масштабированию данных и инновационной архитектуре.

Визуальный интеллект на службе качества: новый подход к обнаружению дефектов

Набор данных IMDD-1M представляет собой масштабную основу для развития моделей, объединяющих зрение и язык, в сфере промышленного контроля, содержащую разнообразные пары «изображение-текст» из различных отраслей и снабжённую экспертными аннотациями, детализирующими типы дефектов, материалы и контекст производства.

Исследователи представили масштабный мультимодальный датасет и модель, позволяющие значительно улучшить выявление дефектов в промышленности, используя возможности генеративного искусственного интеллекта.

Обучение в контексте: новый взгляд на персонализацию образования

Статья представляет комплексный подход к созданию интеллектуальных образовательных систем, способных учитывать когнитивные, эмоциональные и социокультурные факторы, влияющие на процесс обучения.

Биомолекулярные связи: новый тест для искусственного интеллекта

Создание BIOME-Bench включает в себя последовательное применение языковых моделей: сначала осуществляется поиск в PubMed по запросам, основанным на MeSH-терминам, с последующей фильтрацией релевантности, затем извлекаются и стандартизируются сущности, после чего формируется осведомленный о состоянии знаний граф с привлечением экспертной верификации, что в конечном итоге позволяет сформулировать эталонный набор данных для решения задач вывода о взаимодействии биомолекул и выяснения механизмов мультиимиксных путей.

Исследователи представили комплексный набор данных, позволяющий оценить способность моделей машинного обучения понимать сложные биологические процессы и взаимосвязи.

Аудио как язык: новая эра в обработке речи

Архитектура MiMo-Audio представляет собой сложную систему, предназначенную для моделирования и манипулирования звуком, сочетающую в себе различные модули и слои для эффективной обработки и генерации аудиосигналов, что позволяет ей достигать высокой точности и гибкости в задачах, связанных со звуком.

Исследователи показали, что масштабное обучение моделей предсказанию следующего аудио-токена открывает путь к созданию систем, способных к обучению в процессе использования и превосходящих закрытые аналоги.

Белки по заказу: новый подход к созданию молекулярных связывателей

Для сложных мультицепочечных мишеней - H1 (димер), VEGF-A (димер) и TNF-αα (тример) - SeedProteo успешно сгенерировал связывающие молекулы (изображены пурпурным цветом), соответствующие заданным критериям успешности моделирования in silico.

Исследователи представили SeedProteo — модель, позволяющую конструировать белки с заданными свойствами, используя возможности диффузионных моделей и всесторонний учёт атомной структуры.

Языковые модели и геометрия вероятностного мышления

Модель Pythia-12B демонстрирует возможности байесовской геометрии в задачах, требующих анализа данных в больших масштабах, что позволяет ей эффективно оперировать сложными зависимостями и неопределенностями.

Новое исследование показывает, что большие языковые модели демонстрируют структуру, согласующуюся с принципами байесовского вывода, организуя неопределенность в рамках низкоразмерных ‘многообразий ценностей’.