Трансформация нейросетей: от плотных моделей к разреженным экспертам без обучения
Новый подход позволяет преобразовать существующие нейронные сети в архитектуру Mixture-of-Experts, снижая количество параметров без потери производительности.
Новый подход позволяет преобразовать существующие нейронные сети в архитектуру Mixture-of-Experts, снижая количество параметров без потери производительности.

Исследователи разработали метод, позволяющий стабильно и эффективно обновлять знания больших языковых моделей на протяжении всего их жизненного цикла.

Новое исследование предлагает метод корректировки знаний больших языковых моделей, чтобы они не предлагали устаревшие или неактуальные API для разработчиков.

Новый подход к анализу изображений микроскопии позволяет более точно и надежно выявлять антинуклеарные антитела, используя метод самообучения.

Новое исследование показывает, что современные модели, объединяющие зрение и язык, могут ошибаться в простых вопросах из-за нерелевантных визуальных элементов.

Исследование демонстрирует, как алгоритм Fast-mRMR позволяет более эффективно выявлять ключевые гены, особенно при ограниченном объеме данных и в контексте факторов, таких как диетические ограничения.

Новое исследование показывает, как обогащение данных обучения информацией о метаданных может значительно повысить скорость и качество освоения языковых моделей.
В статье предпринята попытка переосмыслить знаменитый тест Тьюринга, отстаивая его значимость в контексте развития искусственного интеллекта и машинной лингвистики.

Исследователи представили метод, позволяющий более точно сопоставлять изображения и текстовые запросы, повышая эффективность мультимодальных моделей.

Исследователи разработали систему, которая активно анализирует изображения, чтобы находить редкие объекты, не полагаясь на сложные языковые модели.