Скрытые симметрии уравнений: новый подход к анализу данных

Анализ симметрии демонстрирует сопоставление аналитических и основанных на данных подходов, позволяющее выявить различия в их применении и эффективности.

Предложен метод автоматического выявления симметрий в дифференциальных уравнениях непосредственно из разрозненных данных, без предварительного знания о динамике системы.

Растительность под прицетом ИИ: Оценка биофизических параметров по снимкам Sentinel-2

Архитектура, представленная на рисунке, демонстрирует сквозной процесс обучения с использованием трансформер-VAE и декодера PROSAIL, обеспечивая как этап обучения, так и последующую инференцию и валидацию модели.

Новый подход, сочетающий физические модели и возможности глубокого обучения, позволяет точно оценивать ключевые характеристики растительности, используя только синтетические данные.

Разум машины: как заглянуть внутрь сложных диалогов с нейросетью

Система, представленная в работе, обеспечивает комплексное управление ключевыми компонентами машинного обучения – наборами данных, моделями и поставщиками услуг – посредством пяти основных страниц, где страница бенчмаркинга, в частности, предоставляет расширенные возможности анализа, включая настройку параметров данных, поддержку многоступенчатого рассуждения и интерактивный интерфейс для визуализации процесса принятия решений и редактирования входных и выходных данных.

Новая платформа VISTA позволяет визуализировать и анализировать процесс рассуждений больших языковых моделей в многоходовых диалогах, раскрывая логику их ответов.

Ухо и разум: Могут ли языковые модели улавливать связь звука и смысла?

Исследование фонетической иконичности в мультимодальных языковых моделях (MLLM) с использованием естественных и сконструированных миметических слов из текстовых и аудио данных в LEX-ICON позволило количественно оценить до 25 семантических измерений и выявить связь между фонемами и значениями внутри моделей посредством анализа долей внимания на разных слоях.

Новое исследование показывает, что современные мультимодальные модели способны обнаруживать фонетическую иконичность и ассоциировать звуки с определенными значениями.

Ускорение больших языковых моделей: новый подход к квантованию

Оптимизация преобразований для минимизации ошибки квантования ($||𝐗​Q​(𝐖)−𝐗𝐖||$) в матрице $k\_projweight$ первого слоя LLaMA-3-8B показала, что вращения превосходят масштабирование по каналам в снижении погрешности, при этом сохранение лишь 10% наиболее значимых пар обеспечивает выразительность, сопоставимую с полным вращением.

Исследователи разработали инновационный метод квантования весов, позволяющий существенно повысить эффективность работы больших языковых моделей без значительной потери точности.

Иллюзия Рассуждений: Почему Оценка Базовых Языковых Моделей Может Быть Обманчива

Для каждой базовой языковой модели оценивалось соотношение между долей корректно сформулированных запросов, на которые модель генерирует целевую строку, и долей некорректно сформулированных запросов, приводящих к тому же результату; модели, расположенные в верхнем правом углу графика, демонстрируют склонность к генерации целевых строк как в ответ на корректные, так и на некорректные запросы, при этом размер маркера указывает на масштаб модели.

Новое исследование показывает, что оценка способности к рассуждению у языковых моделей, не обученных следовать инструкциям, может давать неверные результаты из-за их склонности к генерации правдоподобных, но не обязательно верных ответов.

Искусственная эволюция белков: новый подход к поиску оптимальных последовательностей

Эффективность AlphaDE демонстрирует прямую зависимость от размера предобученных языковых моделей белков, при этом вариант с дообученной ESM2-35M (обозначен штриховой линией) и доверительные интервалы в 95% (отмеченные затенёнными областями) подтверждают устойчивость наблюдаемой тенденции.

Исследователи разработали инновационную систему, использующую возможности искусственного интеллекта для ускорения процесса направленной эволюции белков.