Разум машины: как заглянуть внутрь сложных диалогов с нейросетью

Система, представленная в работе, обеспечивает комплексное управление ключевыми компонентами машинного обучения – наборами данных, моделями и поставщиками услуг – посредством пяти основных страниц, где страница бенчмаркинга, в частности, предоставляет расширенные возможности анализа, включая настройку параметров данных, поддержку многоступенчатого рассуждения и интерактивный интерфейс для визуализации процесса принятия решений и редактирования входных и выходных данных.

Новая платформа VISTA позволяет визуализировать и анализировать процесс рассуждений больших языковых моделей в многоходовых диалогах, раскрывая логику их ответов.

Ухо и разум: Могут ли языковые модели улавливать связь звука и смысла?

Исследование фонетической иконичности в мультимодальных языковых моделях (MLLM) с использованием естественных и сконструированных миметических слов из текстовых и аудио данных в LEX-ICON позволило количественно оценить до 25 семантических измерений и выявить связь между фонемами и значениями внутри моделей посредством анализа долей внимания на разных слоях.

Новое исследование показывает, что современные мультимодальные модели способны обнаруживать фонетическую иконичность и ассоциировать звуки с определенными значениями.

Иллюзия Рассуждений: Почему Оценка Базовых Языковых Моделей Может Быть Обманчива

Для каждой базовой языковой модели оценивалось соотношение между долей корректно сформулированных запросов, на которые модель генерирует целевую строку, и долей некорректно сформулированных запросов, приводящих к тому же результату; модели, расположенные в верхнем правом углу графика, демонстрируют склонность к генерации целевых строк как в ответ на корректные, так и на некорректные запросы, при этом размер маркера указывает на масштаб модели.

Новое исследование показывает, что оценка способности к рассуждению у языковых моделей, не обученных следовать инструкциям, может давать неверные результаты из-за их склонности к генерации правдоподобных, но не обязательно верных ответов.

Искусственная эволюция белков: новый подход к поиску оптимальных последовательностей

Эффективность AlphaDE демонстрирует прямую зависимость от размера предобученных языковых моделей белков, при этом вариант с дообученной ESM2-35M (обозначен штриховой линией) и доверительные интервалы в 95% (отмеченные затенёнными областями) подтверждают устойчивость наблюдаемой тенденции.

Исследователи разработали инновационную систему, использующую возможности искусственного интеллекта для ускорения процесса направленной эволюции белков.

Мультимодальный интеллект: Новый подход к анализу длинных текстов

Единая модель MLLM объединяет извлечение и генерацию информации для понимания длинных документов, используя признаки ранних слоёв для эффективного поиска доказательств в процессе рассуждений и обеспечивая точное и быстрое понимание текста.

Исследователи предлагают инновационную систему, объединяющую поиск и генерацию информации для более эффективной обработки больших объемов данных.

Границы жанров: Как компьютер видит разницу между «серьезной» и «популярной» литературой

Гистограммы языковых особенностей литературной и жанровой прозы демонстрируют различия в стилистике между авторами разного пола, указывая на то, как гендерные факторы могут влиять на выбор лексики и построение предложений.

Новое исследование показывает, как вычислительные методы позволяют анализировать стилистические особенности и повествовательные приемы, размывая границы между «высокой» и «массовой» литературой.

Многоликий критик: оценка возможностей мультимодальных моделей

В разработанной системе MM-Critic оценка многомерного анализа включает в себя бинарное определение корректности и текстовую обратную связь, измеряемые показателями точности критики и оценки критики, в то время как корректирующая критика и сравнительная критика оцениваются через корректирующую оценку критики и точность предпочтений, соответственно.

Новый бенчмарк MM-Critic позволяет комплексно оценить способность больших мультимодальных моделей давать развернутые и обоснованные критические оценки.

Резонанс мышления: как мозг находит причинно-следственные связи

Параметр порядка Курамото, отражающий синхронизацию фаз, демонстрирует чёткую временную структуру с провалами десинхронизации около 0.1 секунды и множественными резонансными пиками, в то время как традиционный анализ потенциалов, зарегистрированных на поверхности головы, показывает лишь шум, указывая на то, что он скрывает лежащую в основе фазовую организацию сигналов мозга.

Новое исследование показывает, что синхронизация нейронных колебаний является ключевым фактором в понимании того, как мы распознаем причинно-следственные связи в окружающем мире.

Оценка надежности исследований: новый датасет для анализа цитирований

На основе анализа производительности тонко настроенных больших языковых моделей (LLM) на датасете CC30k, исследование демонстрирует, что увеличение объема обучающих данных (до 3000 цитат, по 1000 из каждой категории ROS) последовательно улучшает точность классификации тональности, при этом тенденции производительности в сценариях few-shot обучения (например, для Qwen, обозначенные пунктирной линией) отражают общую зависимость от объёма данных.

Представлен масштабный набор данных CC30k, предназначенный для автоматической оценки надежности научных работ на основе анализа контекста цитирований.