Язык без правил: Как нейросети учатся грамматике

Оценка суждений больших языковых моделей (LLM) о паразитических конструкциях выявила различия в точности в зависимости от языка и используемой модели, что подчеркивает влияние лингвистической специфики на эффективность подобных систем.

Новое исследование показывает, что большие языковые модели способны осваивать сложные грамматические конструкции, такие как инверсия подлежащего и вспомогательного глагола, исключительно на основе статистического анализа данных.

Французский для «Визуального Языка»: Как обучить модель понимать другой мир

Процесс дообучения демонстрирует снижение функции потерь при переходе от предварительно обученной английской модели к дообучению на французском языке, что указывает на успешную адаптацию к новому языковому домену.

Новое исследование показывает, что адаптация англоязычных моделей, объединяющих зрение и язык, к французскому языку может быть эффективнее при помощи простого перевода данных, чем при использовании сложных методов дообучения.

Ядро молекулы под наблюдением: новый взгляд на спектроскопию

Ядерный магнитный резонанс на наноуровне, примененный к одиночному мелко залегающему центру PL6, продемонстрировал когерентные спады в спектрах $^1$H ЯМР, зависящие от приложенного магнитного поля, что позволило определить гиромагнитное отношение $γ_H = 4.25(8)$ кГц/Г и установить глубину расположения сенсора на уровне $\sim 2.00(4)$ нм, подтвержденное анализом времени когерентности, полученным посредством последовательности динамического отстройки XY8-kk.

Ученые разработали метод регистрации ядерного магнитного резонанса на уровне одиночных молекул, используя уникальные свойства кремния и цветных центров.

Подсчет в условиях локальной леммы: новые алгоритмы приближения

Исследование предлагает эффективные алгоритмы для приближенного подсчета решений в сложных вероятностных задачах, где традиционные методы оказываются неэффективными.

Интеллектуальный поиск решений: новый подход к оптимизации сложных задач

Наблюдается, что величина

Исследователи представили инновационную систему, использующую машинное обучение для значительного ускорения процесса решения задач целочисленного линейного программирования.

Рассуждения машин: как «взгляд» Vision Language Models формирует понимание

В исследовании рассматривается, могут ли отдельные головы внимания в больших визуально-языковых моделях выполнять аналогичные когнитивные функции, как и различные области человеческого мозга при ответе на сложные вопросы.

Новое исследование раскрывает, как отдельные «блоки внимания» в мультимодальных моделях отвечают за различные когнитивные функции, приближая машины к человеческому способу рассуждения.