Восполняя пробелы в знаниях: Как языковые модели учатся делать выводы
Новый подход к поисково-генеративным моделям позволяет им самостоятельно находить и проверять недостающие предпосылки для более логичных и правдивых ответов.
Новый подход к поисково-генеративным моделям позволяет им самостоятельно находить и проверять недостающие предпосылки для более логичных и правдивых ответов.
Автор: Денис Аветисян Новый взгляд на выбор базисных функций позволяет повысить точность смешанных квантово-классических расчетов. В данной работе показано, что состояния, полученные в рамках приближения Борна-Оппенгеймера, служат приближенным предпочтительным базисом для моделирования связанных электрон-ядерных процессов. Несмотря на значительный прогресс в квантовой динамике связанных систем, выбор подходящего базиса для описания движения электронов и ядер остается сложной … Читать далее
Исследователи разработали метод, использующий язык для более точной интерпретации визуальной информации и ее связи с активностью мозга.

Новый бенчмарк выявил существенные ограничения в способности современных моделей рассуждать о динамических сценах, несмотря на успехи в распознавании образов.

Исследование показывает, что большие языковые модели могут смешивать информацию о различных числовых характеристиках, приводя к непредсказуемым результатам.

Исследование показывает, что ответы больших языковых моделей могут сильно зависеть от формулировки запроса и культурного контекста.

Исследование демонстрирует, насколько сложно для современных систем искусственного интеллекта эффективно анализировать и делать выводы на основе данных, представленных в виде таблиц с неструктурированным текстом.

Новая платформа делает интерпретацию сложных нейросетей более доступной благодаря интерактивным визуализациям и объяснениям на естественном языке.

Исследователи разработали метод, позволяющий тонко настраивать личностные качества больших языковых моделей без переобучения.

Новый подход к автоматической оптимизации стратегий распределения данных позволяет значительно повысить эффективность обучения масштабных языковых моделей.