Знания в графах: как улучшить ответы больших языковых моделей

Несмотря на то, что расширение извлекаемого подграфа для SubgraphRAG закономерно повышает полноту релевантных фактов и узлов, точность предсказаний (EM Hits) в конечном итоге стабилизируется из-за добавления избыточной информации, при этом обучение на подграфах с истинными ответами демонстрирует более высокие результаты, чем обучение на кратчайших путях триплетов.

Новый подход к генерации синтетических данных позволяет создавать более точные и надежные знания для обучения и оценки языковых моделей, использующих графы знаний.

Призрачная уверенность: почему языковые модели ошибаются даже тогда, когда уверены

При отсутствии неопределённости в данных, глубинная структура многослойного перцептрона демонстрирует способность к удовлетворительной ранжировке, однако при наличии даже незначительной неоднозначности эта способность резко снижается, указывая на то, что скрытые состояния не надёжно кодируют информацию об этой неоднозначности.

Новое исследование показывает, что существующие методы оценки неопределенности больших языковых моделей оказываются неэффективными при работе с неоднозначными вопросами.

Ошибка в оценках: Как точно настроить алгоритмы стохастического градиентного спуска

На графике, отображающем зависимость ошибки выборки от размера шага для алгоритмов SG-UBU, SVRG-UBU и SAGA-UBU при различных количествах компонент (10, 50, 100, 500), наблюдается закономерность, указывающая на то, что уменьшение размера шага приводит к снижению ошибки, при этом влияние этого параметра проявляется схожим образом для всех исследуемых алгоритмов и независимо от количества компонент.

Новое исследование раскрывает фазовый переход в скорости сходимости алгоритмов, использующих уменьшение дисперсии, и предлагает критерии для оптимального выбора метода.

Квантовая связь на больших расстояниях: новый гибридный подход

Исследователи предлагают инновационную архитектуру квантовой сети, объединяющую ионы в ловушках и источники спонтанного параметрического рассеяния для ускорения генерации запутанности.