Ошибка в оценках: Как точно настроить алгоритмы стохастического градиентного спуска

Новое исследование раскрывает фазовый переход в скорости сходимости алгоритмов, использующих уменьшение дисперсии, и предлагает критерии для оптимального выбора метода.







