Ускорение сложных расчетов: новый подход к моделированию динамических систем

В ходе обучения архитектуры нейронной сети с двумя скрытыми слоями по 7575 нейронов каждый, при скорости обучения [latex]1\times10^{-2}[/latex], стандартизированных входных данных и без инициализации квадратичного слоя как матрицы тангенциальной жесткости, модель продемонстрировала сходимость, оптимизируясь исключительно по целевым значениям силы, в то время как потери по энергии и тангенциальной жесткости служили лишь для мониторинга процесса.

Исследователи предлагают усовершенствованный метод снижения вычислительной сложности при моделировании нелинейных структур, основанный на интеграции нейронных сетей и физических принципов.

Эволюция под контролем: эксперименты с обучением с подкреплением в генетическом программировании

В статье рассматривается попытка интеграции методов обучения с подкреплением в линейное генетическое программирование для повышения эффективности решения задач управления.

Эффективная память для больших языковых моделей: новый подход LOOKAT

Механизм внимания LOOKAT обходит стандартную процедуру деквантизации ключей перед вычислением, устраняя узкое место по пропускной способности и предлагая альтернативный подход к обработке информации.

Исследователи предлагают инновационный метод сжатия KV-кэша, позволяющий значительно уменьшить потребление памяти при работе с крупными нейронными сетями.

Нейросети нового поколения: когда меньше значит больше

Модель KAN демонстрирует способность к непрерывному обучению, успешно осваивая новые задачи при сохранении информации, полученной ранее, что подтверждает возможность построения интеллектуальных систем с расширяемыми знаниями.

Исследование показывает, что сети Kolmogorov-Arnold способны превосходить многослойные персептроны по точности и эффективности вычислений, открывая новые возможности для задач с ограниченными ресурсами.

Ускорение больших языковых моделей для периферийных устройств

Квантование моделей, оптимизированных алгоритмами Adam и Muon, демонстрирует снижение точности на восьми контрольных примерах, за исключением SIQA, где наблюдается её увеличение, что указывает на чувствительность к методу оптимизации при снижении вычислительной точности.

Новый подход позволяет эффективно сжимать и адаптировать крупные языковые модели для работы на устройствах с ограниченными ресурсами, сохраняя при этом высокую точность.

Математические экзамены: новый вызов для искусственного интеллекта

Сравнительный анализ производительности при отклонении запросов демонстрирует, что использование полностраничного ввода обеспечивает более надежные результаты по сравнению с режимом, ориентированным на отдельные вопросы.

Исследователи представили масштабный набор данных MathDoc для оценки способности моделей извлекать информацию из реальных экзаменационных работ по математике и распознавать неполные или нечеткие данные.

Искусственный интеллект для микроэлектроники: новый подход к моделированию полупроводников

Набор примеров из эталонного набора TCAD демонстрирует широкий спектр типов вопросов - от операционных и концептуальных до относящихся к моделированию, - что подчеркивает глубину и разнообразие понимания предметной области, необходимого для создания высокоэффективных моделей.

Исследователи разработали метод создания специализированных языковых моделей, способных генерировать исполняемый код для сложных инженерных задач, даже при ограниченном объеме данных.

Адаптивные фильтры нового поколения: скорость, точность и устойчивость к шумам

Структура нелинейных субполосных алгоритмов NKP демонстрирует возможность организации вычислений, позволяющую эффективно обрабатывать сигналы в частотной области и обеспечивать адаптивность к различным характеристикам входных данных.

В статье представлен инновационный подход к адаптивной фильтрации, основанный на разложении в произведение Кронекера, позволяющий значительно повысить эффективность и надежность систем шумоподавления и эхокомпенсации.