ИИ трейдинг: когда новости бьют по техническим индикаторам, а обучение с подкреплением пытается удержаться на ногах.

Автор: Денис Аветисян


Все давно знают: рынок эффективен, а попытки постоянно превзойти его — это, мягко говоря, утопия. Десятилетия исследований и сложнейшие алгоритмы лишь подтверждают эту закономерность. Но что, если все эти модели строятся на устаревших данных и игнорируют океан информации, скрытый в новостных лентах и социальных сетях? Именно здесь, когда мы уже почти смирились с неизбежным, появляется работа “Integrating Large Language Models and Reinforcement Learning for Sentiment-Driven Quantitative Trading”, предлагающая заглянуть в этот хаос и научиться извлекать прибыль из настроений толпы. Но действительно ли можно построить стабильную торговую стратегию на эфемерных эмоциях, или это очередная иллюзия, подкрепленная красивыми графиками и оптимистичными бэктестами?

🚀 Квантовые новости

Подключайся к потоку квантовых мемов, теорий и откровений из параллельной вселенной.
Только сингулярные инсайты — никакой скуки.

Присоединиться к каналу
Иллюстрация торговой системы – элегантная схема, которая неизбежно столкнется с суровой реальностью эксплуатации. Посмотрим, как долго продержится эта красота под натиском продакшена.
Иллюстрация торговой системы – элегантная схема, которая неизбежно столкнется с суровой реальностью эксплуатации. Посмотрим, как долго продержится эта красота под натиском продакшена.

Иллюзии Эффективности Рынка

Несмотря на десятилетия исследований, последовательное превосходство над рынком остаётся задачей, граничащей с невозможным. Это заставляет усомниться в эффективности традиционных стратегий, которые, как правило, опираются на исторические данные и технические индикаторы. Как будто мы пытаемся предсказать погоду, изучая только старые метеорологические сводки.

Традиционные методы, по сути, предполагают, что рынок уже учел всю доступную информацию. Это, скажем так, удобное заблуждение, которое позволяет строить модели, но редко приносит реальную прибыль. Предположение об эффективности рынка, если его перефразировать, означает, что найти информацию, способную принести аномально высокую доходность, практически невозможно. И всё же, мы продолжаем искать.

Мы строим сложные системы, оптимизируем параметры, надеемся на случайность. Архитектура, как известно, это не схема, а компромисс, переживший деплой. И чем сложнее система, тем больше в ней потенциальных точек отказа. Оптимизировано? Возможно. Но всё, что оптимизировано, рано или поздно оптимизируют обратно. Рынок всегда найдет способ сломать элегантную теорию.

Успешная идентификация прибыльных торговых возможностей требует выхода за рамки чисто количественных методов. Необходимо признать, что информация, скрытая в текстовых источниках, может содержать ценные сведения, упущенные из виду традиционными подходами. Это как пытаться понять картину, изучая только её пиксели. Нам нужны смыслы, контекст, оттенки. Необходим переход к альтернативным источникам данных, которые могут раскрыть новые перспективы и помочь в принятии более обоснованных инвестиционных решений.

Мы не рефакторим код — мы реанимируем надежду. Иногда кажется, что рынок — это не игра, а непрекращающийся хаос. Но, возможно, именно в этом хаосе и кроется ключ к успеху. И задача исследователей — найти этот ключ, даже если для этого придется пересмотреть все свои представления о том, как работает рынок.

Погоня за Сигналом в Шумном Мире

Анализ тональности, или, проще говоря, попытка количественно оценить субъективные мнения из новостей и социальных сетей, представляется нам очередным способом извлечь хоть какую-то пользу из потока информации. Все эти обещания выявить ‘движущие рынком’ инсайты… звучит как попытка превратить шум в сигнал. И, как показывает опыт, чем сложнее алгоритм, тем больше вероятность, что он просто переобучится на исторических данных и сломается при первом же отклонении от нормы.

Большие языковые модели (LLM) призваны усложнить эту задачу, добавив некую глубину понимания контекста и нюансов. Ну, как будто простого распознавания положительных и отрицательных слов было недостаточно. Вместо того, чтобы решать реальные проблемы, они создают новые. По сути, это ещё один уровень абстракции, который нужно поддерживать и отлаживать. Всё это звучит красиво в академических статьях, но в реальной жизни всё сводится к постоянным миграциям и патчам.

FinGPT, эта специфическая языковая модель, заточенная под финансовые тексты, выглядит как очередная попытка создать ‘серебряную пулю’. Предобучение на релевантных данных – это, конечно, хорошо, но кто-нибудь подумал о том, как эта модель будет реагировать на нестандартные формулировки или сарказм? Мы подозреваем, что документация по FinGPT – это форма коллективного самообмана, в которой описываются идеальные сценарии, а не реальные проблемы, с которыми сталкиваются пользователи.

В конечном итоге, использование LLM – это способ получить доступ к сигналам, которые ранее были недоступны. Идея в том, чтобы выжать хоть что-то полезное из этого информационного потока, даже если это всего лишь небольшое улучшение производительности торговой стратегии. Если баг воспроизводится — значит, у нас стабильная система. Каждая ‘революционная’ технология завтра станет техдолгом, но пока что, это, возможно, способ заработать немного больше денег. В конце концов, все мы здесь ради прибыли, не так ли?

Обучение с Подкреплением: Новая Надежда или Старый Трюк?

Авторы, как и все, кто долго возится с автоматизированной торговлей, прекрасно понимают: каждая новая модель – это просто более изощрённый способ отложить неизбежное. Но, что поделать, нужно же что-то делать. В этой работе они предприняли попытку уйти от статических правил, заменяя их системой, способной адаптироваться к меняющимся условиям рынка. Идея проста, как все гениальное: использовать обучение с подкреплением (RL). Вместо того, чтобы вручную настраивать параметры, RL позволяет агенту учиться на собственных ошибках и постепенно находить оптимальную стратегию.

Выбор алгоритма, как всегда, был компромиссом. Они остановились на TD3 – алгоритме, позволяющем непрерывно управлять действиями. Это важно, потому что рынок не стоит на месте, и портфель требует постоянной корректировки. TD3 позволяет агенту плавно менять позиции, избегая резких движений, которые могут привести к убыткам. В конце концов, задача не в том, чтобы выиграть каждый день, а в том, чтобы выжить в долгосрочной перспективе.

Реализация стратегии была относительно проста. Они использовали подход ‘длинные-короткие позиции’, пытаясь выявить активы, которые, по их мнению, вырастут в цене (длинные позиции), и активы, которые, по их мнению, упадут в цене (короткие позиции). RL-агент анализировал данные о ценах, объёмах торгов и, конечно же, настроениях, извлечённых из новостных статей. Задача агента – определить, какие активы следует покупать, а какие – продавать.

В конечном итоге, цель заключалась в том, чтобы объединить возможности анализа настроений с гибкостью RL-управляемой стратегии ‘длинные-короткие позиции’. Идея в том, что RL-агент сможет научиться использовать информацию о настроениях для повышения прибыльности и снижения рисков. Впрочем, как показывает опыт, даже самые умные алгоритмы не застрахованы от неожиданностей. Рынок всегда найдёт способ удивить.

Портфельный рост TD3 против стратегии удержания (январь 2024 – январь 2025)
Портфельный рост TD3 против стратегии удержания (январь 2024 – январь 2025)

Что ж, посмотрим, что из этого выйдет. В конце концов, все мы здесь, чтобы учиться на своих ошибках. И, поверьте, ошибок будет предостаточно.

Вневыборочное Тестирование: Жизнеспособность или Иллюзия?

Результаты вневыборочного тестирования продемонстрировали жизнеспособность разработанной торговой стратегии, что указывает на её способность к обобщению за пределы обучающих данных. Ну, то есть, она не развалилась сразу после деплоя — уже неплохо. В наше время это почти чудо.

Коэффициент Шарпа, мера доходности с поправкой на риск, предоставил количественную оценку эффективности стратегии. И, как обычно, все эти красивые цифры не гарантируют, что она не начнет генерировать убытки в самый неподходящий момент. Мы же все знаем, как эти коэффициенты любят обманывать.

Важно отметить, что наблюдаемые стратегии демонстрировали ограниченную подверженность факторному риску, что указывает на потенциал генерации альфы — доходности, не связанной с систематическими факторами риска. Да, конечно, альфа. Как будто кто-то действительно верит в её существование. Обычно это просто случайность, замаскированная под закономерность.

Эти результаты позволяют предположить, что интеграция анализа настроений и обучения с подкреплением может создать торговые стратегии, которые постоянно превосходят традиционные методы, даже с учетом транзакционных издержек и оборачиваемости портфеля. Хотя, будем честны, любая автоматизация рано или поздно сломается. Главное — вовремя сделать бэкап и подготовить план эвакуации.

Результаты полномасштабного тестирования стратегии без учета транзакционных издержек
Результаты полномасштабного тестирования стратегии без учета транзакционных издержек

Впрочем, давайте не будем слишком оптимистичны. Мы все знаем, что рынок всегда найдет способ удивить нас. И, скорее всего, это будет что-то неприятное. Поэтому, прежде чем запускать эту стратегию в продакшн, я бы рекомендовал ещё раз проверить все тесты и убедиться, что у нас есть достаточно ресурсов для устранения неполадок. И, да, не забудьте про кофе. Его понадобится много.

В очередной раз наблюдаем, как энтузиасты пытаются извлечь прибыль из хаоса. Интеграция LLM и обучения с подкреплением – это, конечно, интересно, но давайте будем реалистами. Рынок всегда найдёт способ сломать элегантную теорию, и эта стратегия, как и все остальные, рано или поздно станет лишь источником новых проблем. Мы постоянно изобретаем костыли, маскируя их под инновации. Главное, чтобы к моменту неизбежного коллапса у нас был план Б, а лучше – план В, Г и Д. Как говорится, нам не нужно больше микросервисов — нам нужно меньше иллюзий.

Что дальше?

Итак, мы научили машину торговать, опираясь на настроение толпы, извлеченное из бесконечного потока новостей. Прекрасно. Как будто недостаток случайности на рынке был нашей главной проблемой. Не сомневаюсь, через полгода мы будем бороться с переоптимизацией, когда каждая модель будет предсказывать только то, что уже произошло, а любые отклонения от исторической нормы будут восприниматься как сигнал к панике. Наша CI — это храм, в котором мы молимся, чтобы ничего не сломалось, и чтобы этот новоиспеченный бог рынка не решил нас наказать.

Более того, не стоит забывать о фундаментальной проблеме: документация — это миф, созданный менеджерами. Кто будет поддерживать эту сложную систему, когда автор уйдет в отпуск, а исходный код превратится в нечитаемый клубок зависимостей? Каждая «революционная» технология завтра станет техдолгом. Продакшен всегда найдёт способ сломать элегантную теорию.

Наверное, следующим шагом будет интеграция с ещё более сложными моделями, возможно, с генеративными, чтобы машина сама придумывала новости, которые будут влиять на рынок. Замкнутый круг. И все это ради того, чтобы немного улучшить Sharpe ratio, который через год, скорее всего, вернется к среднему.


Оригинал статьи: https://arxiv.org/pdf/2510.10526.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/