Wall Street od miesięcy testuje generatywną sztuczną inteligencję w roli zarządzających portfelami inwestycyjnymi, lecz wyniki tych eksperymentów pozostają dalekie od rewolucji. Według Bloomberga niedawne konkursy tradingowe sugerują, że duże modele językowe wciąż są niewiarygodnymi menedżerami portfeli. Testy obejmujące modele firm OpenAI, Anthropic, Google oraz xAI przynosiły rozczarowujące rezultaty, ponieważ wiele z nich traciło pieniądze, handlowało nadmiernie i podejmowało nieprzewidywalne decyzje mimo otrzymania identycznych poleceń. W kilku przypadkach modele okazały się niezdolne do utrzymania spójnej strategii przez więcej niż kilka sesji giełdowych.
Najbardziej dobitnym przykładem jest Alpha Arena, konkurs stworzony przez startup Nof1. Osiem modeli otrzymało po 10 000 dolarów z zadaniem handlu akcjami amerykańskich spółek technologicznych w ciągu dwóch tygodni, stosując różne strategie, w tym podejścia defensywne i zakłady z dźwignią. W ciągu czterech edycji konkursu modele zbiorowo straciły około jednej trzeciej swojego kapitału, a tylko sześć z 32 wyników zakończyło się zyskiem.
Rozbieżne zachowania i zmagania z podstawami
Skala różnic w zachowaniu poszczególnych modeli była uderzająca, mimo że otrzymały one dokładnie te same instrukcje. Grok 4.20 od xAI dokonał zaledwie 158 transakcji w jednym konkursie, podczas gdy Qwen grupy Alibaba przeprowadził ich aż 1418, co pokazuje fundamentalny brak spójności w interpretacji nawet identycznego polecenia.
Te eksperymenty odzwierciedlają rosnące zainteresowanie kwestią, czy generatywna sztuczna inteligencja może docelowo osiągać lepsze wyniki niż tradycyjni zarządzający funduszami. Firmy z Wall Street, w tym JPMorgan Chase oraz Balyasny Asset Management, już teraz korzystają z AI w zakresie badań, wykrywania oszustw oraz analiz wewnętrznych. Wciąż jednak w dużej mierze powstrzymują się przed powierzaniem jej faktycznych decyzji inwestycyjnych, traktując modele jako narzędzie pomocnicze, a nie autonomicznego decydenta.
Założyciel Nof1, Jay Azhang, ocenił obecny stan technologii bez taryfy ulgowej. Stwierdził, że obecne modele nadal zmagają się z podstawami, takimi jak „wielkość pozycji, wyczucie czasu, ważenie sygnałów i nadmierna aktywność handlowa”. Dawanie pieniędzy modelowi LLM i pozwalanie mu na niezależne inwestowanie, jak ujął to Azhang, „jeszcze nie istnieje” jako realna praktyka rynkowa.

CYNICZNYM OKIEM: Branża, która wycenia siebie w bilionach dolarów obietnic, nie potrafi powierzyć swojej technologii nawet 10 000 dolarów bez nadzoru. Algorytmy mają zastąpić traderów, lecz wciąż przegrywają z najprostszą zasadą tradera, czyli z dyscypliną.
Sygnały ostrożnego optymizmu i problem z testowaniem
Szerszy obraz dostarcza danych z innych źródeł i potwierdza ten obraz. Blog badawczy Flat Circle śledził 11 publicznych konkursów tradingu AI i ustalił, że choć każde wydarzenie wyłaniało przynajmniej jeden zyskowny model, tylko dwa konkursy wygenerowały zyskowny zwrot medianowy. To sugeruje, że większość botów wciąż częściej osiąga słabe wyniki, niż pokonuje rynek.
Niektóre firmy wciąż jednak stawiają na to, że technologia będzie się poprawiać dzięki lepszym narzędziom oraz ściślejszym ograniczeniom. Intelligent Alpha prowadzi fundusz oparty na AI, który łączy duże modele językowe z zapisami z konferencji wynikowych, prognozami analityków, dokumentami korporacyjnymi, wskaźnikami makroekonomicznymi oraz wyszukiwarkami internetowymi w celu tworzenia prognoz. Pod koniec 2025 roku ChatGPT firmy OpenAI poprawnie przewidział kierunek rewizji szacunków zysków w 68 procentach przypadków, co stanowi jego najlepszy dotychczasowy wynik w tej kategorii.
Ocena tych systemów pozostaje jednak metodologicznie trudna, co dodatkowo komplikuje całą branżową dyskusję. Tradycyjne metody testowania wstecznego mogą wprowadzać w błąd, ponieważ modele mogą posiadać już wbudowaną wiedzę o przeszłych wydarzeniach rynkowych. Tworzy to tak zwany błąd wybiegania w przyszłość, czyli look-ahead bias, który zniekształca wyniki retrospektywnych analiz na korzyść modelu.
Skłoniło to coraz większą liczbę firm do eksperymentów na żywym rynku, czyli w warunkach, w których model nie zna przyszłości. Dotychczasowe wyniki sugerują, że AI może być użyteczna jako asystent, lecz nie jako następca ludzkich traderów, co stanowi obecnie najtrwalszy konsensus po stronie zarządzających aktywami. Wall Street pozostaje więc w fazie eksperymentów, a nie wdrożenia, mimo że tempo testów wyraźnie przyspiesza.



