Opine on Optimization: The Alpha Predator ™ Problem

Przez: Blockforce Capital Research

W naszym poprzednim poście [APM I] przedstawiliśmy model Alpha Predator ™ (APM) do systematycznego handlu aktywami cyfrowymi; wykorzystując złożoność i elastyczność, aby zdobyć rynki alfa i wyprzedzić rynki. Jednak pomimo tego, że Alpha Predator jest wielowymiarowym fantasmagorycznym drapieżnikiem, jest jednocześnie dobrotliwą bestią, która chce rozprzestrzeniać swoją proliferację alfa wśród żyznych resztek ulepszonego ekosystemu rynkowego, który za nią stoi. Wykorzystując te nasiona alfa do rozwoju sektora blockchain dla inwestorów wszystkich typów, musimy najpierw skorzystać z algorytmów uczenia maszynowego, aby zoptymalizować najlepszą ścieżkę do kiełkowania.

Dla szybkiego przypomnienia oto drzewo decyzyjne APM, które pokazaliśmy wcześniej w APM I:

Mamy wiele wyborów, aby określić, w jaki sposób APM podejmuje decyzje, od gałęzi (kierunek rynku) u góry, aż do liści (oscylatory stochastyczne) u dołu. W obecnej formie to stochastyczne oscylatory [dowiedz się więcej tutaj i tutaj], które ostatecznie podejmują decyzje handlowe, a my chcielibyśmy zoptymalizować ich parametry, aby podejmować najlepsze możliwe decyzje handlowe.

Technicznie rzecz biorąc, APM ma parametry dynamiczne znane w fizyce jako stopnie swobody i musimy znaleźć dla nich optymalny wybór. Każdy stopień swobody jest jednym niezależnym kierunkiem, w którym system może się poruszać, a optymalne jest to, co daje nam najwyższy zwrot z inwestycji przy kontrolowanym poziomie ryzyka. Musimy znaleźć delikatną równowagę, w której wszystko łączy się we właściwy sposób, aby to osiągnąć. Przeszukujemy przestrzeń parametrów i testujemy wydajność, uruchamiając testy wsteczne, które stosują APM do historycznych danych cenowych i mierzą jego wydajność.

Zróbmy szybką liczbę stopni swobody na podstawie bieżącej wersji APM przedstawionej na grafice:

W przypadku diagnostyki rynku mamy kierunek, zmienność i spread. W innym przyszłym poście porozmawiamy również o szczegółach tej diagnostyki. Na razie liczymy ich parametry: Kierunek ma pięć, Zmienność bierze cztery, a Spread także cztery, co daje w sumie 13 stopni swobody. Typowym parametrem jest wybór okresu rozliczeniowego leżącego u podstaw diagnozy. Ten okres może wynosić 30 minut. Pozostałe parametry są wówczas często całkowitymi wielokrotnościami tego okresu, w którym wykonywane są wszystkie obliczenia. Ponadto mogą to być również wartości progowe powyżej lub poniżej, w których przeważają określone warunki.

13 stopni swobody, 10 trylionów możliwości i epoka wszechświata

Pozostańmy na chwilę przy diagnostyce i zróbmy kilka obliczeń. Chcemy znaleźć parametry, które zapewnią nam najlepszy możliwy opis rynku. Możemy to zrobić - w zasadzie - metodą prób i błędów. Powiedzmy, że dla każdego z parametrów Diagnostyki chcemy wypróbować 10 różnych wartości, aby zobaczyć, do czego to prowadzi. Następnie możemy wypróbować wszystkie możliwe kombinacje i śledzić najlepsze. Policzmy, dokąd nas to zaprowadzi:

Kierunek ma 5 parametrów z 10 opcjami do wyboru. To wychodzi na 10 x 10 x 10 x 10 x 10 = 10⁵ = 100 000 różnych opon. Nieźle. Parametry zmienności z dziesięcioma opcjami doprowadzają nas do 10 000. To samo dotyczy Spread. Ponownie nie brzmi to tak źle.

Oto jednak haczyk: Kierunek, Zmienność i Rozprzestrzenianie działają wspólnie, aby określić drzewo decyzyjne APM. Mamy więc do czynienia z 100 000 x 10 000 000 x 10, 00 = 10¹³, czyli słowami 10 trylionów różnych wyborów, które musielibyśmy spróbować!

Nigdy nie należy lekceważyć ogromu ogromu, gdy mamy do czynienia z bilionami. Na przykład jeden bilion dolarów wystawiony od końca do końca przekraczałby odległość między Ziemią a Słońcem, a 10 bilionów to jedno oszacowanie całkowitej liczby galaktyk we Wszechświecie [dowiedz się więcej tutaj]. W przypadku Alpha Predator, z tymi 10 trylionami wyborów do wyboru, jeśli każde obliczenie zajmie 10 sekund i użyjemy jednego komputera, będziemy przy nim przez nieco ponad 3 miliony lat. Co więcej, to tylko diagnostyka rynku.

Postępując wzdłuż drzewa decyzyjnego, każda gałąź prowadzi do 18 różnych liści, a na każdym liściu znajduje się Stochastyczny Oscylator, który podejmuje decyzje handlowe. Zwykle mamy cztery parametry dla każdego oscylatora stochastycznego. Na szczęście każdy oscylator jest niezależny od innych, więc dodanie 18 liści do problemu czyni „tylko” 18 000 razy trudniejszym: 54 miliardy lat na wypróbowanie wszystkich możliwych parametrów drzewa decyzyjnego APM.

54,8 miliarda lat jest dłuższy niż wiek Wszechświata (13,8 miliarda lat)! Chociaż są zdefiniowane przez nasze wyrafinowane temperamenty pacjentów, jesteśmy tu ograniczeni wiekiem Wszechświata, więc nie mamy wyboru, będziemy potrzebować lepszego sposobu optymalizacji APM o wiele, wiele wcześniej.

Uczenie maszynowe za pomocą optymalizacji bayesowskiej

Na szczęście nasz zespół naukowców zajmujących się obliczeniami i danymi ma silne doświadczenie w uczeniu maszynowym. Jest to rozwijająca się dyscyplina naukowa i inżynierska, która wykorzystuje moc nowoczesnych komputerów i zaawansowane techniki modelowania matematycznego, aby umożliwić algorytmom komputerowym naukę i podejmowanie świadomych decyzji.

Większość algorytmów uczenia maszynowego ma nieznane parametry, które należy dostosować w najlepszy możliwy sposób. Najlepszy możliwy sposób jest zdefiniowany jako funkcja straty (patrz ryc. 1), którą chcesz zminimalizować. W naszym przypadku może to być minus skumulowanych zwrotów. Dlatego, aby zminimalizować funkcję strat, musimy zoptymalizować parametry. Jednakże, gdy mamy do czynienia z nieróżniczkującymi się fantasmagorycznymi zwierzętami, musimy zastosować konkretną metodę uczenia maszynowego znaną jako optymalizacja Bayesa.

Optymalizacja Bayesowska różni się nieco od standardowych procedur, takich jak Metoda Newtona lub BFGS o ograniczonej pamięci, ponieważ jest to podejście do optymalizacji oparte na uczeniu maszynowym. Powodem używania go zamiast czegoś bardziej standardowego jest to, że APM jest dziwną funkcją. Biorąc pod uwagę dane, optymalizujemy parametry APM, aby zmaksymalizować zwroty. Nie nadaje się do bardziej powszechnych metod optymalizacji, ponieważ jego uruchomienie zajmuje bardzo dużo czasu (minuty w porównaniu z sekundami w tradycyjnym podejściu) i nie można przyjąć gradientu pierwotnej funkcji (naprawdę potrzebujesz gradientu aby zrobić małe kroki do maksimum / min). Optymalizacja Bayesowska konstruuje tę funkcję zastępczą, która jest płynna i zróżnicowana. Konstruowanie funkcji zastępczej jest częścią uczenia maszynowego. Przesunięcie funkcji zastępczej na minimum jest optymalizacją.

Ryc. 1 Przykład dwuwymiarowej powierzchni zastępczej. Najmniejszą stratę uzyskuje się przy minimalnej powierzchni surogatu - najciemniejszym niebieskim obszarze, gdzie 𝜃_1 = -2 i 𝜃_2 = 2.

Oto jak to działa. Z matematycznego punktu widzenia wynik (np. Całkowity zwrot, maksymalny pobór [dowiedz się więcej tutaj i tutaj] lub dowolna inna wybrana miara wydajności) testu wstecznego APM jest funkcją f (x) zmiennych x = {x1, x2, x3, x4,…} reprezentujące wiele różnych stopni swobody APM. Dla uproszczenia pozostańmy przy Total Return = f (x). Chcemy zmaksymalizować całkowite zwroty poprzez znalezienie parametrów x, które dają globalne maksimum f (x).

Powód, dla którego optymalizacja Bayesa działa w przypadku tego problemu, opiera się na dwóch założeniach: istnieje pewien poziom gładkości w przestrzeni parametrów, a ten poziom gładkości jest izotropowy (wszędzie taki sam). Stopień gładkości lub „poziom podobieństwa” między sąsiednimi regionami przestrzeni parametrów jest poznawany podczas procesu optymalizacji, aby do pewnego stopnia można było zweryfikować pierwsze założenie. Następny punkt w przestrzeni parametrów jest wybierany przez równowagę dwóch celów, eksploracji i maksymalizacji. Funkcja zastępcza jest zdominowana przez niepewność w obszarach przestrzeni parametrów, które nie zostały zbadane. Czasami wybierze punkt w pobliżu, który zwiększa f (x), czasem spróbuje punktu w regionie, który nie został jeszcze zbadany.

Jako dane wejściowe do procesu optymalizacji musimy podać możliwy zakres wartości, jakie może przyjąć każdy z parametrów x. Na przykład możemy zdecydować, że chcemy uśrednić ilość wskaźnika w ciągu n okresów rynkowych, gdzie możemy pozwolić, aby n wahało się od 100 do 300. Zatem nasz zakres dla tego parametru wynosi od 100 do 300. Definiujemy zakres dla wszystkich parametrów. To daje nam wielowymiarowy hipersześcian określający przestrzeń, w której działa optymalizator. Dodatkowo możemy nakładać ograniczenia na relacje między parametrami. Na przykład możemy wymusić, aby jeden parametr był zawsze mniejszy od drugiego, co jest niezbędne podczas pracy z długoterminową i krótkoterminową średnią ruchomą.

Przygotowujemy optymalizację bayesowską, próbkując wartości parametrów x z hipersześcianu, tak aby wszystkie regiony hipersześcianu były reprezentowane. Następnie uruchamiamy APM, aby obliczyć f (x). Ta próbka daje optymalizatorowi początkowy zestaw x i f (x), z którym ma pracować. Ponownie naszym celem jest znalezienie wartości x, która maksymalizuje f (x).

Następnie, w oparciu o początkowy zestaw x i f (x), optymalizator buduje model statystyczny, który w przybliżeniu opisuje, w jaki sposób f zależy od x. To się nazywa model zastępczy. Model zastępczy jest następnie wykorzystywany do przewidywania nowej wartości x, która ma wysokie prawdopodobieństwo zwiększenia f (x). APM jest uruchamiany z tym nowym x, a wynikowy f (x) jest rejestrowany i wykorzystywany w następnym kroku.

Początkowo prognozy nie są bardzo dokładne, ale proces się powtarza. Przy każdym powtórzeniu do modelu zastępczego dodaje się więcej informacji i poprawia się.

Uczy się!

W ten sposób możemy znaleźć optymalne parametry dla APM z zaledwie kilkuset ocenami f (x) w porównaniu do trylionów potrzebnych, gdybyśmy stosowali proste, brutalne podejście bez uczenia maszynowego.

Optymalizacja bayesowska jest solidną techniką, więc nic dziwnego, że pojawia się w wielu dziedzinach nauki i inżynierii. Na przykład optymalizacja bayesowska została wykorzystana do optymalizacji konfiguracji do badań eksperymentalnych i do znalezienia najlepszych parametrów modeli predykcyjnych dla dynamiki płynów lub geofizyki. Nasza praca z APM pokazuje jedno zastosowanie tego, w jaki sposób optymalizacja bayesowska może być potężnym narzędziem w finansach ilościowych.

Wniosek

Gdy drapieżnik powoli odchodzi, za kwitnącym ogrodem do rozprzestrzeniania się alfa cierpliwie kultywuje, mamy chwilę, aby złapać oddech i zastanowić się, czego się nauczyliśmy. Stosując technikę uczenia maszynowego optymalizacji bayesowskiej, możemy zminimalizować funkcję utraty matematycznej powierzchni zastępczej, którą model drapieżnika alfa obejmuje w przestrzeni parametrów, co pozwala nam optymalizować zwrot z inwestycji przy kontrolowanym poziomie ryzyka. Ta optymalizacja i wdrożenie APM to tylko jedna część naszego ogólnego ekosystemu ilościowego Alpha Predator w Blockforce Capital, w którym wykorzystujemy również arbitraż i nasz zastrzeżony model obrotu tokena [oba zostaną omówione w przyszłych artykułach].

W międzyczasie obserwuj swój krok, gdy wychodzisz z ogrodu, bo czai się drapieżnik.

Blockforce Capital nie ma na celu, aby informacje tu przedstawione służyły jako podstawa jakiejkolwiek decyzji inwestycyjnej. Informacje są podane w formie streszczenia i nie mają charakteru kompletnego. Jedynym celem tego materiału jest informowanie iw żadnym wypadku nie ma on stanowić oferty ani zachęty do zakupu lub sprzedaży jakichkolwiek papierów wartościowych, innych inwestycji lub usług, ani do przyciągnięcia jakichkolwiek funduszy lub depozytów, ani też nie można oferować ani sprzedawać papierów wartościowych jakiejkolwiek osobie w jakiejkolwiek jurysdykcji, w której oferta, nagabywanie, zakup lub sprzedaż byłyby niezgodne z prawem na mocy prawa takiej jurysdykcji. Każda taka oferta byłaby składana kwalifikującym się akredytowanym inwestorom wyłącznie za pomocą formalnych dokumentów ofertowych, których warunki byłyby regulowane pod każdym względem. Informacje te nie stanowią ogólnej ani osobistej porady inwestycyjnej ani nie uwzględniają indywidualnych warunków finansowych lub celów inwestycyjnych, ani warunków finansowych osób, które je czytają. Ostrzega się przed wykorzystaniem tych informacji jako podstawy do podjęcia decyzji o zakupie jakichkolwiek zabezpieczeń. Wyniki osiągnięte w przeszłości nie gwarantują przyszłych wyników.

Pierwotnie opublikowany na www.blockforceecapital.com.