Teoria hazardu i informacji - Gambling and information theory

Wnioskowanie statystyczne można traktować jako teorię hazardu stosowaną do otaczającego nas świata. Niezliczone zastosowania logarytmicznych miar informacyjnych mówią nam dokładnie, jak najlepiej zgadnąć w obliczu częściowych informacji. W tym sensie teorię informacji można uznać za formalny wyraz teorii hazardu. Nie jest więc zaskoczeniem, że teoria informacji ma zastosowanie w grach losowych.

Kelly Betting

Zakłady Kelly lub zakłady proporcjonalne to zastosowanie teorii informacji do inwestowania i hazardu . Jego odkrywcą był John Kelly Larry jr .

Częścią spostrzeżeń Kelly'ego było to, aby gracz zmaksymalizował oczekiwanie logarytmu swojego kapitału, a nie oczekiwany zysk z każdego zakładu. Jest to ważne, ponieważ w tym drugim przypadku można by postawić wszystko, co miał, gdy otrzyma korzystny zakład, a gdyby przegrał, nie miałby kapitału, z którym mógłby obstawiać kolejne zakłady. Kelly zdał sobie sprawę, że to logarytm kapitału gracza jest sumą w zakładach sekwencyjnych i „do którego ma zastosowanie prawo wielkich liczb”.

Informacje dodatkowe

Nieco to ilość entropii w bettable zdarzenia z dwóch możliwych wyników, a nawet sprzeczne. Oczywiście moglibyśmy podwoić nasze pieniądze, gdybyśmy z góry wiedzieli, jaki będzie wynik tego wydarzenia. Kelly doszedł do wniosku, że bez względu na to, jak skomplikowany jest scenariusz obstawiania, możemy zastosować optymalną strategię obstawiania, zwaną kryterium Kelly'ego , aby nasze pieniądze rosły wykładniczo wraz z wszelkimi dodatkowymi informacjami, które jesteśmy w stanie uzyskać. Wartość tych „nielegalnych” informacji pobocznych jest mierzona jako wzajemna informacja w odniesieniu do wyniku zdarzenia, w którym można postawić zakład:

{\ Displaystyle {\ rozpocząć {wyrównane} ja (X; Y) & = \ mathbb {E} _ {Y} \ {D _ {\ matematyka {KL}} {\ duży (} P (X | Y) \ | P (X | I) {\ big)} \} \\ & = \ mathbb {E} _ {Y} \ {D _ {\ mathrm {KL}} {\ big (} P (X | {\ textrm {side}) } \ {\ textrm {information}} \ Y) \ | P (X | {\ textrm {stwierdzone}} \ {\ textrm {odds}} \ I) {\ big)} \}, \ end {aligned}} }

gdzie Y to informacja poboczna, X to wynik obstawionego zdarzenia, a I to stan wiedzy bukmachera. Jest to średnia dywergencja kullbacka-leiblera lub uzyskania informacji, z a posteriori rozkładu prawdopodobieństwa X danym wartość Y w stosunku do a priori dystrybucję lub ustalonych kursów, na X . Zauważ, że oczekiwanie jest przejmowane Y zamiast X : musimy ocenić, jak prawdziwe, w dłuższej perspektywie, nasza informacja boczna Y to zanim zaczniemy zakłady prawdziwe pieniądze na X . Jest to proste zastosowanie wnioskowania bayesowskiego . Zwróć uwagę, że informacje poboczne Y mogą wpływać nie tylko na naszą wiedzę o zdarzeniu X, ale także o samym wydarzeniu. Na przykład Y może być koniem, który ma za dużo owsa lub za mało wody. Ta sama matematyka ma zastosowanie w tym przypadku, ponieważ z punktu widzenia bukmachera okazjonalne ustawianie wyścigów jest już brane pod uwagę przy obliczaniu swoich kursów.

Charakter informacji pobocznych jest niezwykle skomplikowany. Widzieliśmy już, że może to wpłynąć na faktyczne wydarzenie, a także na naszą wiedzę o wyniku. Załóżmy, że mamy informatora, który mówi nam, że jakiś koń wygra. Z pewnością nie chcemy postawić wszystkich naszych pieniędzy na tego konia tylko na plotkę: ten informator może obstawiać innego konia i może rozpowszechniać pogłoski, aby samemu uzyskać lepsze szanse. Zamiast tego, jak wskazaliśmy, musimy ocenić nasze informacje poboczne w perspektywie długoterminowej, aby zobaczyć, jak korelują one z wynikami wyścigów. W ten sposób możemy dokładnie określić, na ile wiarygodny jest nasz informator, i dokładnie obstawić nasze zakłady, aby zmaksymalizować oczekiwany logarytm naszego kapitału zgodnie z kryterium Kelly'ego. Nawet jeśli nasz informator nas okłamuje, nadal możemy skorzystać z jego kłamstw, jeśli znajdziemy odwrotną korelację między jego wskazówkami a faktycznymi wynikami wyścigu.

Podwajanie stawki

Podwojenie wskaźnika hazardu na wyścigach konnych wynosi

{\ Displaystyle W (b, p) = \ mathbb {E} [\ log _ {2} S (X)] = \ suma _ {i = 1} ^ {m} p_ {i} \ log _ {2} b_ {i} o_ {i}}

tam, gdzie są konie, prawdopodobieństwo wygranej konia jest równe , proporcja bogactwa postawiona na konia i szanse (wypłata) są (np. jeśli koń wygrywający płaci podwójną kwotę zakładu). Ta ilość jest maksymalizowana przez hazard proporcjonalny (Kelly): ${\ displaystyle m}$ ${\ displaystyle i}$ ${\ displaystyle p_ {i}}$ ${\ displaystyle b_ {i}}$ ${\ displaystyle o_ {i}}$ ${\ displaystyle o_ {i} = 2}$ ${\ displaystyle i}$

{\ displaystyle b = p \,}

dla którego

{\ Displaystyle \ max _ {b} W (b, p) = \ suma _ {i} p_ {i} \ log _ {2} o_ {i} -H (p) \,}

gdzie jest entropia informacyjna . ${\ displaystyle H (p)}$

Oczekiwane korzyści

Istnieje ważna, ale prosta zależność między ilością informacji pobocznych, które gracz uzyskuje, a oczekiwanym wykładniczym wzrostem jego kapitału (Kelly):

{\ Displaystyle \ mathbb {E} \ log K_ {t} = \ log K_ {0} + \ sum _ {i = 1} ^ {t} H_ {i}}

dla strategii zakładów optymalne, gdzie jest kapitał, jest stolicą po t -tego zakładu, a to ilość informacji pobocznych uzyskane dotycząca í th zakład (w szczególności informacje o wzajemnym stosunku do wyniku każdego zdarzenia betable) . To równanie ma zastosowanie w przypadku braku jakichkolwiek kosztów transakcji lub minimalnych zakładów. Kiedy te ograniczenia mają zastosowanie (tak jak niezmiennie mają to miejsce w prawdziwym życiu), pojawia się inna ważna koncepcja hazardu: gracz (lub inwestor pozbawiony skrupułów) musi stawić czoła pewnym prawdopodobieństwu ostatecznej ruiny, znanej jako scenariusz ruiny gracza . Zwróć uwagę, że nawet żywność, odzież i schronienie można uznać za stałe koszty transakcyjne, a tym samym przyczynić się do prawdopodobieństwa ostatecznej ruiny gracza. ${\ displaystyle K_ {0}}$ ${\ displaystyle K_ {t}}$ ${\ displaystyle H_ {i}}$

To równanie było pierwszym zastosowaniem teorii informacji Shannona poza jej dominującym paradygmatem komunikacji danych (Pierce).

Wnioski o informacje własne

Zaskoczenie i dowód w bitach jako logarytmiczna miara odpowiednio prawdopodobieństwa i szans.

Logarytmiczna miara prawdopodobieństwa własnym informacje lub nieuwagę, którego średnia wynosi informacji entropia / niepewność i których średnia różnica jest KL-rozbieżność ma aplikacji do analizy szans wszystkim sama. Jej dwie główne mocne strony to zaskakujące: (i) redukcja maleńkich prawdopodobieństw do liczb możliwych do opanowania oraz (ii) dodawanie ilekroć prawdopodobieństwa się mnożą.

Na przykład, można by powiedzieć, że „liczba stanów równa się liczbie bitów dwa”, tj. #States = 2 ^#bits . Tutaj wielkość mierzona w bitach jest logarytmiczną miarą informacyjną wspomnianą powyżej. Stąd jest N bitów zaskoczenia w wyrzuceniu wszystkich głów przy pierwszym rzucie N monetami.

Addytywny charakter niespodzianek i umiejętność wyczucia ich znaczenia za pomocą kilku monet mogą pomóc umieścić nieprawdopodobne wydarzenia (takie jak wygrana na loterii lub wypadek) w kontekście. Na przykład, jeśli jeden z 17 milionów kuponów jest zwycięzcą, to zaskoczenie wygraną z jednej losowej selekcji wynosi około 24 bitów. Rzucanie 24 monetami kilka razy może dać ci wrażenie zaskoczenia, jakim jest zdobycie wszystkich orłów za pierwszym razem.

Addytywny charakter tego środka jest również przydatny podczas ważenia alternatyw. Na przykład wyobraź sobie, że zaskakująca szkoda spowodowana szczepieniem wynosi 20 bitów. Jeśli zaskoczenie związane z złapaniem choroby bez niej wynosi 16 bitów, ale zaskoczenie dotyczące szkody spowodowanej chorobą, jeśli ją złapiecie, wynosi 2 bity, to zaskoczenie dotyczące szkody wynikającej z niezaszczepienia się wynosi tylko 16 + 2 = 18 bitów. Niezależnie od tego, czy zdecydujesz się na szczepienie, czy nie (np. Koszt pieniężny zapłacenia za nie nie jest uwzględniony w tej dyskusji), możesz w ten sposób przynajmniej wziąć odpowiedzialność za decyzję, w której poinformowano Cię, że niezaszczepienie wymaga więcej niż odrobina dodatkowego ryzyka.

Mówiąc bardziej ogólnie, prawdopodobieństwo p można odnieść do bitów zaskakujących bitów jako prawdopodobieństwo = 1/2 ^bitów . Jak zasugerowano powyżej, jest to przydatne głównie w przypadku małych prawdopodobieństw. Jednak Jaynes wskazał, że z prawda-fałsz twierdzenia można również określić bity dowodów ebits jako nieuwagę wobec minus za nieuwagę. Ten dowód w bitach odnosi się po prostu do ilorazu szans = p / (1-p) = 2 ^ebity i ma zalety podobne do samych informacji o sobie.

Zastosowania w grach losowych

Teorię informacji można traktować jako sposób kwantyfikacji informacji, aby podjąć najlepszą decyzję w obliczu niedoskonałej informacji. To znaczy, jak podjąć najlepszą decyzję, korzystając tylko z dostępnych informacji. Celem obstawiania jest racjonalna ocena wszystkich istotnych zmiennych niepewnego meczu / wyścigu / meczu, a następnie porównanie ich z ocenami bukmachera, które zwykle mają postać kursów lub spreadów i postawienie odpowiedniego zakładu, jeśli oceny różnią się wystarczająco. Obszarem hazardu, w którym ma to największe zastosowanie, są zakłady sportowe. Ze względu na dostępność statystyk upośledzenie sportowe bardzo dobrze nadaje się do teorii informacji. Od wielu lat znani ekonomiści testują różne teorie matematyczne, wykorzystując sport jako laboratorium, uzyskując bardzo różne wyniki.

Jedna z teorii dotyczących zakładów sportowych mówi, że jest to spacer przypadkowy . Losowy spacer to scenariusz, w którym nowe informacje, ceny i zwroty będą ulegać wahaniom przez przypadek, jest to część hipotezy efektywnego rynku. Podstawowym przekonaniem hipotezy efektywnego rynku jest to, że rynek zawsze dostosowuje się do nowych informacji. Dlatego nikt nie może pokonać rynku, ponieważ handluje na tych samych informacjach, na podstawie których rynek się dostosował. Jednak zdaniem Famy, aby mieć efektywny rynek, należy spełnić trzy cechy:

Nie ma kosztów transakcyjnych w obrocie papierami wartościowymi
Wszystkie dostępne informacje są dostępne bezpłatnie dla wszystkich uczestników rynku
Wszyscy zgadzają się co do implikacji bieżących informacji dla bieżącej ceny i dystrybucji przyszłych cen każdego papieru wartościowego

Statystycy wykazali, że jest to trzeci warunek, który pozwala teorii informacji być przydatna w upośledzeniu sportowym. Kiedy wszyscy nie zgadzają się co do tego, jak informacje wpłyną na wynik wydarzenia, otrzymujemy różne opinie.

Languages

In other projects

Teoria hazardu i informacji - Gambling and information theory

Zawartość

Kelly Betting

Informacje dodatkowe

Podwajanie stawki

Oczekiwane korzyści

Wnioski o informacje własne

Zastosowania w grach losowych

Zobacz też

Bibliografia

Linki zewnętrzne