Asymptotyczna właściwość ekwipartycji - Asymptotic equipartition property

W teorii informacji , asymptotycznej nieruchomość ekwipartycji ( AEP ) jest ogólną właściwością próbek wyjściowych o stochastycznym źródła . Jest to fundamentalne dla koncepcji typowego zbioru używanego w teoriach kompresji danych .

Z grubsza rzecz ujmując, twierdzenie to stwierdza, że ​​chociaż istnieje wiele serii wyników, które mogą być wygenerowane przez losowy proces, ten faktycznie uzyskany najprawdopodobniej pochodzi z luźno zdefiniowanego zestawu wyników, z których wszystkie mają w przybliżeniu taką samą szansę na to, że zostaną faktycznie zrealizowane. . (Jest to konsekwencja prawa wielkich liczb i teorii ergodycznej ). Chociaż istnieją indywidualne wyniki, które mają wyższe prawdopodobieństwo niż jakikolwiek wynik w tym zbiorze, ogromna liczba wyników w zbiorze niemal gwarantuje, że wynik będzie pochodził z ustawić. Jednym ze sposobów intuicyjnego zrozumienia tej własności jest twierdzenie Craméra o dużym odchyleniu, który stwierdza, że ​​prawdopodobieństwo dużego odchylenia od średniej maleje wykładniczo wraz z liczbą próbek. Takie wyniki są badane w teorii dużych odchyleń ; intuicyjnie, to duże odchylenia naruszałyby ekwipartycję, ale jest to mało prawdopodobne.

W dziedzinie generowania liczb pseudolosowych generator kandydatów o nieokreślonej jakości, którego sekwencja wyjściowa leży zbyt daleko poza typowym zbiorem według niektórych kryteriów statystycznych, jest odrzucany jako niewystarczająco losowy. Tak więc, chociaż typowy zbiór jest luźno zdefiniowany, pojawiają się praktyczne pojęcia dotyczące dostatecznej typowości.

Definicja

Biorąc pod uwagę stacjonarny ergodyczny proces stochastyczny w czasie dyskretnym w przestrzeni prawdopodobieństwa , asymptotyczna własność ekwipartycji jest twierdzeniem, że

gdzie lub po prostu oznacza entropię szybkość z , który musi istnieć na wszystkich dyskretnych stacjonarnymi procesami tym ergodycznych nich. Asymptotyczna własność ekwipartycji jest udowodniona dla skończonych (tj. ) stacjonarnych ergodycznych procesów stochastycznych w twierdzeniu Shannona-McMillana-Breimana przy użyciu teorii ergodycznej oraz dla dowolnych źródeł iid bezpośrednio przy użyciu prawa wielkich liczb zarówno w przypadku wartości dyskretnych (gdzie jest po prostu entropią symbolu) i przypadkiem o wartościach ciągłych (gdzie H jest zamiast tego entropią różniczkową). Definicję asymptotycznej własności ekwipartycji można również rozszerzyć o pewne klasy procesów stochastycznych w czasie ciągłym, dla których typowy zbiór istnieje przez wystarczająco długi czas obserwacji. Zbieżność jest niemal pewna we wszystkich przypadkach.

Źródła iid w czasie dyskretnym

Podane jest źródło iid , które może przyjmować wartości w alfabecie , jego szereg czasowy jest iid z entropią . Słabe prawo wielkich liczb daje asymptotyczną własność ekwipartycji ze zbieżnością prawdopodobieństwa ,

ponieważ entropia jest równa oczekiwaniu

Silne prawo wielkich liczb potwierdza silniejszą, prawie pewną zbieżność,

Stacjonarne źródła ergodyczne o skończonej wartości dyskretnej w czasie

Rozważmy przestrzeń próbek o skończonych wartościach , tj. dla stacjonarnego procesu ergodycznego w czasie dyskretnym , zdefiniowanego w przestrzeni prawdopodobieństwa . Asymptotyczna własność ekwipartycji dla takiego stochastycznego źródła jest znana jako twierdzenie Shannona-McMillana-Breimana , dzięki Claude Shannon , Brockway McMillan i Leo Breiman .


Niestacjonarne źródło czasu dyskretnego wytwarzające niezależne symbole

Założenia stacjonarności/ergodyczności/identycznego rozkładu zmiennych losowych nie są niezbędne do zachowania asymptotycznej ekwipartycji. Rzeczywiście, jak jest całkiem jasne intuicyjnie, asymptotyczna własność ekwipartycji wymaga tylko pewnej formy prawa wielkich liczb do zachowania, które jest dość ogólne. Wyrażenie to musi być jednak odpowiednio uogólnione, a warunki precyzyjnie sformułowane.

Zakładamy, że źródło wytwarza niezależne symbole, z możliwie różnymi statystykami wyjściowymi w każdej chwili. Zakładamy, że statystyki procesu są całkowicie znane, to znaczy znany jest marginalny rozkład procesu widziany w każdej chwili. Wspólna dystrybucja jest tylko produktem marginalnym. Następnie, pod warunkiem (który może być złagodzony), że dla wszystkich i , dla pewnego M > 0, zachodzi następujące (AEP):

gdzie

Aplikacje

Asymptotyczna własność ekwipartycji dla niestacjonarnego procesu niezależnego od czasu dyskretnego prowadzi nas (między innymi) do twierdzenia o kodowaniu źródłowym dla źródła niestacjonarnego (z niezależnymi symbolami wyjściowymi) i twierdzenia o kodowaniu zaszumionego kanału dla niestacjonarnych kanałów bez pamięci.

Stacjonarne źródła ergodyczne czasu ciągłego

Funkcje czasu dyskretnego mogą być interpolowane do funkcji czasu ciągłego. Jeżeli taka interpolacja f jest mierzalna , możemy zdefiniować proces stacjonarny w czasie ciągłym odpowiednio jako . Jeśli asymptotyczna własność ekwipartycji zachodzi dla procesu w czasie dyskretnym, jak w przypadku iid lub ergodycznych przypadków stacjonarnych o skończonej wartości, pokazanych powyżej, to automatycznie obowiązuje dla procesu stacjonarnego w czasie ciągłym, wyprowadzonego z niej przez pewną mierzalną interpolację. tj

gdzie n odpowiada stopniowi swobody w czasie τ . nH ( X )/ τ i H ( X ) to odpowiednio entropia na jednostkę czasu i na stopień swobody, zdefiniowana przez Shannona .

Ważną klasą takiego procesu stacjonarnego w czasie ciągłym jest stacjonarny proces ergodyczny o ograniczonym paśmie, w którym przestrzeń próbki jest podzbiorem funkcji ciągłych . Asymptotyczna własność ekwipartycji zachodzi, jeśli proces jest biały, w którym to przypadku próbki czasowe są iid, lub istnieje T > 1/2 W , gdzie W jest nominalną szerokością pasma , tak że próbki czasu w odstępie T przyjmują wartości w skończonej W takim przypadku mamy do czynienia z stacjonarnym procesem ergodycznym o skończonej wartości w czasie dyskretnym.

Wszelkie operacje niezmienne w czasie zachowują również asymptotyczną własność ekwipartycji, stacjonarność i ergodyczność i możemy łatwo zmienić proces stacjonarny w niestacjonarny bez utraty asymptotycznej własności ekwipartycji poprzez zerowanie skończonej liczby próbek czasu w procesie.

Teoria kategorii

Kategoria teoretyczna definicja nieruchomości ekwipartycji jest przez Gromow . Mając ciąg potęg kartezjańskich przestrzeni miar P , ciąg ten dopuszcza asymptotycznie równoważny ciąg H N jednorodnych przestrzeni miar ( tzn. wszystkie zbiory mają tę samą miarę; wszystkie morfizmy są niezmienne w ramach grupy automorfizmów, a zatem czynnik jako morfizm do obiektu terminala ).

Powyższe wymaga zdefiniowania asymptotycznej równoważności . Jest to podane w postaci funkcji odległości, podając, jak bardzo korespondencja iniekcyjna różni się od izomorfizmu . Korespondencja iniekcyjna to częściowo zdefiniowana mapa, która jest bijekcją ; oznacza to, że jest to bijection między podzbiorem a . Następnie zdefiniuj

gdzie | S | oznacza miarę zbioru S . W dalszej części przyjmujemy, że miara P i Q wynosi 1, tak że przestrzenie miar są przestrzeniami prawdopodobieństwa. Odległość ta jest powszechnie nazywana odległością maszyny do robót ziemnych lub metryką Wassersteina .

Podobnie, zdefiniuj

z przyjętym jako miara liczenia na P . Zatem definicja ta wymaga, aby P było przestrzenią miary skończonej. Wreszcie niech

Sekwencja odpowiedników iniekcyjnych jest wtedy asymptotycznie równoważna, gdy

Mając jednorodną sekwencję przestrzenną H N , która jest asymptotycznie równoważna P N , entropię H ( P ) P można przyjąć jako

Zobacz też

Uwagi

Bibliografia

artykuły prasowe

  • Claude E. Shannon. „ Matematyczna teoria komunikacji ”. Dziennik techniczny Bell System , lipiec/październik 1948.
  • Algoet, Paul H.; Okładka, Thomas M. (1988). „Dowód kanapki twierdzenia Shannona-McMillana-Breimana” (PDF) . Roczniki prawdopodobieństwa . 16 (2): 899–909.
  • Sergio Verdu i Te Sun Han. „Rola asymptotycznej ekwipartycji w bezszumowym kodowaniu źródłowym”. IEEE Transactions on Information Theory , 43 (3): 847-857, 1997.

Podręczniki