Rzadkie przybliżenie - Sparse approximation

Teoria rzadkiego przybliżenia (znana również jako rzadka reprezentacja ) zajmuje się rzadkimi rozwiązaniami układów równań liniowych . Techniki znalezienie tych rozwiązań i wykorzystywanie ich w aplikacjach znalazły szerokie zastosowanie w przetwarzaniu obrazu , przetwarzania sygnałów , uczenia maszynowego , obrazowania medycznego i innych.

Rzadki rozkład

Bezgłośne obserwacje

Rozważmy liniowy układ równań , gdzie jest nieoznaczoną macierzą i . Macierz (zwykle przyjmuje się, że jest to pełna ranga) jest określana jako słownik i jest sygnałem zainteresowania. Rdzeń problemu rzadkiej reprezentacji jest zdefiniowany jako poszukiwanie możliwie najrzadszej reprezentacji satysfakcjonującej . Ze względu na niedookreśloną naturę , ten układ liniowy dopuszcza na ogół nieskończenie wiele możliwych rozwiązań, a wśród nich poszukujemy takiego z najmniejszą liczbą niezerów. Mówiąc formalnie, rozwiązujemy

gdzie jest pseudo-normą, która zlicza liczbę niezerowych składników . Wiadomo, że problem ten jest NP-trudny z redukcją do problemów selekcji podzbiorów NP-kompletnych w optymalizacji kombinatorycznej .

Rzadkość oznacza, że ​​tylko kilka ( ) składników jest niezerowych. Motywacją leżącą u podstaw tak rzadkiego rozkładu jest chęć dostarczenia możliwie najprostszego wyjaśnienia jako liniowej kombinacji jak najmniejszej liczby kolumn z , zwanych również atomami. Jako taki sygnał może być postrzegany jako cząsteczka złożona z kilku podstawowych elementów pobranych z .

Chociaż postawiony powyżej problem jest rzeczywiście NP-trudny, jego rozwiązanie często można znaleźć za pomocą algorytmów aproksymacyjnych. Jedną z takich opcji jest wypukłe rozluźnienie problemu, uzyskane za pomocą -normy zamiast , gdzie po prostu sumuje się wartości bezwzględne wpisów w . Jest to znane jako algorytm poszukiwania podstawy (BP), który może być obsługiwany za pomocą dowolnego solwera programowania liniowego . Alternatywną metodą aproksymacji jest technika zachłanna, taka jak pogoń za dopasowywaniem (MP), która znajduje położenie niezerów pojedynczo.

Co zaskakujące, w łagodnych warunkach (przy użyciu iskry (matematyka) , wzajemnej koherencji lub ograniczonej własności izometrii ) i poziomie rzadkości w rozwiązaniu , można wykazać, że problem rzadkiej reprezentacji ma unikalne rozwiązanie, a BP i MP gwarantujemy, że znajdziesz to doskonale.


Zaszumione obserwacje

Często obserwowany sygnał jest zaszumiony. Rozluźniając ograniczenie równości i nakładając normę na termin dopasowania danych, problem rzadkiej dekompozycji staje się

lub w formie Lagrange'a,

gdzie jest zastąpienie .

Podobnie jak w przypadku bezszumowym, te dwa problemy są ogólnie NP-Hard, ale można je przybliżyć za pomocą algorytmów pościgowych. Dokładniej, zmieniając do -norm, otrzymujemy

który jest znany jako odszumianie podstawy pogoni . Podobnie, poszukiwanie dopasowania może być użyte do aproksymacji rozwiązania powyższych problemów, odnajdując lokalizacje wartości niezerowych pojedynczo, aż do osiągnięcia progu błędu. Również tutaj teoretyczne gwarancje sugerują, że BP i MP prowadzą do prawie optymalnych rozwiązań w zależności od właściwości i kardynalności rozwiązania . Inny interesujący wynik teoretyczny dotyczy przypadku, w którym jest unitarny. Przy tym założeniu problemy postawione powyżej (z albo lub ) dopuszczają rozwiązania w postaci zamkniętej w postaci skurczu nieliniowego.

Wariacje

Istnieje kilka odmian podstawowego problemu z rzadkimi przybliżeniami.

Ustrukturyzowana rzadkość : W oryginalnej wersji problemu można wybrać dowolny atom ze słownika. W ustrukturyzowanym (blokowym) modelu rzadkości, zamiast pojedynczo wybierać atomy, wybierane są ich grupy. Grupy te mogą zachodzić na siebie i mieć różną wielkość. Celem jest reprezentacja tak, że jest rzadka, jednocześnie wymuszając tę ​​strukturę blokową.

Wspólne (wspólne) kodowanie rzadkie : Oryginalna wersja problemu jest zdefiniowana dla pojedynczego sygnału . W kolaboracyjnym (wspólnym) modelu kodowania rzadkiego dostępny jest zestaw sygnałów, z których każdy, jak się uważa, pochodzi z (prawie) tego samego zestawu atomów z . W tym przypadku zadanie pościgu ma na celu odzyskanie zestawu rzadkich reprezentacji, które najlepiej opisują dane, jednocześnie zmuszając je do współdzielenia tego samego (lub bliskiego) wsparcia.

Inne struktury : Mówiąc szerzej, problem rzadkich aproksymacji można rzucić, wymuszając określoną pożądaną strukturę na wzorze niezerowych lokalizacji w . Dwa interesujące przypadki, które zostały szeroko zbadane, to struktura oparta na drzewie, a bardziej ogólnie, wsparcie rozproszone Boltzmanna.

Algorytmy

Jak już wspomniano powyżej, istnieją różne algorytmy aproksymacji (zwane także pogonią ), które zostały opracowane w celu rozwiązania problemu rzadkiej reprezentacji:

Poniżej wymieniamy kilka z tych głównych metod.

  • Pogoń za dopasowaniem to zachłanny algorytm iteracyjny służący do przybliżonego rozwiązania powyższego problemu. Działa poprzez stopniowe znajdowanie lokalizacji niezerowych po jednym na raz. Podstawową ideą jest znalezienie na każdym kroku kolumny (atomu), która najlepiej koreluje z bieżącą resztą (zainicjowaną do ), a następnie zaktualizowanie tej reszty w celu uwzględnienia nowego atomu i jego współczynnika. Pasujące pogoń może wielokrotnie wybrać ten sam atom.
  • Ortogonalne poszukiwanie dopasowania jest bardzo podobne do poszukiwania dopasowania, z jedną zasadniczą różnicą: w każdym kroku algorytmu wszystkie niezerowe współczynniki są aktualizowane o wartość najmniejszych kwadratów . W konsekwencji reszta jest prostopadła do już wybranych atomów, a zatem atomu nie można wybrać więcej niż raz.
  • Metody zachłanne etapowe: ulepszone warianty w stosunku do powyższych to algorytmy, które działają zachłannie, jednocześnie dodając dwie krytyczne cechy: (i) możliwość dodawania grup niezerowych na raz (zamiast jednej wartości niezerowej na rundę); oraz (ii) zawiera etap przycinania w każdej rundzie, w którym kilka atomów jest odrzucanych z nośnika. Reprezentantami tego podejścia są algorytm Subspace-Pursuit oraz CoSaMP.
  • Pogoń za podstawą rozwiązuje wypukłą, rozluźnioną wersję problemu, zastępując ją przez -normę. Zauważ, że definiuje to tylko nowy cel, pozostawiając otwartą kwestię algorytmu, który ma zostać użyty do uzyskania pożądanego rozwiązania. Powszechnie uważane za takie algorytmy to IRLS , LARS , i iteracyjne metody miękkiego skurczu.
  • Istnieje kilka innych metod rozwiązywania rzadkich problemów z rozkładem: metoda homotopii, zejście współrzędnych , iteracyjne hard-thresholding, metody proksymalne pierwszego rzędu , które są powiązane z wyżej wymienionymi iteracyjnymi algorytmami miękkiego kurczenia oraz selektor Dantzig.

Aplikacje

Nieliczne wolne zbliżanie i algorytmy zostały szeroko stosowane w przetwarzaniu sygnałów , przetwarzanie obrazu , uczenia maszynowego , obrazowania medycznego , przetwarzania tablicy , eksploracji danych i wiele innych. W większości tych aplikacji nieznany sygnał będący przedmiotem zainteresowania jest modelowany jako rzadka kombinacja kilku atomów z danego słownika, co jest wykorzystywane jako uregulowanie problemu. Problemom tym zazwyczaj towarzyszy mechanizm uczenia słownikowego , który ma na celu jak najlepsze dopasowanie modelu do danych. Wykorzystanie modeli inspirowanych rzadkością doprowadziło do uzyskania najnowocześniejszych wyników w szerokim zestawie zastosowań. Ostatnie prace sugerują, że istnieje ścisły związek między modelowaniem rzadkiej reprezentacji a uczeniem głębokim.

Zobacz też

Bibliografia

  1. ^ Donoho, DL i Elad, M. (2003). „Optymalnie rzadka reprezentacja w ogólnych (nieortogonalnych) słownikach poprzez minimalizację L1” (PDF) . Materiały Narodowej Akademii Nauk . 100 (5): 2197–2202. Kod bib : 2003PNAS..100.2197D . doi : 10.1073/pnas.0437847100 . PMC  153464 . PMID  16576749 .CS1 maint: wiele nazwisk: lista autorów ( link )
  2. ^ Tropp, JA (2004). „Chciwość jest dobra: wyniki algorytmów dla przybliżenia rzadkiego” (PDF) . Transakcje IEEE dotyczące teorii informacji . 50 (10): 2231–2242. CiteSeerX  10.1.1.321.1443 . doi : 10.1109/TIT.2004.834793 . S2CID  675692 .
  3. ^ Donoho, DL (2006). „Dla większości dużych niedookreślonych układów równań liniowych rozwiązanie minimalne l1-normy jest również rozwiązaniem najrzadszym” (PDF) . Komunikaty na temat matematyki czystej i stosowanej . 56 (6): 797–829. doi : 10.1002/cpa.20132 .
  4. ^ B Elad, M. (2010). Reprezentacje rzadkie i nadmiarowe: od teorii do zastosowań w przetwarzaniu sygnałów i obrazów . Skoczek. CiteSeerX  10.1.1.331.8963 . doi : 10.1007/978-1-4419-7011-4 . Numer ISBN 978-1441970107.
  5. ^ Donoho, DL, Elad, M. i Templyakov, V. (2006). „Stabilne odzyskiwanie nielicznych, przepełnionych reprezentacji w obecności szumu” (PDF) . Transakcje IEEE dotyczące teorii informacji . 52 (1): 6-18. CiteSeerX  10.1.1.125.5610 . doi : 10.1109/TIT.2005.860430 . S2CID  14813938 .CS1 maint: wiele nazwisk: lista autorów ( link )
  6. ^ Tropp, JA (2006). „Po prostu zrelaksuj się: metody programowania wypukłego do identyfikacji rzadkich sygnałów w szumie” (PDF) . Transakcje IEEE dotyczące teorii informacji . 52 (3): 1030–1051. CiteSeerX  10.1.1.184.2957 . doi : 10.1109/TIT.2005.864420 . S2CID  6496872 .
  7. ^ Eldar, YC, Kuppinger, P. i Bolcskei, H. (2009). „Blok-rzadkie sygnały: relacje niepewności i skuteczne odzyskiwanie”. Transakcje IEEE dotyczące przetwarzania sygnałów . 58 (6): 3042–3054. arXiv : 0906.3173 . Kod bib : 2010ITSP...58.3042E . doi : 10.1109/TSP.2010.2044837 . S2CID  335122 .CS1 maint: wiele nazwisk: lista autorów ( link )
  8. ^ Tropp JA Gilbert AC i Strauss MJ (2006). „Algorytmy jednoczesnego przybliżenia rzadkiego. Część I: Chciwy pościg”. Przetwarzanie sygnału . 86 (3): 572–588. doi : 10.1016/j.sigpro.2005.05.030 .CS1 maint: wiele nazwisk: lista autorów ( link )
  9. ^ Peleg T. Eldar YC i Elad M. (2012). „Wykorzystywanie zależności statystycznych w rzadkich reprezentacjach do odzyskiwania sygnału”. Transakcje IEEE dotyczące przetwarzania sygnałów . 60 (5): 2286–2303. arXiv : 1010,5734 . Kod bib : 2012ITSP...60.2286P . doi : 10.1109/TSP.2012.2188520 . S2CID  3179803 .CS1 maint: wiele nazwisk: lista autorów ( link )
  10. ^ Needell, D. i Tropp, JA (2009). „CoSaMP: iteracyjne odzyskiwanie sygnału z niekompletnych i niedokładnych próbek”. Stosowana i Obliczeniowa Analiza Harmoniczna . 26 (3): 301–321. arXiv : 0803.2392 . doi : 10.1016/j.acha.2008.07.002 .CS1 maint: wiele nazwisk: lista autorów ( link )
  11. ^ Zibulevsky, M. i Elad, M. (2010). „Optymalizacja L1-L2 w przetwarzaniu sygnału i obrazu” (PDF) . Magazyn IEEE dotyczący przetwarzania sygnałów . 27 (3): 76–88. Kod bib : 2010ISPM...27...76Z . doi : 10.1109/MSP.2010.936023 . S2CID  2783691 .CS1 maint: wiele nazwisk: lista autorów ( link )
  12. ^ Baraniuk, RG Candes, E. Elad, M. i Ma, Y. (2010). „Zastosowania rzadkiej reprezentacji i wyczuwania ściskającego”. Postępowanie IEEE . 98 (6): 906-909. doi : 10.1109/JPROC.2010.2047424 .CS1 maint: wiele nazwisk: lista autorów ( link )
  13. ^ Elad, M. Figueiredo, MAT i Ma, Y. (2010). „O roli reprezentacji rzadkich i nadmiarowych w przetwarzaniu obrazu” (PDF) . Postępowanie IEEE . 98 (6): 972–982. CiteSeerX  10.1.1.160.465 . doi : 10.1109/JPROC.2009.2037655 . S2CID  10992685 . Zarchiwizowane z oryginału (PDF) dnia 2018-01-17.CS1 maint: wiele nazwisk: lista autorów ( link )
  14. ^ Plumbley, MD Blumensath, T. Daudet, L. Gribonval, R. i Davies, ME (2010). „Sparse reprezentacje w audio i muzyce: od kodowania do separacji źródeł”. Postępowanie IEEE . 98 (6): 995–1005. CiteSeerX  10.1.1.160.1607 . doi : 10.1109/JPROC.2009.2030345 . S2CID  4461063 .CS1 maint: wiele nazwisk: lista autorów ( link )
  15. ^ Papyan, V. Romano, Y. i Elad, M. (2017). „Splotowe sieci neuronowe analizowane za pomocą kodowania splotowego rzadkiego” (PDF) . Journal of Machine Learning Research . 18 (83): 1-52. arXiv : 1607.08194 . Kod bib : 2016arXiv160708194P .CS1 maint: wiele nazwisk: lista autorów ( link )