Struktura z ruchu - Structure from motion

Structure from motion ( SfM ) to technika obrazowania w zakresie fotogrametrycznym służąca do szacowania trójwymiarowych struktur na podstawie dwuwymiarowych sekwencji obrazów, które mogą być sprzężone z lokalnymi sygnałami ruchu . Jest badany w dziedzinie widzenia komputerowego i percepcji wzrokowej . W widzeniu biologicznym SfM odnosi się do zjawiska, dzięki któremu ludzie (i inne żywe stworzenia) mogą odzyskać strukturę 3D z rzutowanego pola ruchu 2D (siatkówki) poruszającego się obiektu lub sceny.

Zasada

Cyfrowy model powierzchni placu budowy węzła autostradowego
Prawdziwe zdjęcie x SfM z kolorem tekstury x SfM z prostym shaderem. Wykonane w Pythonie Photogrametry Toolbox GUI i renderowane w Blenderze z Cyklami.
Cyfrowy model powierzchni lotniska Bezmiechowa 3D wyekstrahowany z danych zebranych podczas 30- minutowego lotu UAV Pteryx

Ludzie odbierają wiele informacji o trójwymiarowej strukturze w swoim otoczeniu, poruszając się po niej. Kiedy obserwator się porusza, obiekty wokół niego poruszają się w różnym stopniu w zależności od ich odległości od obserwatora. Jest to znane jako paralaksa ruchu i z tej głębokości informacje mogą być wykorzystywane do generowania dokładnej reprezentacji 3D otaczającego ich świata.

Znalezienie struktury na podstawie ruchu przedstawia podobny problem, jak znalezienie struktury na podstawie widzenia stereoskopowego . W obu przypadkach należy znaleźć zgodność między obrazami a rekonstrukcją obiektu 3D.

Aby znaleźć zgodność między obrazami, elementy, takie jak punkty narożne (krawędzie z gradientami w wielu kierunkach), są śledzone od jednego obrazu do drugiego. Jednym z najczęściej używanych detektorów cech jest transformacja cech niezmienna w skali (SIFT). Jako cechy wykorzystuje maksima z piramidy różnicy Gaussa (DOG). Pierwszym krokiem w SIFT jest znalezienie dominującego kierunku gradientu. Aby uczynić go niezmiennym przy obrocie, deskryptor jest obracany w celu dopasowania do tej orientacji. Innym popularnym wykrywaczem funkcji jest SURF ( przyśpieszone, niezawodne funkcje ). W SURF DOG został zastąpiony detektorem plamek opartym na macierzy Hessian . Ponadto, zamiast oceniać histogramy gradientu, funkcja SURF oblicza sumy składowych gradientu i sumy ich wartości bezwzględnych. Wykorzystanie integralnych obrazów pozwala na niezwykle szybkie wykrycie cech przy wysokim współczynniku wykrywania. Dlatego w porównaniu do SIFT, SURF jest szybszym wykrywaczem cech z wadą mniejszej dokładności w położeniu cech. Innym rodzajem cech, które ostatnio stały się praktyczne dla konstrukcji z ruchu, są ogólne krzywe (np. lokalnie krawędź z gradientami w jednym kierunku), część technologii znanej jako bezcelowe SfM , przydatne, gdy cechy punktowe są niewystarczające, powszechne w środowiskach stworzonych przez człowieka.

Cechy wykryte ze wszystkich obrazów zostaną wówczas dopasowane. Jednym z algorytmów dopasowujących, które śledzą cechy z jednego obrazu na drugi, jest tracker Lukas-Kanade .

Czasami niektóre z dopasowanych cech są niepoprawnie dopasowane. Dlatego też dopasowania powinny być również filtrowane. RANSAC (random sample consensus) to algorytm, który jest zwykle używany do usuwania odstających przyporządkowań. W artykule Fischlera i Bollesa RANSAC jest używany do rozwiązania problemu określania lokalizacji (LDP), którego celem jest określenie punktów w przestrzeni, które rzutują na obraz na zestaw punktów orientacyjnych o znanych lokalizacjach.

Trajektorie obiektów w czasie są następnie wykorzystywane do rekonstrukcji ich pozycji 3D i ruchu kamery. Alternatywą są tak zwane podejścia bezpośrednie, w których informacje geometryczne (struktura 3D i ruch kamery) są szacowane bezpośrednio na podstawie obrazów, bez pośredniej abstrakcji do cech lub narożników.

Istnieje kilka podejść do struktury z ruchu. W przyrostowym SFM pozy kamery są rozwiązywane i dodawane pojedynczo do kolekcji. W globalnym SFM pozy wszystkich kamer są rozwiązywane w tym samym czasie. Nieco pośrednim podejściem jest SFM poza rdzeniem , w którym obliczanych jest kilka częściowych rekonstrukcji, które są następnie integrowane w rozwiązanie globalne.

Aplikacje

Nauki o Ziemi

Struktura z fotogrametrii Motion z wielowidokowym stereo zapewnia hiperskalowe modele ukształtowania terenu wykorzystujące obrazy uzyskane z szeregu kamer cyfrowych i opcjonalnie sieć naziemnych punktów kontrolnych. Technika ta nie jest ograniczona pod względem częstotliwości czasowej i może zapewnić dane chmury punktów porównywalne pod względem gęstości i dokładności z danymi generowanymi przez naziemne i lotnicze skanowanie laserowe za ułamek kosztów. Struktura z ruchu jest również przydatna w odległych lub trudnych środowiskach, w których naziemne skanowanie laserowe jest ograniczone przez przenośność sprzętu, a lotnicze skanowanie laserowe jest ograniczone przez chropowatość terenu powodującą utratę danych i skracanie obrazu. Technika ta została zastosowana w wielu miejscach, takich jak rzeki, nieużytki, piaszczyste wybrzeża, strefy uskoków, osuwiska i rafy koralowe. SfM jest również z powodzeniem stosowany do oceny dużej objętości akumulacji drewna i porowatości w systemach rzecznych, a także do charakteryzacji mas skalnych poprzez określenie niektórych właściwości, takich jak orientacja, trwałość itp. nieciągłości. Można korzystać z pełnej gamy aparatów cyfrowych, w tym lustrzanek cyfrowych, kompaktowych aparatów cyfrowych, a nawet smartfonów. Generalnie jednak wyższą dokładność danych uzyska się za pomocą droższych kamer, które zawierają obiektywy o wyższej jakości optycznej. Technika ta oferuje zatem ekscytujące możliwości scharakteryzowania topografii powierzchni z bezprecedensową szczegółowością oraz, za pomocą danych wieloczasowych, do wykrywania wysokości, pozycji i zmian objętościowych, które są symptomatyczne dla procesów powierzchniowych. Strukturę z ruchu można umieścić w kontekście innych cyfrowych metod geodezyjnych.

Dziedzictwo kulturowe

Dziedzictwo kulturowe jest obecne wszędzie. Jego kontrola strukturalna, dokumentacja i konserwacja jest jednym z głównych obowiązków ludzkości ( UNESCO ). Z tego punktu widzenia SfM jest wykorzystywane w celu prawidłowego oszacowania sytuacji, a także planowania i konserwacji wysiłków i kosztów, kontroli i przywracania. Ponieważ często istnieją poważne ograniczenia związane z dostępnością terenu i niemożliwością zainstalowania inwazyjnych filarów geodezyjnych, które nie pozwalały na zastosowanie tradycyjnych procedur pomiarowych (takich jak tachimetry), SfM zapewnia nieinwazyjne podejście do konstrukcji, bez bezpośredniej interakcji między strukturą a dowolnym operatorem. Użycie jest dokładne, ponieważ potrzebne są tylko względy jakościowe. Jest wystarczająco szybki, aby odpowiedzieć na bieżące potrzeby zarządzania zabytkiem. Pierwsza faza działania to dokładne przygotowanie pomiarów fotogrametrycznych, w których ustalana jest zależność pomiędzy najlepszą odległością od obiektu, ogniskową, odległością próbkowania gruntu (GSD) oraz rozdzielczością czujnika. Mając te informacje, zaprogramowane akwizycje fotograficzne muszą być wykonane z pionowym nakładaniem się co najmniej 60% (rysunek 02).

Ponadto fotogrametria struktury z ruchu stanowi nieinwazyjną, wysoce elastyczną i niedrogą metodologię do digitalizacji dokumentów historycznych.

Zobacz też

Dalsza lektura

  • Jonathan L. Carrivick, Mark W. Smith, Duncan J. Quincey (2016). Struktura ruchu w naukach o Ziemi . Wileya-Blackwella. 208 stron. ISBN  978-1-118-89584-9
  • Richard Hartley i Andrew Zisserman (2003). Geometria wielu widoków w wizji komputerowej . Wydawnictwo Uniwersytetu Cambridge. Numer ISBN 978-0-521-54051-3.
  • Olivier Faugeras i Quang-Tuan Luong i Theodore Papadopoulo (2001). Geometria wielu obrazów . MIT Naciśnij. Numer ISBN 978-0-262-06220-6.
  • Yi Ma; S. Shankar Sastry ; Jana Koseckiej ; Stefano Soatto (listopad 2003). Zaproszenie do wizji 3D: od obrazów do modeli geometrycznych . Interdyscyplinarna seria matematyki stosowanej, nr 26. Springer-Verlag Nowy Jork, LLC. Numer ISBN 978-0-387-00893-6.

Bibliografia

  1. ^ S. Ullman (1979). „Interpretacja struktury z ruchu” (PDF) . Postępowanie Royal Society of London . 203 (1153): 405-426. Kod bib : 1979RSPSB.203..405U . doi : 10.1098/rspb.1979.0006 . hdl : 1721.1/6298 . PMID  34162 . S2CID  11995230 .
  2. ^ Linda G. Shapiro ; George C. Stockman (2001). Wizja komputerowa . Sala Prezydencka. Numer ISBN 978-0-13-030796-5.
  3. ^ DG Lowe (2004). „Wyróżniające cechy obrazu z punktów kluczowych niezmiennych w skali”. Międzynarodowy Czasopismo Wizji Komputerowej . 60 (2): 91-110. CiteSeerX  10.1.1.73.2924 . doi : 10.1023/b:visi.0000029664.99615,94 . S2CID  221242327 .
  4. ^ Zatoka H.; T. Tuytelaars i L. Van Gool (2006). „Surfowanie: przyspieszone niezawodne funkcje”. 9. Europejska Konferencja Wizji Komputerowej .
  5. ^ B K. Häming i Peters, G. (2010). „Potok rekonstrukcji struktury z ruchu – badanie z naciskiem na krótkie sekwencje obrazów” . Kybernetika . 46 (5): 926-937.
  6. ^ Altówka, P.; Jones, M. (2001). „Szybkie wykrywanie obiektów za pomocą kaskady wzmocnionych prostych funkcji” . Materiały z konferencji IEEE Computer Society z 2001 r. na temat wizji komputerowej i rozpoznawania wzorców. CVPR 2001 . Kauai, HI, USA: IEEE Comput. Soc. 1 : I-511-I-518. doi : 10.1109/CVPR.2001.990517 . Numer ISBN 978-0-7695-1272-3. S2CID  2715202 .
  7. ^ Nurutdinova, Andrew; Fitzgibbona, Andrzeja (2015). „W kierunku bezsensownej struktury z ruchu: rekonstrukcja 3D i parametry kamery z ogólnych krzywych 3D” (PDF) . Materiały z IEEE International Conference on Computer Vision (ICCV 2015) : 2363–2371. doi : 10.1109/ICCV.2015.272 . Numer ISBN 978-1-4673-8391-2. S2CID  9120123 .
  8. ^ Fabbri, Ricardo; Giblin, Piotr; Kimia, Benjamin (2012). „Oszacowanie pozycji kamery przy użyciu różniczkowej geometrii krzywych pierwszego rzędu” (PDF) . Notatki z wykładów z informatyki (ECCV 2012) . Notatki z wykładów z informatyki. 7575 : 231-244. doi : 10.1007/978-3-642-33765-9_17 . Numer ISBN 978-3-642-33764-2.
  9. ^ Apple, zespół ARKIT (2018). "Zrozumienie śledzenia i wykrywania ARKit" . WWDC .
  10. ^ BD Lucas i T. Kanade. „Iteracyjna technika rejestracji obrazu z zastosowaniem do stereowizji”. Ijcai81 .
  11. ^ MA Fischler & RC Bolles (1981). „Konsensus próbki losowej: paradygmat dopasowania modelu z aplikacjami do analizy obrazu i zautomatyzowanej kartografii”. Komunia. ACM . 24 (6): 381–395. doi : 10.1145/358669.358692 . S2CID  972888 .
  12. ^ F. Dellaert; S. Seitza; C. Thorpe i S. Thrun (2000). „Struktura z ruchu bez korespondencji” (PDF) . Konferencja Towarzystwa Komputerowego IEEE na temat wizji komputerowej i rozpoznawania wzorców .
  13. ^ Engel, Jakob; Schöps, Thomas; Cremers, Daniel (2014). „LSD-SLAM: wielkoskalowy bezpośredni monokular SLAM”. Europejska Konferencja Wizji Komputerowej (ECCV) 2014 (PDF) .
  14. ^ JL Schönberger i JM Frahm (2016). „Struktura z ruchu ponownie” (PDF) . Konferencja Towarzystwa Komputerowego IEEE na temat wizji komputerowej i rozpoznawania wzorców .
  15. ^ C. Tomasi i T. Kanade (1992). „Kształt i ruch ze strumieni obrazów pod ortografią: metoda faktoryzacji”. Międzynarodowy Czasopismo Wizji Komputerowej . 9 (2): 137–154. CiteSeerX  10.1.1.131.9807 . doi : 10.1007/BF00129684 . S2CID  2931825 .
  16. ^ VM Govindu (2001). „Łączenie dwóch ograniczeń widoku dla szacowania ruchu”. Konferencja Towarzystwa Komputerowego IEEE na temat wizji komputerowej i rozpoznawania wzorców . 2 : II-218–II-225. doi : 10.1109/CVPR.2001.990963 . Numer ISBN 0-7695-1272-0. S2CID  8252027 .
  17. ^ Westoby, MJ; Brasington, J.; Glasser, NF; Hambrey, MJ; Reynolds, JM (2012-12-15). „ Fotogrametria ' struktury z ruchu': niedrogie, skuteczne narzędzie do zastosowań w naukach o Ziemi” . Geomorfologia . 179 : 300–314. Kod bib : 2012Geomo.179..300W . doi : 10.1016/j.geomorph.2012.08.021 .
  18. ^ Jakuba, MR; Robson, S. (01.09.2012). „Prosta rekonstrukcja powierzchni 3D i topografii za pomocą kamery: aplikacja do pomiaru dokładności i nauki o Ziemi” (PDF) . Journal of Geophysical Research: Powierzchnia Ziemi . 117 (F3): F03017. Kod bib : 2012JGRF..117.3017J . doi : 10.1029/2011jf002289 . ISSN  2156-2202 .
  19. ^ Fonstad, Mark A .; Dietrich, James T.; Courville, Bretania C.; Jensen, Jennifer L.; Carbonneau, Patrice E. (2013-03-30). „Struktura topograficzna z ruchu: nowe osiągnięcie w pomiarach fotogrametrycznych” (PDF) . Procesy powierzchni ziemi i ukształtowanie terenu . 38 (4): 421-430. Kod bib : 2013ESPL...38..421F . doi : 10.1002/esp.3366 . ISSN  1096-9837 .
  20. ^ Javernick, L.; Brasington, J.; Caruso, B. (2014). „Modelowanie topografii płytkich rzek w oplocie za pomocą fotogrametrii Structure-from-Motion”. Geomorfologia . 213 : 166-182. Kod Bibcode : 2014Geomo.213..166J . doi : 10.1016/j.geomorph.2014.01.006 .
  21. ^ Smith, Mark William; Vericat, Damia (2015-09-30). „Od powierzchni eksperymentalnych do krajobrazów eksperymentalnych: topografia, erozja i osadzanie się na terenach podmokłych z fotogrametrii Structure-from-Motion” (PDF) . Procesy powierzchni ziemi i ukształtowanie terenu . 40 (12): 1656-1671. Kod Bibcode : 2015ESPL...40.1656S . doi : 10.1002/esp.3747 . ISSN  1096-9837 .
  22. ^ Goldstein, Evan B; Oliver, Bursztyn R; deVries, Elsemarie; Moore, Laura J; Jass, Theo (22.10.2015). „Wymagania dotyczące naziemnych punktów kontrolnych dla topografii opartej na strukturze z ruchu w środowiskach przybrzeżnych o niskim nachyleniu” . Preprinty PeerJ . doi : 10.7287/peerj.preprints.1444v1 . ISSN  2167-9843 .
  23. ^ Mancini, Francesco; Dubbini, Marco; Gattelli, Mario; Stecchi, Francesco; Fabbri, Stefano; Gabbianelli, Giovanni (09.12.2013). „Korzystanie z bezzałogowych statków powietrznych (UAV) do rekonstrukcji topografii w wysokiej rozdzielczości: struktura z podejścia ruchowego w środowiskach przybrzeżnych” . Teledetekcja . 5 (12): 6880–6898. Kod Bibcode : 2013RemS....5.6880M . doi : 10.3390/rs5126880 .
  24. ^ Johnson, Kendra; Nissena, Edwina; Saripalli, Srikanth; Arrowsmith, J. Ramón; McGarey, Patrick; Scharer, Katarzyna; Williamsa, Patricka; Blisniuk, Kimberly (01.10.2014). „Szybkie mapowanie topografii ultradrobnych stref uskokowych ze strukturą z ruchu” . Geosfera . 10 (5): 969-986. Kod Bibcode : 2014Geosp..10..969J . doi : 10.1130/GES01017.1 .
  25. ^ Del Soldato, M.; Riquelme, A.; Bianchini, S.; Tomasz R.; Di Martire, D.; De Vita, P.; Moretti S.; Calcaterra, D. (2018-06-06). „Integracja danych z wielu źródeł w celu zbadania jednego stulecia ewolucji osuwiska Agnone (Molise, południowe Włochy)” . Osuwiska . 15 (11): 2113–2128. doi : 10.1007/s10346-018-1015-z . ISSN  1612-510X .
  26. ^ Bryson, Mitch; Duce, Stephanie; Harris, Dan; Webster, Jody M.; Thompson, Alisza; Vila-Concejo, Ana; Williams, Stefan B. (2016). „Geomorficzne zmiany raf koralowych gontów mierzone za pomocą Kite Aerial Photography”. Geomorfologia . 270 : 1–8. Kod Bibcode : 2016Geomo.270....1B . doi : 10.1016/j.geomorph.2016.06.018 .
  27. ^ Spreitzer, Gabriel; Tunnicliffe, Jon; Friedrich, Heide (01.12.2019). „Wykorzystanie struktury z fotogrametrii ruchu do oceny dużych nagromadzeń drewna (LW) w terenie”. Geomorfologia . 346 : 106851. Kod bib : 2019Geomo.34606851S . doi : 10.1016/j.geomorph.2019.106851 .
  28. ^ Spreitzer, Gabriel; Tunnicliffe, Jon; Friedrich, Heide (2020). „Mapowanie i ocena akumulacji drewna wielkogabarytowego (LW) 3D z wykorzystaniem struktury fotogrametrii ruchu w laboratorium”. Czasopismo Hydrologii . 581 : 124430. Kod bib : 2020JHyd..58124430S . doi : 10.1016/j.jhydrol.2019.124430 .
  29. ^ Riquelme, A.; Cano, M.; Tomasz R.; Abellán, A. (01.01.2017). „Identyfikacja zestawów nieciągłości skarp skalnych ze skanera laserowego i fotogrametrycznych chmur punktów: analiza porównawcza” . Inżynieria procedii . 191 : 838-845. doi : 10.1016/j.proeng.2017.05.251 . ISSN  1877-7058 .
  30. ^ Jordá Bordehore, Luis; Riquelme, Adrian; Kano, Miguel; Tomás, Roberto (01.09.2017). „Porównanie ręcznego i teledetekcyjnego zbierania nieciągłości pól stosowanych w ocenie stabilności kinematycznej uszkodzonych zboczy skalnych” (PDF) . International Journal of Rock Mechanics and Mining Sciences . 97 : 24-32. doi : 10.1016/j.ijrmms.2017.06.004 . hdl : 10045/67528 . ISSN  1365-1609 .
  31. ^ Przewodnik. SOL.; Beraldin, JA; Atzeni, C. Modelowanie 3D dziedzictwa kulturowego o wysokiej dokładności: digitalizacja Donatello. IEEE Trans. Proces obrazu. 2004, 13, 370–380
  32. ^ Kraus, K., 2007. Fotogrametria: Geometria ze skanów obrazu i lasera. Walter de Gruyter, 459 s. ISBN  978-3-11-019007-6
  33. ^ Brandolini, Filippo; Patrucco, Giacomo (wrzesień 2019). „Fotogrametria struktury z ruchu (SFM) jako nieinwazyjna metodologia digitalizacji dokumentów historycznych: bardzo elastyczne i tanie podejście?” . Dziedzictwo . 2 (3): 2124–2136. doi : 10.3390/dziedzictwo2030128 .