Wyszukiwanie wizualne — Visual search

Wyszukiwanie wizualne to rodzaj zadania percepcyjnego wymagającego uwagi, które zazwyczaj obejmuje aktywne skanowanie środowiska wzrokowego w poszukiwaniu określonego obiektu lub cechy (celu) wśród innych obiektów lub cech (dystraktorów). Wyszukiwanie wizualne może odbywać się z ruchami gałek ocznych lub bez nich. Zdolność do świadomego lokalizowania obiektu lub celu wśród złożonego zestawu bodźców była intensywnie badana w ciągu ostatnich 40 lat. Praktyczne przykłady zastosowania wyszukiwania wizualnego można zaobserwować w życiu codziennym, np. podczas wybierania produktu z półki w supermarkecie, gdy zwierzęta szukają jedzenia wśród stert liści, gdy w dużej grupie ludzi szukają przyjaciela lub po prostu podczas grania w gry wyszukiwania wizualnego, takie jak Gdzie jest Wally?

Znaczna część wcześniejszej literatury na temat wyszukiwania wizualnego wykorzystywała czas reakcji do pomiaru czasu potrzebnego na wykrycie celu wśród jego elementów rozpraszających. Przykładem może być zielony kwadrat (cel) pośród zestawu czerwonych kółek (dystraktorów). Jednak pomiary czasu reakcji nie zawsze rozróżniają rolę uwagi od innych czynników: długi czas reakcji może być wynikiem trudności w skierowaniu uwagi na cel, spowolnienia procesów decyzyjnych lub spowolnienia reakcji motorycznych po skierowaniu uwagi na cel i cel zostały już wykryte. Wiele paradygmatów wyszukiwania wizualnego wykorzystuje zatem ruch gałek ocznych jako środek do pomiaru stopnia uwagi poświęcanej bodźcom. Jednak oczy mogą poruszać się niezależnie od uwagi i dlatego pomiary ruchu gałek ocznych nie oddają całkowicie roli uwagi.

Typy wyszukiwania

Wyszukiwanie funkcji

zadanie wyszukiwania oparte na funkcjach

Wyszukiwanie funkcji (znane również jako wyszukiwanie „rozłączne” lub „efektywne”) to wizualny proces wyszukiwania, który koncentruje się na zidentyfikowaniu wcześniej żądanego celu wśród elementów rozpraszających, które różnią się od celu unikalną cechą wizualną, taką jak kolor, kształt, orientacja lub rozmiar . Przykładem zadania wyszukiwania cech jest poproszenie uczestnika o zidentyfikowanie białego kwadratu (celu) otoczonego czarnymi kwadratami (dystraktorami). W tego typu poszukiwaniach wizualnych dystraktory charakteryzują się tymi samymi cechami wizualnymi. Wydajność wyszukiwania cech w odniesieniu do czasu reakcji (RT) i dokładności zależy od efektu „wyskakuj”, przetwarzania oddolnego i przetwarzania równoległego. Jednak na efektywność wyszukiwania cech nie wpływa liczba obecnych dystraktorów.

Efekt „wyskakuj” jest elementem wyszukiwania cech, który charakteryzuje zdolność celu do wyróżniania się spośród otaczających dystraktorów ze względu na swoją unikalną cechę. Przetwarzanie oddolne, czyli przetwarzanie informacji, które zależy od danych wejściowych ze środowiska, wyjaśnia, w jaki sposób wykorzystuje się detektory cech do przetwarzania charakterystyk bodźców i odróżniania celu od jego elementów rozpraszających. To przyciąganie uwagi wzrokowej do celu dzięki procesom oddolnym jest znane jako „wyrazistość”. Wreszcie, przetwarzanie równoległe jest mechanizmem, który następnie pozwala detektorom cech na jednoczesną pracę w celu identyfikacji celu.

Wyszukiwanie koniunkcji

Zadanie wyszukiwania oparte na spójnikach.

Wyszukiwanie koniunkcji (znane również jako wyszukiwanie nieefektywne lub szeregowe) to wizualny proces wyszukiwania, który koncentruje się na identyfikacji wcześniej żądanego celu otoczonego rozpraszaczami posiadającymi jedną lub więcej wspólnych cech wizualnych z samym celem. Przykładem zadania wyszukiwania koniunkcji jest to, że osoba identyfikuje czerwony X (cel) wśród dystraktorów składających się z czarnych X (ten sam kształt) i czerwonych O (ten sam kolor). W przeciwieństwie do wyszukiwania cech, wyszukiwanie koniunkcyjne obejmuje dystraktory (lub grupy dystraktorów), które mogą się różnić od siebie, ale wykazują co najmniej jedną wspólną cechę z celem. Skuteczność wyszukiwania koniunkcji w odniesieniu do czasu reakcji (RT) i dokładności zależy od współczynnika dystraktorów i liczby obecnych dystraktorów. Ponieważ dystraktory reprezentują różne indywidualne cechy celu bardziej równomiernie między sobą (efekt współczynnika dystraktora), czas reakcji (RT) wzrasta, a dokładność maleje. Wraz ze wzrostem liczby dystraktorów zwiększa się czas reakcji (RT) i zmniejsza się dokładność. Jednak z praktyką pierwotne ograniczenia czasu reakcji (RT) w poszukiwaniu koniunkcji wykazują tendencję do poprawy. Na wczesnych etapach przetwarzania wyszukiwanie koniunkcyjne wykorzystuje procesy oddolne do identyfikowania z góry określonych cech wśród bodźców. Procesy te są następnie wyprzedzane przez bardziej seryjny proces świadomej oceny wskazanych cech bodźca w celu właściwego ulokowania swojej skupionej uwagi przestrzennej na bodziec, który najdokładniej reprezentuje cel.

W wielu przypadkach przetwarzanie zstępujące wpływa na wyszukiwanie koniunkcji poprzez eliminację bodźców niezgodnych z wcześniejszą znajomością celu-opisu, co ostatecznie pozwala na skuteczniejszą identyfikację celu. Przykładem wpływu procesów odgórnych na zadanie wyszukiwania koniunkcyjnego jest to, że podczas wyszukiwania czerwonego „K” wśród czerwonych „C” i czarnych „K” osoby ignorują czarne litery i skupiają się na pozostałych czerwonych literach, aby zmniejszyć ustalony rozmiar możliwych celów, a tym samym skuteczniej określić ich cel.

Wyszukiwanie wizualne w świecie rzeczywistym

W codziennych sytuacjach ludzie najczęściej przeszukują swoje pola widzenia w poszukiwaniu znanych im celów. Jeśli chodzi o wyszukiwanie znanych bodźców, przetwarzanie zstępujące pozwala na bardziej wydajną identyfikację celów o większej złożoności, niż można to przedstawić w funkcji lub zadaniu wyszukiwania połączonego. W badaniu przeprowadzonym w celu przeanalizowania efektu odwrócenia litery, który polega na tym, że identyfikacja litery asymetrycznej wśród liter symetrycznych jest bardziej skuteczna niż jej odwrotność, naukowcy doszli do wniosku, że osoby skuteczniej rozpoznają literę asymetryczną wśród liter symetrycznych ze względu na procesy odgórne . Procesy odgórne umożliwiły uczestnikom badania dostęp do wcześniejszej wiedzy na temat rozpoznawania kształtu litery N i szybkie wyeliminowanie bodźców, które pasowały do ​​ich wiedzy. W prawdziwym świecie trzeba codziennie korzystać z wcześniejszej wiedzy, aby dokładnie i wydajnie lokalizować przedmioty, takie jak telefony, klucze itp., wśród znacznie bardziej złożonego zestawu dystraktorów. Pomimo tej złożoności, wyszukiwanie wizualne za pomocą złożonych obiektów (i wyszukiwanie kategorii obiektów, takich jak „telefon”, w oparciu o wcześniejszą wiedzę) wydaje się opierać na tych samych aktywnych procesach skanowania, co wyszukiwanie koniunkcyjne z mniej złożonymi, wymyślonymi bodźcami laboratoryjnymi, chociaż globalnymi. informacje statystyczne dostępne w scenach rzeczywistych mogą również pomóc ludziom zlokalizować obiekty docelowe. Podczas gdy procesy oddolne mogą wchodzić w grę przy identyfikowaniu obiektów, które nie są tak znane danej osobie, ogólne przetwarzanie odgórne ma duży wpływ na wyszukiwanie wizualne, które ma miejsce w życiu codziennym. Znajomość może odgrywać szczególnie istotną rolę, gdy części obiektów nie są widoczne (na przykład, gdy obiekty są częściowo niewidoczne, ponieważ znajdują się za innymi obiektami). Informacje wizualne z ukrytych części można przywołać z pamięci długotrwałej i wykorzystać do ułatwienia wyszukiwania znajomych obiektów.

Nachylenie czasu reakcji

Możliwe jest również zmierzenie roli uwagi w eksperymentach wyszukiwania wizualnego poprzez obliczenie nachylenia czasu reakcji w stosunku do liczby obecnych dystraktorów. Ogólnie rzecz biorąc, gdy wymagany jest wysoki poziom uwagi podczas patrzenia na złożony zestaw bodźców ( poszukiwanie koniunkcji ), nachylenie wzrasta wraz ze wzrostem czasu reakcji. W przypadku prostych zadań wyszukiwania wizualnego ( wyszukiwanie funkcji ) nachylenie zmniejsza się, ponieważ czasy reakcji są szybkie i wymagają mniej uwagi. Jednak użycie nachylenia czasu reakcji do pomiaru uwagi jest kontrowersyjne, ponieważ czynniki nieuwagi mogą również wpływać na nachylenie czasu reakcji.

Orientacja wzrokowa i uwaga

Fotografia symulująca płodzenie

Jednym z oczywistych sposobów selekcji informacji wizualnych jest zwrócenie się w ich kierunku, znany również jako orientacja wizualna. Może to być ruch głowy i/lub oczu w kierunku bodźca wzrokowego, zwanego sakadą . Poprzez proces zwany foveation, oczy skupiać na obiekt zainteresowania, dzięki czemu obraz wizualny bodziec upadku na dołka oka, centralnej części siatkówki z najostrzejszego ostrości wzroku.

Istnieją dwa rodzaje orientacji:

  • Orientacja egzogenna to mimowolny i automatyczny ruch, który ma na celu skierowanie uwagi wzrokowej na nagłe zakłócenia w polu widzenia peryferyjnego. Uwaga jest zatem kierowana zewnętrznie przez bodziec, co skutkuje refleksyjną sakadą.
  • Orientacja endogenna to dobrowolny ruch, który występuje w celu skupienia uwagi wzrokowej na bodźcu ukierunkowanym na cel. W ten sposób skupienie uwagi postrzegającego może być manipulowane przez wymagania zadania. Sakkada skanująca jest uruchamiana endogennie w celu zbadania środowiska wzrokowego.
Fabuła sakkad wykonywanych podczas czytania tekstu. Wykres przedstawia ścieżkę ruchów oczu, a wielkość kółek reprezentuje czas spędzony w dowolnym miejscu.

Wyszukiwanie wizualne opiera się głównie na orientacji endogennej, ponieważ uczestnicy mają na celu wykrycie obecności lub nieobecności określonego obiektu docelowego w szeregu innych rozpraszających obiektów.

Wczesne badania sugerowały, że uwaga może być potajemnie (bez ruchu gałek ocznych) przesunięta na bodźce obwodowe, ale późniejsze badania wykazały, że podczas tych zadań występują małe sakady ( mikrosakkady ) i że te ruchy gałek ocznych są często skierowane w stronę obserwowanych miejsc (niezależnie od tego, czy są tam, czy nie). są widoczne bodźce). Wyniki te wskazują, że uwaga odgrywa kluczową rolę w zrozumieniu wyszukiwania wizualnego.

Następnie konkurujące teorie uwagi zdominowały dyskurs dotyczący wyszukiwania wizualnego. Środowisko zawiera ogromną ilość informacji. Jesteśmy ograniczeni w ilości informacji, które jesteśmy w stanie przetworzyć w danym momencie, dlatego konieczne jest posiadanie mechanizmów filtrowania obcych bodźców i uwzględnianie tylko istotnych informacji. W badaniu uwagi psychologowie rozróżniają procesy przeduważne i uwagi. Procesy uważne są równomiernie rozłożone na wszystkich sygnałach wejściowych, tworząc rodzaj uwagi „niskiego poziomu”. Procesy uwagi są bardziej selektywne i mogą być stosowane tylko do konkretnych, pre-uważnych sygnałów wejściowych. Duża część obecnej debaty w teorii poszukiwań wizualnych koncentruje się na uwadze selektywnej i tym, co system wzrokowy jest w stanie osiągnąć bez skupiania uwagi.

Teoria

Teoria integracji cech (FIT)

Popularnym wyjaśnieniem różnych czasów reakcji wyszukiwania cech i koniunkcji jest teoria integracji cech (FIT), wprowadzona przez Treismana i Gelade w 1980 roku. Teoria ta sugeruje, że pewne cechy wizualne są rejestrowane wcześnie, automatycznie i są szybko kodowane równolegle w poprzek. pole widzenia za pomocą procesów przeduważnych. Eksperymenty pokazują, że te cechy obejmują luminancję, kolor, orientację, kierunek ruchu i prędkość, a także kilka prostych aspektów formy. Na przykład czerwony X można szybko znaleźć wśród dowolnej liczby czarnych X i O, ponieważ czerwony X ma cechę odróżniającą kolor i „wyskakuje”. W przeciwieństwie do tego, teoria ta sugeruje również, że aby zintegrować dwie lub więcej cech wizualnych należących do tego samego obiektu, potrzebny jest późniejszy proces obejmujący integrację informacji z różnych obszarów mózgu i jest on kodowany szeregowo przy użyciu uwagi skupionej. Na przykład, przy lokalizowaniu pomarańczowego kwadratu wśród niebieskich kwadratów i pomarańczowych trójkątów, ani cecha koloru „pomarańczowy”, ani cecha kształtu „kwadrat” nie są wystarczające do zlokalizowania poszukiwanego celu. Zamiast tego należy zintegrować informacje o kolorze i kształcie, aby zlokalizować cel.

Dowodem na to, że do zintegrowania dwóch lub więcej cech tego samego obiektu potrzebna jest uwaga, a co za tym idzie późniejsze przetwarzanie wzrokowe, pokazuje występowanie iluzorycznych koniunkcji lub gdy cechy nie łączą się poprawnie Na przykład, gdy wyświetlane jest zielone X i czerwone O są migane na ekranie tak krótko, że późniejszy wizualny proces seryjnego wyszukiwania z fokusem nie może nastąpić, obserwator może zgłosić, że widział czerwone X i zielone O.

FIT jest dychotomią ze względu na rozróżnienie między jej dwoma etapami: etapem przeduważnym i uważnym. Procesy przeduważne to te, które wykonuje się w pierwszym etapie modelu FIT, w którym analizowane są najprostsze cechy obiektu, takie jak kolor, wielkość i układ. Drugi, uważny etap modelu obejmuje przetwarzanie międzywymiarowe, w którym dokonuje się faktycznej identyfikacji obiektu i zestawia się informacje o obiekcie docelowym. Ta teoria nie zawsze była tym, czym jest dzisiaj; pojawiły się spory i problemy z jego propozycjami, które pozwoliły z biegiem czasu poprawiać i modyfikować teorię, a ta krytyka i korekta pozwoliły jej stać się bardziej trafnym w opisie wyszukiwania wizualnego. Pojawiły się spory dotyczące tego, czy istnieje wyraźne rozróżnienie między wykrywaniem cech a innymi wyszukiwaniami, które wykorzystują mapę główną uwzględniającą wiele wymiarów w celu wyszukiwania obiektu. Niektórzy psychologowie popierają ideę, że integracja cech jest całkowicie oddzielna od tego typu wyszukiwania mapy głównej, podczas gdy wielu innych uznało, że integracja cech obejmuje użycie mapy głównej w celu zlokalizowania obiektu w wielu wymiarach.

FIT wyjaśnia również, że istnieje rozróżnienie między procesami mózgowymi, które są używane równolegle, a zadaniami skupiania uwagi. Chan i Hayward przeprowadzili wiele eksperymentów wspierających ten pomysł, demonstrując rolę wymiarów w wyszukiwaniu wizualnym. Badając, czy skupienie uwagi może zmniejszyć koszty spowodowane przełączaniem wymiarów w wyszukiwaniu wizualnym, wyjaśnili, że zebrane wyniki wspierały mechanizmy teorii integracji cech w porównaniu z innymi podejściami opartymi na wyszukiwaniu. Odkryli, że pojedyncze wymiary pozwalają na znacznie wydajniejsze wyszukiwanie, niezależnie od wielkości przeszukiwanego obszaru, ale po dodaniu większej liczby wymiarów znacznie trudniej jest skutecznie przeszukiwać, a im większy obszar jest przeszukiwany, tym dłużej trwa jeden znaleźć cel.

Model wyszukiwania z przewodnikiem

Drugą główną funkcją procesów przeduważnych jest skierowanie uwagi na najbardziej „obiecujące” informacje w polu widzenia. Istnieją dwa sposoby wykorzystania tych procesów do kierowania uwagi: aktywacja oddolna (napędzana bodźcem) i odgórna (napędzana przez użytkownika). W modelu wyszukiwania kierowanego autorstwa Jeremy'ego Wolfe'a informacje z odgórnego i oddolnego przetwarzania bodźca są wykorzystywane do tworzenia rankingu elementów według ich priorytetu uwagi. W wyszukiwaniu wizualnym uwaga zostanie skierowana na element o najwyższym priorytecie. Jeśli ta pozycja zostanie odrzucona, uwaga przeniesie się na następną, następną i tak dalej. Teoria wyszukiwania kierowanego jest zgodna z teorią równoległego przetwarzania wyszukiwania.

Mapa aktywacji jest reprezentacją przestrzeni wizualnej, w której poziom aktywacji w lokalizacji odzwierciedla prawdopodobieństwo, że lokalizacja zawiera cel. Prawdopodobieństwo to opiera się na uważnych informacjach o cechach osoby postrzegającej. Zgodnie z modelem wyszukiwania z przewodnikiem, wstępne przetwarzanie podstawowych funkcji tworzy mapę aktywacji, na której każdy element na wyświetlaczu wizualnym ma swój własny poziom aktywacji. Uwaga jest wymagana w oparciu o szczyty aktywacji na mapie aktywacji w poszukiwaniu celu. Wyszukiwanie wizualne może przebiegać sprawnie lub nieefektywnie. Podczas sprawnego wyszukiwania na wydajność nie ma wpływu liczba elementów rozpraszających. Funkcje czasu reakcji są płaskie i zakłada się, że wyszukiwanie jest wyszukiwaniem równoległym. Zatem w modelu wyszukiwania kierowanego, wyszukiwanie jest wydajne, jeśli cel generuje najwyższe lub jeden z najwyższych pików aktywacji. Załóżmy na przykład, że ktoś szuka czerwonych, poziomych celów. Przetwarzanie cech aktywuje wszystkie czerwone obiekty i wszystkie obiekty poziome. Następnie uwaga skierowana jest na przedmioty w zależności od ich poziomu aktywacji, zaczynając od tych najbardziej aktywowanych. To wyjaśnia, dlaczego czasy wyszukiwania są dłuższe, gdy dystraktory współdzielą jedną lub więcej funkcji z bodźcami docelowymi. W przeciwieństwie do tego, podczas nieefektywnego wyszukiwania, czas reakcji na identyfikację celu wzrasta liniowo wraz z liczbą obecnych elementów rozpraszających. Zgodnie z modelem wyszukiwania kierowanego dzieje się tak, ponieważ szczyt generowany przez cel nie jest jednym z najwyższych.

Podstawa biologiczna

Pseudokolorowy obraz przedstawiający aktywację pierwotnej kory wzrokowej podczas zadania percepcyjnego przy użyciu funkcjonalnego rezonansu magnetycznego (fMRI)

Podczas eksperymentów wyszukiwania wizualnego tylna kora ciemieniowa wywołała znaczną aktywację podczas eksperymentów z funkcjonalnym rezonansem magnetycznym (fMRI) i elektroencefalografią (EEG) w celu nieefektywnego wyszukiwania koniunkcji, co również zostało potwierdzone w badaniach zmian. Pacjenci z uszkodzeniami w tylnej korze ciemieniowej wykazują niską dokładność i bardzo wolne czasy reakcji podczas zadania przeszukiwania koniunkcji, ale przeszukiwanie nienaruszonych cech pozostaje do ipsilezyjnej (tej samej strony ciała, co zmiana) strony przestrzeni. Ashbridge, Walsh i Cowey w (1997) wykazali, że podczas stosowania przezczaszkowej stymulacji magnetycznej (TMS) do prawej kory ciemieniowej, wyszukiwanie koniunkcji było upośledzone o 100 milisekund po wystąpieniu bodźca. Nie znaleziono tego podczas wyszukiwania funkcji. Nobre, Coull, Walsh i Frith (2003) stwierdzili za pomocą funkcjonalnego obrazowania rezonansem magnetycznym (fMRI), że bruzda śródciemieniowa zlokalizowana w górnej korze ciemieniowej została aktywowana specjalnie w celu wyszukiwania cech i wiązania indywidualnych cech percepcyjnych, w przeciwieństwie do wyszukiwania koniunkcyjnego. Odwrotnie, autorzy dalej stwierdzają, że w przypadku wyszukiwania koniunkcji górny płat ciemieniowy i prawy zakręt kątowy pojawiają się obustronnie podczas eksperymentów fMRI.

Wyszukiwanie wizualne aktywuje przede wszystkim obszary płata ciemieniowego.

W przeciwieństwie do tego, Leonards, Sunaert, Vam Hecke i Orban (2000) stwierdzili, że podczas eksperymentów fMRI obserwuje się znaczącą aktywację w górnej bruździe czołowej, głównie w poszukiwaniu koniunkcji. Te badania stawiają hipotezę, że aktywacja w tym regionie może w rzeczywistości odzwierciedlać pamięć roboczą do przechowywania i utrzymywania informacji o bodźcach w celu zidentyfikowania celu. Co więcej, podczas pozytonowej tomografii emisyjnej zaobserwowano znaczną aktywację czołową, w tym obustronnie brzuszno-boczną korę przedczołową i prawą grzbietowo-boczną korę przedczołową w celu uważnych reprezentacji przestrzennych podczas wyszukiwania wizualnego. Te same regiony związane z uwagą przestrzenną w korze ciemieniowej pokrywają się z regionami związanymi z wyszukiwaniem cech. Ponadto, przedczołowe pole oka (FEF) zlokalizowane obustronnie w korze przedczołowej odgrywa kluczową rolę w sakkadowych ruchach gałek ocznych i kontroli uwagi wzrokowej.

Co więcej, badania na małpach i rejestracja pojedynczych komórek wykazały, że wzgórek górny bierze udział w wyborze celu podczas wyszukiwania wzrokowego, a także w inicjowaniu ruchów. Odwrotnie, sugeruje również, że aktywacja wzgórka górnego wynika z odłączenia uwagi, zapewniając, że następny bodziec może być reprezentowany wewnętrznie. Zdolność do bezpośredniego zwracania uwagi na określone bodźce podczas eksperymentów wyszukiwania wzrokowego została powiązana z jądrem płucnym (zlokalizowanym w śródmózgowiu), jednocześnie hamując uwagę na bodźce nienadzorowane. Odwrotnie, Bender i Butter (1987) stwierdzili, że podczas testów na małpach nie stwierdzono zaangażowania jądra płucnego podczas zadań wyszukiwania wzrokowego.

Istnieją dowody dla hipotezy istotności V1, że pierwotna kora wzrokowa (V1) tworzy oddolną mapę istotności, aby kierować uwagę egzogennie, a ta mapa istotności V1 jest odczytywana przez wzgórek wyższy, który otrzymuje sygnały monosynaptyczne od V1.

Ewolucja

Istnieje wiele spekulacji na temat pochodzenia i ewolucji wyszukiwania wzrokowego u ludzi. Wykazano, że podczas wizualnej eksploracji złożonych scen naturalnych zarówno ludzie, jak i naczelne wykonują wysoce stereotypowe ruchy gałek ocznych. Co więcej, szympansy wykazały lepszą wydajność w wyszukiwaniu wzrokowym wyprostowanych twarzy ludzi lub psów, co sugeruje, że wyszukiwanie wzrokowe (szczególnie w przypadku, gdy celem jest twarz) nie jest charakterystyczne dla ludzi i może być cechą pierwotną. Badania sugerują, że skuteczne wyszukiwanie wizualne mogło rozwinąć się jako umiejętność niezbędna do przetrwania, gdzie umiejętność wykrywania zagrożeń i identyfikowania żywności była niezbędna.

Henri Rousseau, Dżungla z lwem

Znaczenie ewolucyjnie istotnych bodźców zagrażających zostało zademonstrowane w badaniu LoBue i DeLoache (2008), w którym dzieci (i dorośli) byli w stanie wykryć węże szybciej niż inne cele wśród bodźców rozpraszających. Jednak niektórzy badacze kwestionują, czy istotne ewolucyjnie bodźce zagrażające są wykrywane automatycznie.

Rozpoznawanie twarzy

W ciągu ostatnich kilku dekad przeprowadzono ogromną ilość badań nad rozpoznawaniem twarzy, które wykazały, że twarze poddawane są specjalistycznemu przetwarzaniu w regionie zwanym wrzecionowatym obszarem twarzy (FFA) zlokalizowanym w środkowym zakręcie wrzecionowatym w płacie skroniowym. Trwają debaty na temat tego, czy zarówno twarze, jak i obiekty są wykrywane i przetwarzane w różnych systemach i czy oba mają regiony specyficzne dla kategorii do rozpoznawania i identyfikacji. Wiele dotychczasowych badań koncentruje się na dokładności wykrywania i czasie potrzebnym na wykrycie twarzy w złożonej tablicy wyszukiwania wizualnego. Gdy twarze są wyświetlane oddzielnie, pionowe twarze są przetwarzane szybciej i dokładniej niż odwrócone twarze, ale efekt ten zaobserwowano również w obiektach niebędących twarzami. Gdy twarze mają zostać wykryte wśród odwróconych lub pomieszanych twarzy, czasy reakcji dla nienaruszonych i pionowych twarzy zwiększają się wraz ze wzrostem liczby dystraktorów w szyku. Stąd argumentuje się, że teoria „wyskakuj” zdefiniowana w wyszukiwaniu cech nie ma zastosowania do rozpoznawania twarzy w takim paradygmacie wyszukiwania wizualnego. Odwrotnie, argumentowano odwrotny efekt, aw naturalnej scenie środowiskowej wyraźnie pokazano efekt „wyskakiwania” twarzy. Może to wynikać z rozwoju ewolucyjnego, ponieważ potrzeba umiejętności identyfikacji twarzy, które wydają się zagrażać jednostce lub grupie, jest uważana za kluczową dla przetrwania najlepiej przystosowanych. Niedawno odkryto, że twarze mogą być skutecznie wykrywane w paradygmacie wyszukiwania wizualnego, jeśli rozpraszacze są obiektami niebędącymi twarzami, jednak dyskutuje się, czy ten pozorny efekt „wyskakiwania” jest napędzany przez mechanizm wysokiego poziomu, czy przez niski funkcje mylące na poziomie. Co więcej, pacjenci z prozopagnozją rozwojową , cierpiący na zaburzenia identyfikacji twarzy, na ogół normalnie rozpoznają twarze, co sugeruje, że wzrokowe wyszukiwanie twarzy jest ułatwione przez mechanizmy inne niż obwody identyfikacji twarzy w obszarze wrzecionowatej twarzy .

Pacjenci z postaciami demencji mogą mieć również deficyty w rozpoznawaniu twarzy i zdolności rozpoznawania ludzkich emocji na twarzy. W metaanalizie dziewiętnastu różnych badań porównujących normalnych dorosłych z pacjentami z demencją pod względem zdolności rozpoznawania emocji mimicznych, stwierdzono, że pacjenci z demencją czołowo-skroniową mają mniejszą zdolność rozpoznawania wielu różnych emocji. Pacjenci ci byli znacznie mniej trafni niż osoby kontrolne (a nawet w porównaniu z pacjentami z chorobą Alzheimera) w rozpoznawaniu negatywnych emocji, ale nie byli istotnie upośledzeni w rozpoznawaniu szczęścia. Szczególnie gniew i wstręt były najtrudniejsze do rozpoznania przez pacjentów z demencją.

Rozpoznawanie twarzy to złożony proces, na który wpływa wiele czynników, zarówno środowiskowych, jak i indywidualnie wewnętrznych. Inne aspekty, które należy wziąć pod uwagę, to rasa i kultura oraz ich wpływ na zdolność rozpoznawania twarzy. Niektóre czynniki, takie jak efekt wyścigu krzyżowego, mogą wpływać na zdolność rozpoznawania i zapamiętywania twarzy.

Rozważania

Starzenie się

Badania wskazują, że wydajność w zadaniach związanych z przeszukiwaniem koniunkcji wizualnej znacznie poprawia się w dzieciństwie i spada w późniejszym życiu. Dokładniej rzecz ujmując, wykazano, że młodzi dorośli szybciej reagują na zadania wyszukiwania wizualnego połączonego niż zarówno dzieci, jak i starsi dorośli, ale ich czasy reakcji były podobne w przypadku zadań wyszukiwania wizualnego funkcji. Sugeruje to, że proces integrowania cech wizualnych lub seryjnego wyszukiwania jest coś trudnego dla dzieci i osób starszych, ale nie dla młodych dorosłych. Badania sugerują liczne mechanizmy zaangażowane w tę trudność u dzieci, w tym obwodową ostrość wzroku, zdolność poruszania oczami, zdolność koncentracji uwagi i zdolność dzielenia uwagi wzrokowej na wiele obiektów.

Badania sugerują podobne mechanizmy trudności dla osób starszych, takie jak związane z wiekiem zmiany optyczne, które wpływają na ostrość obwodową, zdolność do przenoszenia uwagi na pole widzenia, zdolność do odłączania uwagi i zdolność ignorowania dystraktorów.

Badanie Lorenzo-Lópeza i in. (2008) dostarcza neurologicznych dowodów na to, że starsi dorośli mają wolniejszy czas reakcji podczas wyszukiwania łącznego w porównaniu z młodymi dorosłymi. Potencjały związane ze zdarzeniami (ERP) wykazywały dłuższe opóźnienia i niższe amplitudy u osób starszych niż młodych dorosłych w komponencie P3 , co jest związane z aktywnością płatów ciemieniowych. Sugeruje to zaangażowanie funkcji płata ciemieniowego ze związanym z wiekiem spadkiem szybkości zadań wyszukiwania wzrokowego. Wyniki pokazały również, że starsi dorośli, w porównaniu z młodymi dorosłymi, mieli znacznie mniejszą aktywność w przedniej korze zakrętu obręczy oraz w wielu obszarach limbicznych i potyliczno-skroniowych, które są zaangażowane w wykonywanie zadań wyszukiwania wizualnego.

Choroba Alzheimera

Badania wykazały, że osoby z chorobą Alzheimera (AD) są ogólnie znacznie upośledzone w zadaniach wyszukiwania wzrokowego. Co zaskakujące, osoby cierpiące na AD wykazują zwiększone wskazówki przestrzenne, ale tę korzyść można uzyskać tylko w przypadku wskazówek o wysokiej precyzji przestrzennej. Nieprawidłowa uwaga wzrokowa może leżeć u podstaw pewnych trudności wzrokowo-przestrzennych u pacjentów z (AD). Osoby z AD mają hipometabolizm i neuropatologię w korze ciemieniowej, a biorąc pod uwagę rolę funkcji ciemieniowej w zwracaniu uwagi wzrokowej, pacjenci z AD mogą cierpieć na zaniedbanie połowo-przestrzenne , co może skutkować trudnościami z oderwaniem uwagi podczas wyszukiwania wzrokowego.

Eksperyment przeprowadzony przez Tales et al. (2000) badali zdolność pacjentów z AD do wykonywania różnego rodzaju zadań wyszukiwania wzrokowego. Ich wyniki pokazały, że wskaźniki wyszukiwania w zadaniach „wyskakujących” były podobne zarówno w grupie z AD, jak i w grupie kontrolnej, jednak osoby z AD wyszukiwały znacznie wolniej w porównaniu z grupą kontrolną przy zadaniu połączonym. Jedną z interpretacji tych wyników jest to, że układ wzrokowy pacjentów z AD ma problem z wiązaniem cech, tak że nie jest w stanie skutecznie komunikować różnych opisów cech dla bodźca. Uważa się, że w wiązaniu cech pośredniczą obszary w korze skroniowej i ciemieniowej, a na te obszary wpływa patologia związana z AD.

Inną możliwością upośledzenia osób z AD podczas wyszukiwania łącznego jest to, że mogą wystąpić pewne uszkodzenia ogólnych mechanizmów uwagi w AD, a zatem wpłynie to na każde zadanie związane z uwagą, w tym wyszukiwanie wzrokowe.

Opowieści i in. (2000) wykryli podwójną dysocjację z wynikami eksperymentalnymi dotyczącymi AD i wyszukiwania wizualnego. Wcześniej przeprowadzono prace na pacjentach z chorobą Parkinsona (PD) dotyczące upośledzenia funkcji wzrokowych pacjentów z ChP. W tych badaniach znaleziono dowody na upośledzenie u pacjentów z PD w zadaniu „wyskakuj”, ale nie znaleziono dowodów na upośledzenie zadania łącznego. Jak omówiono, pacjenci z AD wykazują dokładne przeciwieństwo tych wyników: zaobserwowano normalne działanie w zadaniu „wyskakuj”, ale stwierdzono upośledzenie w zadaniu koniunkcji. Ta podwójna dysocjacja dostarcza dowodów na to, że PD i AD wpływają na ścieżkę wzrokową na różne sposoby oraz że zadanie wyskakującego okienka i zadanie koniunkcji są różnie przetwarzane w tej ścieżce.

Autyzm

Badania konsekwentnie wykazały, że osoby z autyzmem radziły sobie lepiej iz krótszym czasem reakcji w zadaniach wyszukiwania cech i łącznych wzrokowych zadań niż osoby kontrolne bez autyzmu. Zasugerowano kilka wyjaśnień tych obserwacji. Jedną z możliwości jest to, że osoby z autyzmem mają zwiększoną zdolność percepcyjną. Oznacza to, że osoby z autyzmem są w stanie przetwarzać większe ilości informacji percepcyjnych, co pozwala na lepsze przetwarzanie równoległe, a tym samym szybszą lokalizację docelową. Po drugie, osoby z autyzmem wykazują lepszą wydajność w zadaniach rozróżniania podobnych bodźców, a zatem mogą mieć zwiększoną zdolność do rozróżniania elementów na ekranie wyszukiwania wizualnego. Trzecią sugestią jest to, że osoby z autyzmem mogą mieć silniejsze odgórne przetwarzanie wzbudzania celu i silniejsze przetwarzanie hamowania dystraktora niż osoby z grupy kontrolnej. Keehn i in. (2008) wykorzystali projekt funkcjonalnego obrazowania rezonansu magnetycznego związanego ze zdarzeniami do badania neurofunkcjonalnych korelatów wyszukiwania wzrokowego u dzieci autystycznych i dopasowanych grup kontrolnych dzieci typowo rozwijających się. Dzieci z autyzmem wykazywały lepszą skuteczność wyszukiwania i zwiększone wzorce aktywacji neuronów w płatach czołowych, ciemieniowych i potylicznych w porównaniu z typowo rozwijającymi się dziećmi. Tak więc lepsze wyniki osób z autyzmem w zadaniach wyszukiwania wzrokowego mogą wynikać ze zwiększonej dyskryminacji elementów na wyświetlaczu, która jest związana z aktywnością potyliczną, oraz ze zwiększonych odgórnych przesunięć uwagi wzrokowej, która jest związana z obszarami czołowymi i ciemieniowymi.

Psychologia konsumenta

W ostatniej dekadzie przeprowadzono szeroko zakrojone badania nad tym, w jaki sposób firmy mogą maksymalizować sprzedaż za pomocą technik psychologicznych wywodzących się z wyszukiwania wizualnego, aby określić, jak produkty powinny być pozycjonowane na półkach. Pieters i Warlop (1999) wykorzystali urządzenia do śledzenia wzroku do oceny sakad i fiksacji konsumentów podczas wizualnego skanowania/przeszukiwania szeregu produktów na półce w supermarkecie. Z ich badań wynika, że ​​konsumenci w szczególności kierują swoją uwagę na produkty o przyciągających wzrok właściwościach, takich jak kształt, kolor czy nazwa marki. Efekt ten wynika z presji wzrokowej, w której ruchy gałek ocznych przyspieszają, a sakkady minimalizują się, co powoduje, że konsument szybko wybiera produkt z efektem „wyskakiwania”. Badanie to sugeruje, że stosuje się przede wszystkim efektywne wyszukiwanie, stwierdzając, że konsumenci nie skupiają się na przedmiotach, które mają bardzo podobne cechy. Im bardziej wyraźny lub maksymalnie wizualnie różni się produkt od otaczających go produktów, tym większe prawdopodobieństwo, że konsument go zauważy. Janiszewski (1998) omówił dwa rodzaje poszukiwań konsumenckich. Jednym z typów wyszukiwania jest wyszukiwanie ukierunkowane na cel, które ma miejsce, gdy ktoś wykorzystuje zgromadzoną wiedzę o produkcie w celu dokonania wyboru zakupu. Drugi to poszukiwanie eksploracyjne. Dzieje się tak, gdy konsument ma minimalną wcześniejszą wiedzę na temat wyboru produktu. Stwierdzono, że w przypadku wyszukiwania eksploracyjnego ludzie zwracaliby mniejszą uwagę na produkty, które zostały umieszczone w obszarach konkurencyjnych wizualnie, takich jak środek półki na optymalnej wysokości oglądania. Wynikało to przede wszystkim z konkurencji na uwagę, co oznacza, że ​​w przypadku tych produktów w wizualnej pamięci roboczej zachowywano mniej informacji.

Bibliografia