Model poznawczy - Cognitive model

Poznawczych modelu jest przybliżeniem zwierząt procesów poznawczych (szczególnie człowiek) dla celów zrozumienia i prognozowania. Istnieje wiele typów modeli poznawczych, od diagramów w kształcie prostokąta po zestaw równań i programy, które współdziałają z tymi samymi narzędziami, których ludzie używają do wykonywania zadań (np. Mysz komputerowa i klawiatura).

Związek z architekturami poznawczymi

Modele poznawcze można rozwijać w ramach architektury poznawczej lub bez niej , chociaż nie zawsze można je łatwo rozróżnić. W przeciwieństwie do architektur poznawczych, modele poznawcze zwykle koncentrują się na pojedynczym zjawisku lub procesie poznawczym (np. Uczeniu się na listach), na tym, jak dwa lub więcej procesów oddziałują na siebie (np. Przeszukiwanie wizualne bsc1780) lub na prognozach behawioralnych dla określonego zadania lub narzędzie (np. jak wprowadzenie nowego pakietu oprogramowania wpłynie na produktywność). Architektury poznawcze zwykle koncentrują się na właściwościach strukturalnych modelowanego systemu i pomagają ograniczyć rozwój modeli poznawczych w architekturze. Podobnie rozwój modelu pomaga informować o ograniczeniach i wadach architektury. Niektóre z najpopularniejszych architektur modelowania poznawczego to ACT-R , Clarion , LIDA i Soar .

Historia

Modelowanie poznawcze historycznie opracowane w ramach psychologii poznawczej / nauk kognitywnych (w tym czynników ludzkich ) i otrzymało wkład między innymi z dziedzin uczenia maszynowego i sztucznej inteligencji .

Modele typu box-and-arrow

Do opisania procesów związanych z percepcją, przechowywaniem i wytwarzaniem mowy używa się szeregu kluczowych terminów. Zazwyczaj są one używane przez logopedów podczas leczenia dziecka. Sygnał wejściowy to sygnał mowy słyszany przez dziecko, zwykle pochodzący od osoby dorosłej. Sygnałem wyjściowym jest wypowiedź dziecka. Modele psycholingwistyczne koncentrują się na niewidocznych wydarzeniach psychologicznych, które zachodzą między nadejściem sygnału wejściowego a pojawieniem się mowy. Zdarzenia przetwarzające sygnał wejściowy nazywane są procesami wejściowymi, podczas gdy zdarzenia, które przetwarzają wytwarzanie mowy, nazywane są procesami wyjściowymi. Uważa się, że niektóre aspekty przetwarzania mowy zachodzą w trybie online - to znaczy występują podczas faktycznego postrzegania lub wytwarzania mowy, a zatem wymagają udziału zasobów uwagi poświęconych zadaniu mowy. Inne procesy, o których uważa się, że zachodzą w trybie offline, zachodzą raczej jako część umysłowego przetwarzania dziecka w tle, a nie w czasie poświęconym zadaniu mowy. W tym sensie przetwarzanie online jest czasami definiowane jako występujące w czasie rzeczywistym, podczas gdy przetwarzanie offline jest określane jako wolne od czasu (Hewlett, 1990). W psycholingwistycznych modelach typu „pudełko i strzałka” każdy hipotetyczny poziom reprezentacji lub przetwarzania można przedstawić na diagramie za pomocą „ramki”, a relacje między nimi za pomocą „strzałek”, stąd nazwa. Czasami (jak w modelach Smitha, 1973 i Menna, 1978, opisanych w dalszej części artykułu) strzałki reprezentują procesy dodatkowe do tych przedstawionych w ramkach. Modele takie jasno określają hipotetyczne czynności przetwarzania informacji wykonywane w ramach określonej funkcji poznawczej (takiej jak język), w sposób analogiczny do komputerowych schematów blokowych, które przedstawiają procesy i decyzje podejmowane przez program komputerowy. Modele typu „pudełko i strzałka” znacznie różnią się liczbą niewidocznych procesów psychologicznych, które opisują, a tym samym liczbą pól, które zawierają. Niektóre mają tylko jedno lub dwa pola między sygnałami wejściowymi i wyjściowymi (np. Menn, 1978; Smith, 1973), podczas gdy inne mają wiele pól reprezentujących złożone relacje między wieloma różnymi zdarzeniami przetwarzania informacji (np. Hewlett, 1990; Hewlett , Gibbon i Cohen-McKenzie, 1998; Stackhouse & Wells, 1997). Jednak najważniejszą ramką i źródłem wielu toczących się debat jest ta reprezentująca podstawową reprezentację (lub UR). Zasadniczo podstawowa reprezentacja przechwytuje informacje przechowywane w umyśle dziecka na temat słowa, które zna i używa. Jak ilustruje poniższy opis kilku modeli, charakter tych informacji, a tym samym typ (y) reprezentacji obecne w bazie wiedzy dziecka, od jakiegoś czasu przyciągają uwagę badaczy. (Elise Baker i in. Psycholingwistyczne modele rozwoju mowy i ich zastosowanie w praktyce klinicznej. Journal of Speech, Language, and Hearing Research. Czerwiec 2001. 44. str. 685–702.)

Modele obliczeniowe

Model obliczeniowy jest model matematyczny w informatyce , która wymaga obszernych zasobów obliczeniowych do badania zachowania złożonego systemu przez symulacji komputerowej. Badany system jest często złożonym systemem nieliniowym, dla którego proste, intuicyjne rozwiązania analityczne nie są łatwo dostępne. Zamiast wyprowadzać matematyczne, analityczne rozwiązanie problemu, eksperymentuje się z modelem, zmieniając parametry systemu w komputerze i badając różnice w wynikach eksperymentów. Teorie działania modelu można wyprowadzić / wydedukować z tych eksperymentów obliczeniowych. Przykładami typowych modeli obliczeniowych są modele prognozowania pogody, modele symulatorów Ziemi, modele symulatorów lotu, modele składania białek molekularnych i modele sieci neuronowych.

Symboliczny

Symboliczny model jest wyrażona w postaci, zwykle te, które non-numeryczne, które wymagają tłumaczenia, zanim będą mogły być wykorzystane.

Podsymboliczny

Model poznawczy jest podsymboliczny, jeśli jest tworzony przez byty składowe, które z kolei nie są reprezentacjami, np. Piksele, obrazy dźwiękowe odbierane przez ucho, próbki sygnałów; Jednostki podsymboliczne w sieciach neuronowych można uznać za szczególne przypadki tej kategorii.

Hybrydowy

Komputery hybrydowe to komputery, które wykazują cechy komputerów analogowych i komputerów cyfrowych. Komponent cyfrowy zwykle służy jako kontroler i zapewnia operacje logiczne, podczas gdy komponent analogowy normalnie służy jako narzędzie do rozwiązywania równań różniczkowych. Zobacz więcej szczegółów w hybrydowym systemie inteligentnym .

Układy dynamiczne

W tradycyjnej metody obliczeniowej , reprezentacje są postrzegane jako statycznych struktur nieciągłych symboli . Poznanie odbywa się poprzez przekształcanie statycznych struktur symboli w dyskretne , sekwencyjne kroki. Informacje sensoryczne są przetwarzane na symboliczne dane wejściowe, które wytwarzają symboliczne sygnały wyjściowe, które są przekształcane w sygnały silnika . Cały system działa w ciągłym cyklu.

Brakuje tego tradycyjnego poglądu, że ludzkie poznanie zachodzi w sposób ciągły iw czasie rzeczywistym. Podział procesów na dyskretne etapy może nie w pełni uchwycić to zachowanie. Alternatywnym podejściem jest zdefiniowanie systemu z (1) stanem systemu w dowolnym momencie, (2) zachowaniem, zdefiniowanym jako zmiana w czasie w stanie ogólnym oraz (3) zestawem stanów lub przestrzenią stanów , reprezentującą całość ogólnych stanów, w jakich może znajdować się system. System wyróżnia się tym, że zmiana dowolnego aspektu stanu systemu zależy od innych aspektów tego samego lub innych stanów systemu.

Typowy model dynamiczny jest sformalizowany za pomocą kilku równań różniczkowych, które opisują, jak zmienia się stan systemu w czasie. W ten sposób forma przestrzeni możliwych trajektorii oraz siły wewnętrzne i zewnętrzne, które kształtują określoną trajektorię, rozwijają się w czasie, zamiast fizycznej natury mechanizmów leżących u podstaw tej dynamiki, niosą ze sobą siłę wyjaśniającą. W tym dynamicznym ujęciu dane wejściowe parametryczne zmieniają wewnętrzną dynamikę systemu, zamiast określać stan wewnętrzny, który opisuje jakiś zewnętrzny stan rzeczy.

Wczesne układy dynamiczne

Pamięć asocjacyjna

Wczesne prace nad zastosowaniem systemów dynamicznych do poznania można znaleźć w modelu sieci Hopfielda . Sieci te zostały zaproponowane jako model pamięci asocjacyjnej . Reprezentują neuronowy poziom pamięci , modelując systemy około 30 neuronów, które mogą być włączone lub wyłączone. Pozwalając sieci uczyć się samodzielnie, w naturalny sposób powstają struktura i właściwości obliczeniowe. W przeciwieństwie do poprzednich modeli „wspomnienia” można tworzyć i przywoływać, wprowadzając niewielką część całej pamięci. Można również zakodować porządek czasowy pamięci. Zachowanie systemu jest modelowane za pomocą wektorów, które mogą zmieniać wartości, reprezentując różne stany systemu. Ten wczesny model był dużym krokiem w kierunku dynamicznego, systemowego spojrzenia na ludzkie poznanie, chociaż wiele szczegółów nie zostało jeszcze dodanych i uwzględniono więcej zjawisk.

Nauka języka

Biorąc pod uwagę ewolucyjny rozwój ludzkiego układu nerwowego i podobieństwo mózgu do innych narządów, Elman zaproponował, że język i poznanie powinny być traktowane jako system dynamiczny, a nie cyfrowy procesor symboli. Sieci neuronowe typu zaimplementowanego przez Elmana stały się znane jako sieci Elmana . Zamiast traktować język jako zbiór statycznych pozycji leksykalnych i reguł gramatycznych , których się uczy, a następnie stosuje zgodnie z ustalonymi regułami, widok systemów dynamicznych definiuje leksykon jako obszary przestrzeni stanów w systemie dynamicznym. Gramatyka składa się z atraktorów i repelentów, które ograniczają ruch w przestrzeni stanów. Oznacza to, że reprezentacje są wrażliwe na kontekst, a reprezentacje mentalne są postrzegane jako trajektorie w przestrzeni mentalnej, a nie jako obiekty, które są skonstruowane i pozostają statyczne. Sieci Elmana zostały przeszkolone za pomocą prostych zdań, aby przedstawić gramatykę jako system dynamiczny. Po opanowaniu podstawowej gramatyki sieci mogły następnie analizować złożone zdania, przewidując, które słowa pojawią się jako następne zgodnie z modelem dynamicznym.

Rozwój poznawczy

Klasyczny błąd rozwojowy został zbadany w kontekście systemów dynamicznych: proponuje się, aby błąd A-nie-B nie był wyraźnym błędem występującym w określonym wieku (od 8 do 10 miesięcy), ale cechą dynamicznego procesu uczenia się, która występuje również u starszych dzieci. Stwierdzono, że dzieci w wieku 2 lat popełniają błąd podobny do błędu A-nie-B podczas wyszukiwania zabawek ukrytych w piaskownicy. Po zaobserwowaniu, że zabawka jest ukryta w lokalizacji A i wielokrotnym szukaniu jej tam, dwulatkom pokazano zabawkę ukrytą w nowej lokalizacji B.Gdy szukali zabawki, szukali w lokalizacjach, które były skierowane w stronę lokalizacji A Sugeruje to, że istnieje ciągła reprezentacja lokalizacji zabawki, która zmienia się w czasie. Wcześniejsze zachowanie dziecka wpływa na jego model lokalizacji piaskownicy, a zatem opis zachowania i uczenia się musi uwzględniać, jak system piaskownicy i przeszłe działania dziecka zmieniają się w czasie.

Lokomocja

Jeden z proponowanych mechanizmów systemu dynamicznego pochodzi z analizy powtarzających się sieci neuronowych w czasie ciągłym (CTRNN). Koncentrując się na danych wyjściowych sieci neuronowych, a nie na ich stanach, i badając w pełni połączone ze sobą sieci, trójneuronowy centralny generator wzorców (CPG) może być użyty do reprezentowania systemów, takich jak ruchy nóg podczas chodzenia. CPG zawiera trzy neurony ruchowe, które kontrolują stopę, ruch do tyłu i do przodu efektory nogi. Dane wyjściowe sieci przedstawiają, czy stopa jest podniesiona, czy opuszczona oraz jaka siła jest przykładana do wytworzenia momentu obrotowego w stawie nogi. Jedną z cech tego wzorca jest to, że wyjścia neuronów są przez większość czasu wyłączone lub włączone . Inną cechą jest to, że stany są quasi-stabilne, co oznacza, że ​​ostatecznie przejdą do innych stanów. Proponuje się, że prosty obwód generatora wzorców, taki jak ten, będzie elementem konstrukcyjnym systemu dynamicznego. Zbiory neuronów, które jednocześnie przechodzą z jednego quasi-stabilnego stanu do drugiego, definiuje się jako moduł dynamiczny. Te moduły można teoretycznie łączyć, aby tworzyć większe obwody, które składają się na kompletny system dynamiczny. Jednak szczegóły tego, jak ta kombinacja mogłaby wystąpić, nie zostały w pełni opracowane.

Nowoczesne układy dynamiczne

Dynamika behawioralna

Współczesne formalizacje systemów dynamicznych stosowane w badaniu poznania są różne. Jedna z takich formalizacji, określana jako „dynamika behawioralna”, traktuje sprawcę i środowisko jako parę sprzężonych systemów dynamicznych opartych na klasycznej teorii systemów dynamicznych. W tej formalizacji informacje ze środowiska informują o zachowaniu agenta, a działania agenta modyfikują środowisko. W szczególnym przypadku cykli percepcja-działanie sprzężenie środowiska i sprawcy jest sformalizowane przez dwie funkcje . Pierwsza przekształca reprezentację działania czynników w określone wzorce aktywacji mięśni, które z kolei wytwarzają siły w środowisku. Druga funkcja przekształca informacje ze środowiska (tj. Wzorce stymulacji na receptorach agenta, które odzwierciedlają aktualny stan środowiska) na reprezentację, która jest przydatna do kontrolowania działań agentów. Zaproponowano inne podobne układy dynamiczne (chociaż nie rozwinięto ich w formalne ramy), w których układ nerwowy agenta, jego ciało i środowisko są ze sobą sprzężone

Zachowania adaptacyjne

Dynamika behawioralna została zastosowana do zachowania lokomotyw. Modelowanie lokomocji za pomocą dynamiki behawioralnej pokazuje, że zachowania adaptacyjne mogą wynikać z interakcji agenta i środowiska. Zgodnie z tymi ramami zachowania adaptacyjne można uchwycić na dwóch poziomach analizy. Na pierwszym poziomie percepcji i działania agent i środowisko mogą być konceptualizowane jako para dynamicznych systemów połączonych ze sobą siłami, które agent przykłada do środowiska, oraz ustrukturyzowanymi informacjami dostarczanymi przez środowisko. Zatem dynamika behawioralna wyłania się z interakcji agent-środowisko. Na drugim poziomie ewolucji czasu zachowanie można wyrazić jako układ dynamiczny reprezentowany jako pole wektorowe. W tym polu wektorowym atraktory odzwierciedlają stabilne rozwiązania behawioralne, gdzie bifurkacje odzwierciedlają zmiany w zachowaniu. W przeciwieństwie do wcześniejszych prac nad centralnymi generatorami wzorców, ta struktura sugeruje, że stabilne wzorce zachowań są wyłaniającą się, samoorganizującą się właściwością systemu agent-środowisko, a nie są determinowane przez strukturę agenta lub środowiska.

Otwarte układy dynamiczne

Jako rozszerzenie klasycznej teorii systemów dynamicznych , zamiast sprzęgania ze sobą systemów dynamicznych środowiska i agenta, „otwarty system dynamiczny” definiuje „system całkowity”, „system agentowy” oraz mechanizm powiązania tych dwóch systemów. . Cały system to system dynamiczny, który modeluje agenta w środowisku, podczas gdy system agenta jest systemem dynamicznym, który modeluje wewnętrzną dynamikę agenta (tj. Dynamikę agenta w przypadku braku środowiska). Co ważne, mechanizm relacji nie łączy ze sobą dwóch systemów, ale raczej w sposób ciągły modyfikuje cały system w całkowity system odsprzęgniętego agenta. Rozróżniając systemy całkowite i agentowe, można zbadać zachowanie agenta, gdy jest on odizolowany od środowiska i gdy jest osadzony w środowisku. Ta formalizacja może być postrzegana jako uogólnienie z klasycznej formalizacji, gdzie system agentowy może być postrzegany jako system agentowy w otwartym systemie dynamicznym, a agent połączony ze środowiskiem i środowiskiem może być postrzegany jako system całkowity w otwartym układ dynamiczny.

Poznanie ucieleśnione

W kontekście systemów dynamicznych i ucieleśnionego poznania reprezentacje można konceptualizować jako wskaźniki lub mediatory. W widoku wskaźnika stany wewnętrzne niosą informację o istnieniu obiektu w środowisku, gdzie stan systemu w czasie ekspozycji na obiekt jest reprezentacją tego obiektu. Zdaniem mediatora, stany wewnętrzne niosą ze sobą informacje o środowisku, z którego system korzysta w osiąganiu swoich celów. W tym bardziej złożonym ujęciu stany systemu przenoszą informacje, które pośredniczą między informacjami, które agent pobiera ze środowiska, a siłą wywieraną na środowisko przez zachowanie agentów. Zastosowanie otwartych systemów dynamicznych zostało omówione dla czterech typów przykładów klasycznego poznania ucieleśnionego:

  1. Przypadki, w których środowisko i agent muszą współpracować, aby osiągnąć cel, określany jako „intymność”. Klasycznym przykładem intymności jest zachowanie prostych agentów dążących do osiągnięcia celu (np. Owady przemierzające otoczenie). Pomyślna realizacja celu zależy w pełni od sprzężenia agenta ze środowiskiem.
  2. Wystąpienia, w których użycie artefaktów zewnętrznych poprawia wydajność zadań w stosunku do wydajności bez tych artefaktów. Proces ten nazywany jest „odciążaniem”. Klasycznym przykładem odciążania jest zachowanie graczy Scrabble ; ludzie są w stanie stworzyć więcej słów podczas gry w Scrabble, jeśli mają przed sobą płytki i mogą fizycznie manipulować ich układem. W tym przykładzie kafelki Scrabble pozwalają agentowi na przeniesienie zapotrzebowania na pamięć roboczą na same kafelki.
  3. Wystąpienia, w których funkcjonalnie równoważny artefakt zewnętrzny zastępuje funkcje, które są zwykle wykonywane wewnętrznie przez agenta, co jest szczególnym przypadkiem odciążania. Jednym ze słynnych przykładów jest nawigacja człowieka (w szczególności agentów Otto i Inga) w złożonym środowisku z pomocą artefaktu lub bez niej.
  4. Przypadki, w których nie ma jednego agenta. Indywidualny agent jest częścią większego systemu, który zawiera wielu agentów i wiele artefaktów. Jednym ze słynnych przykładów, sformułowanych przez Eda Hutchinsa w jego książce Cognition in the Wild , jest nawigacja na statku morskim.

Interpretacje tych przykładów opierają się na następującej logice : (1) cały system oddaje ucieleśnienie; (2) jeden lub więcej systemów agentów uchwyci wewnętrzną dynamikę poszczególnych agentów; (3) całkowite zachowanie agenta można rozumieć jako zmianę wewnętrznej dynamiki agenta w odniesieniu do jego sytuacji w środowisku; oraz (4) ścieżki otwartego systemu dynamicznego można interpretować jako procesy reprezentacyjne. Te przykłady ucieleśnionego poznania pokazują, jak ważne jest badanie wyłaniającej się dynamiki systemów agent-środowisko, a także wewnętrznej dynamiki systemów agentowych. Zamiast być w sprzeczności z tradycyjnymi podejściami kognitywnymi, systemy dynamiczne są naturalnym rozszerzeniem tych metod i powinny być badane równolegle, a nie w konkurencji.

Zobacz też

Bibliografia

Linki zewnętrzne