Szybować architekturę (poznawcze) - Soar (cognitive architecture)


Z Wikipedii, wolnej encyklopedii

Soar jest poznawczy architektura , pierwotnie stworzony przez Johna Laird , Allen Newell i Pawła Rosenbloom na Carnegie Mellon University . (Rosenbloom nadal służyć jako jeden z głównych badaczy po przeprowadzce do Stanford University , następnie na University of Southern California „s Information Sciences Institute). Obecnie jest utrzymywany i rozwijany przez grupę badawczą Johna Laird na University of Michigan .

Celem projektu szybować jest opracowanie stałych obliczeniowych cegiełki potrzebne do ogólnych inteligentnych agentów - Agenci, które może wykonać szereg zadań i zakodować, użytkowania oraz poznać wszystkie rodzaje wiedzy w celu realizacji pełnego zakresu możliwości poznawczych występujących w ludzie, takie jak podejmowanie decyzji, rozwiązywanie problemów, planowanie i rozumienia języka naturalnego. Jest to zarówno teoria, co poznanie jest a obliczeniowa wdrożenie tej teorii. Od swoich początków w 1983 roku jako John Laird tezy, został on powszechnie stosowany przez badaczy AI tworzenie inteligentnych agentów i modeli poznawczych różnych aspektów ludzkiego zachowania . Najbardziej aktualny i wyczerpujący opis Soar jest książka 2012, Soar Cognitive Architecture.

Teoria

Szybować uosabia wiele hipotez na temat struktur obliczeniowych bazowych ogólną inteligencję , z których wiele wspólnych z innych architektur poznawczych, w tym ACT-R , który został stworzony przez Johna R. Anderson i LIDA , który został stworzony przez Stana Franklin . Ostatnio, nacisk na Soar został na ogólnym AI (funkcjonalności i wydajności), natomiast nacisk na ACT-R była zawsze na modelowaniu poznawczego (szczegółowy modelowania ludzkiego poznania).

Oryginalny teoria poznania leżącej Soar jest problem przestrzeni Hipoteza, która jest opisana w Allen Newell książki „s, Unified Teorie poznania . i sięga do jednego z pierwszych systemów AI utworzonych, Newell, Simon i Shaw „s Logic Teoretyk , po raz pierwszy zaprezentowany w roku 1955. Problem przestrzeni hipotez utrzymuje, że wszystkie zachowania celowych może być rzucony jak przeglądać przestrzeni możliwych stanów (a przestrzeń błąd ) podczas próby do osiągnięcia celu. Na każdym etapie, wybrany jest tylko jeden operator, a następnie stosuje się do aktualnego stanu tego środka, co może prowadzić do zmian wewnętrznych, takich jak pobieranie wiedzy z pamięci długotrwałej lub modyfikacje lub działań zewnętrznych na świecie. (Nazwa Soar jest pochodzący z tego podstawowego cyklu Stanu, operator, i rezultatu;. Jednak to nie jest już traktowane jako akronim) Nieodłącznym do problemu przestrzeni hipoteza jest, że wszystkie zachowania, nawet złożona aktywność takich jak planowanie, jest rozkładalny na sekwencję doboru i stosowania prymitywnych operatorów, który po odwzorowanych na ludzkie zachowanie wziąć ~ 50ms.

Druga hipoteza wznieść się teorią jest to, że chociaż tylko jeden operator może zostać wybrana w każdym punkcie, zmuszając szeregowego gardła, sposoby doboru i zastosowania są realizowane za pomocą równoległych wypalania reguł, które zapewniają odzyskiwanie kontekstowe zależne od wiedzy procesowej.

Trzecia hipoteza jest taka, że jeśli wiedza, aby wybrać lub zastosować operator jest niekompletne lub niepewne, impas i architektura powstaje automatycznie tworzy substate. W podstanie, ten sam proces rozwiązywania problemu jest rekurencyjnie używany, ale z bramki do pobierania lub odkryj wiedzę tak, że podejmowanie decyzji może być kontynuowana. Może to prowadzić do stosu podstanami, gdzie tradycyjne metody problemowe, takie jak planowanie czy hierarchicznej dekompozycji zadań , naturalnie pojawić. Kiedy wyniki utworzone w podstanie rozwiązać ten impas, podstanu i związane z nią struktury są usuwane. Ogólne podejście nazywa Uniwersalny Subgoaling.

Założenia te prowadzą do architektury, która obsługuje trzy poziomy przetwarzania. Na najniższym poziomie, jest od dołu do góry, równolegle i automatyczne przetwarzanie. Kolejny poziom to poziom obradującym, gdzie wiedza od pierwszego poziomu służy do zaproponowania, wybrać i zastosować jedną akcję. Te dwa poziomy wdrożenie szybkiej, wykwalifikowanej zachowanie, a grubsza odpowiadają Kahneman za system 1 poziomie przetwarzania. Bardziej złożone zachowanie powstaje automatycznie, gdy wiedza jest niepełny lub niepewne, za pośrednictwem trzeciego stopnia obróbki za pomocą podstanami, co w przybliżeniu odpowiada System 2.

Czwarta hipoteza jest taka, że ​​w Soar podstawowa konstrukcja jest modułowa, ale nie chodzi o zadania lub modułów zdolności opartej takich jak planowanie czy języka, ale zamiast jak zadaniowych niezależnych modułów w tym: a moduł podejmowania decyzji; moduły pamięci (krótkoterminowe przestrzenne / wizualne i pracujących wspomnienia; długoterminowe proceduralne, deklaratywne i epizodyczne wspomnienia), mechanizmy związane ze wszystkimi wspomnieniami długoterminowych nauki; i percepcyjne i motoryczne moduły. Istnieją również inne założenia dotyczące specyficznych właściwości tych wspomnień opisane poniżej, w tym wszystkim uczenie się online i przyrostowe.

Piąty hipotezą jest to, że elementy pamięci (z wyjątkiem tych, w pamięci przestrzennej / wideo) są reprezentowane symbolicznych relacyjnych struktur. Hipoteza, że układ symboliczny jest konieczne dla ogólnej inteligencji jest znany jako fizyczny system symboli hipotezy . Ważnym ewolucja w Soar jest to, że wszystkie struktury symboliczne mają związane metadanych statystycznych (takich jak informacje na temat bieżącej praktyki oraz częstotliwości użytkowania lub oczekiwanym przyszłej nagrody), który wpływa na pobieranie, konserwację oraz naukę struktur symbolicznych.

Architektura

Cykl przetwarzania - Decyzja Procedura

Główny cykl wznieść się na przetwarzanie wynika z interakcji między pamięci proceduralnej (jego wiedzy o tym, jak robić rzeczy) i pamięci roboczej (jego reprezentacja bieżącej sytuacji), aby wspierać wybór i zastosowanie operatorów. Informacje zawarte w pamięci roboczej są reprezentowane jako symbolicznej struktury wykres , osadzonych w stanie. Wiedza w pamięci proceduralnej jest reprezentowany jako if-then zasady (zestawy warunków i działań), które są stale porównywana z zawartością pamięci roboczej. Jeżeli warunki określone reguły mecze struktur w pamięci roboczej, to pożary i wykonuje swoje działania. Ta kombinacja zasad i pamięci roboczej jest również nazywany systemem produkcyjnym . W przeciwieństwie do większości systemów produkcyjnych, w Soar, wszystkie reguły, które pasują, ogień równolegle.

Zamiast podejmowania wyboru jednej regule stanowiącej sedno podejmowania decyzji, Soar decyzja następuje poprzez dobór i zastosowań operatorów , które są proponowanego ocenianego i stosowanej przez przepisy. Operator proponuje zasad, które sprawdzą aktualny stan i stworzyć reprezentację operatora w pamięci roboczej jak również dopuszczalnej preferencji , co wskazuje, że operator powinien być uważany za wybór i zastosowanie. Dodatkowe zasady zgadza się z proponowanym operatora i utworzyć dodatkowe preferencje porównywać i oceniać ją przed innymi proponowanymi operatorów. Preferencje są analizowane za pomocą procedury decyzji, który wybiera się z wybranego operatora i instaluje się go jako bieżący operatora w pamięci roboczej. Zasady, które pasują do aktualnego operatora następnie zwolnić ją stosować i wprowadzać zmiany do pamięci roboczej. Zmiany do pamięci roboczej mogą być proste wnioski, zapytania do pobierania od szybować długoterminowy semantycznych lub epizodyczne wspomnienia, poleceń do systemu samochodowego do wykonywania działań w środowisku, lub interakcji z Przestrzennego Systemu Wizualnej (SVS), który pracuje Memory interfejs do percepcji. Te zmiany pracy prowadzenie pamięci do nowych operatorów są proponowane i oceniane, a następnie wybór jednej i jego zastosowania.

Wzmocnienie Learning

Szybować wsporniki uczenie wzmacniającą , która dostraja wartości zasad, które stwarzają preferencje dla podmiotów oceniających numerycznych, w oparciu o nagrody. Aby zapewnić maksymalną elastyczność, nie jest strukturą w pamięci roboczej, gdzie nagrodą jest tworzony.

Impasy, podstanami i Chunking

Jeśli preferencje dla operatorów są niewystarczające, aby określić wybór jednego operatora, czy nie istnieją dostateczne zasady mają zastosowanie do operatora, impas powstaje. W odpowiedzi na impasie, A substate jest tworzony w pamięci roboczej, przy czym celem jest, aby rozwiązać ten impas. Dodatkowa wiedza proceduralna może wtedy zaproponować i wybrać operatorów w podstanie zdobyć więcej wiedzy, a także utworzyć preferencje w stanie pierwotnym lub zmodyfikować ten stan tak impas został rozwiązany. Podstanami zapewnić środki na żądanie dla złożonego rozumowania, w tym hierarchiczne rozkładu zadań, planowania i dostępu do deklaratywnych długoterminowych wspomnień. Gdy impas zostanie rozwiązany, wszystkie struktury w podstanu są usuwane z wyjątkiem jakichkolwiek rezultatów. Mechanizm wyrwy szybować na kompiluje przetwarzanie w podstanu który doprowadził do wyniki do zasad. W przyszłości uczeni reguły automatycznie ogień w podobnej sytuacji, tak aby nie impas wynika, stopniowo przekształcając złożonego rozumowania do automatycznego przetwarzania / biernej.

Symboliczne wejście i wyjście

Symboliczne wejście i wyjście następuje poprzez pracę struktury pamięci dołączone do górnej stan zwany input-link, a wyjście-Link. Jeśli struktury są tworzone na wyjściu-link w pamięci roboczej, są one tłumaczone na język poleceń dla działań zewnętrznych (np sterowania silnikiem).

Przestrzenny system audiowizualny i Mental Imagery

Aby wspierać interakcję z systemów wizyjnych i non-symbolicznej rozumowania, Soar posiada przestrzenny układ wzrokowy (SVS). SVS wewnętrznie oznacza świata jako wykresu sceny , zbiór obiektów i podobiektów składowych każdej z właściwości przestrzennych, takich jak kształt, położenie, stanowią, względem położenia, i skali. Środek Soar użyciu SVS można utworzyć filtry, aby automatycznie wyodrębnić cechy i relacje z jego wykresie sceny, które są następnie dodawane do pamięci roboczej. Ponadto środek Soar można dodać do struktury SVS i użyć go do obrazowania mentalnego. Na przykład, środek może stworzyć hipotetyczny obiekt w SVS w danym miejscu i zapytać, czy to koliduje z zaobserwowanych obiektów.

Pamięć semantyczna

Pamięć semantyczna (SMEM) w Soar ma być bardzo duża długoterminowa pamięć faktów jak struktur. Dane w SMEM jest reprezentowany jako graf skierowany cykliczne. Struktury mogą być przechowywane lub pobrana przez przepisy, które tworzą polecenia w zarezerwowanym obszarze pamięci operacyjnej. Źródło konstrukcje są dodawane do pamięci roboczej.

Struktury SMEM mają wartości aktywacji, które reprezentują częstotliwości lub czas od poprzedniego zużycia poszczególnych pamięci, wdrażanie aktywacji bazowy poziom schemat pierwotnie opracowany dla ACT-R. Podczas pobierania struktura w SMEM który pasuje do zapytania i ma największą aktywację są pobierane. Szybować obsługuje również aktywację rozpraszającego , gdzie aktywacja rozprzestrzenia się od struktur SMEM które były pobierane do pamięci roboczej do innych wspomnień długoterminowych, które są powiązane. Te wspomnienia z kolei rozprzestrzenił aktywację swoich wspomnień sąsiadujących z pewnym rozkładem. Rozprzestrzenianie aktywacji jest to mechanizm umożliwiający obecna sytuacja wpływać pobierania danych z pamięci semantycznej.

Pamięć epizodyczna

Pamięć epizodyczna (EPMEM) automatycznie zapisuje zrzuty pamięci roboczej w strumieniu skroniowej. Wcześniejsze odcinki mogą być pobierane do pamięci roboczej poprzez zapytania. Po epizod została pobrana, następny (lub poprzedni) epizod może następnie zostać odzyskane. Środek może zatrudnić EPMEM do sekwencyjnego odtwarzania poprzez epizody z jego przeszłości (co pozwala na przewidywanie skutków działań), pobierać konkretne wspomnienia lub zapytanie dla odcinków posiadających pewne struktury pamięci.

Uczenie się

Każdy z szybować długoterminowy wspomnienia związane mechanizmy uczenia się on-line, które tworzą nowe struktury lub modyfikują metadane na podstawie przeżyć agenta. Na przykład, Soar poznaje nowe zasady pamięci proceduralnej w procesie zwanym wyrwy i wykorzystuje wzmocnienie nauki zasad dostroić biorących udział w selekcji operatorów.

Agent Rozwoju

Standardowe podejście do rozwoju agenta w Soar rozpoczyna się z zasadami pisania, które są ładowane do pamięci proceduralnej i inicjowanie pamięci semantycznej z odpowiedniej wiedzy deklaratywnej. Proces rozwoju Agent jest szczegółowo wyjaśnione w oficjalnym Soar instrukcji, jak również w kilku tutoriali, które są przewidziane na grupy badawczej na stronie internetowej .

Oprogramowanie

Rozszerzanie Soar Cognitive Architektura John Laird, 2008.

Architektura Soar jest utrzymywany i rozszerzony przez grupę badawczą Johna Laird na University of Michigan. Obecna architektura opisana w połączeniu z C i C ++, i jest swobodnie dostępne (licencja BSD) na grupy badawczej na stronie internetowej .

Szybować może współpracować z zewnętrznymi środowiskach językowych, w tym C ++, Java, Tcl i Python przez szybować Markup Language (SML). SML jest podstawowy mechanizm tworzenia wystąpienia wznieść czynników i interakcji z ich związki I / O.

JSoar jest implementacją Soar napisany w Javie. Jest on prowadzony przez SoarTech , firmy badawczo-rozwojowej AI. JSoar uważnie śledzi University of Michigan architektura realizację, choć zazwyczaj nie odzwierciedla najnowsze osiągnięcia i zmiany tego C / C ++ w wersji.

Aplikacje

Poniżej znajduje się lista historyczny różnych obszarów zastosowań, które zostały wdrożone w Soar. Odnotowano ponad stu systemów wdrożonych w Soar, choć większość z nich to zadania zabawki lub puzzli.

Puzzli i gier

W całej swojej historii, Soar zostało wykorzystane do realizacji szerokiej gamy klasycznych puzzli i gier AI, takich jak Wieża Hanoi, Woda dzbanek, Tic Tac Toe, osiem logiczne, Misjonarze i Cannibals i odmian bloków Świata. Jednym z pierwszych osiągnięć Soar pokazywał, że wiele różnych metod słabe naturalnie wynikają z wiedzy zadań, które zostały zakodowane w nim właściwości nazywa, słaba metoda Uniwersalnego.

konfiguracja komputera

Pierwsza aplikacja na dużą skalę Soar był R1-Soar, częściową powtórną implementację Paul Rosenbloom z R1 ( XCON ) systemu eksperckiego John McDermott rozwiniętej konfiguracji komputerów DEC. R1 Soar wykazały zdolność wznieść skali problemów umiarkowanej wielkości użyć hierarchicznej rozkład zadań i planowanie i konwersji celowe planowania i rozwiązywania problemów, reaktywne realizacji z wyrwy.

Zrozumienie języka naturalnego

NL-Soar było rozumienie języka naturalnego system opracowany w Soar przez Jill Fain Lehman, Rick Lewis, Nancy Green, Deryle Lonsdale i Greg Nelson. Zawierał on zdolności do naturalnego rozumienia języka, generacji i dialogu, podkreślając w czasie rzeczywistym przyrostową analizowania i pokolenia. NL-Soar użyto w wersji doświadczalnej TacAir-szybować w NTD-skrzydeł.

symulowane piloci

Druga aplikacja na dużą skalę Soar zaangażowanych środków rozwijających się do wykorzystania w szkoleniu w dużych rozproszonych symulacji. Dwa główne systemy latające US taktyczne misje powietrzne zostały wspólnie opracowane na University of Michigan i Nauk Informacyjnych Institute (ISI) z University of Southern California. System Michigan nazwano TacAir-Soar i poleciał (w symulacji) stałopłatowymi amerykańskie wojskowe misje taktyczne (takie jak wsparcie blisko powietrzu, strajki, CAP , tankowanie i sead misji). System nazwano ISI RWA wznieść i poleciał śmigłowców (śmigłowca) zadań. Niektóre z funkcji wbudowanych w TacAir-Soar i RWA-Soar były uwagi, świadomości sytuacyjnej i adaptacja, planowanie w czasie rzeczywistym i dynamiczne przeplanowywania i kompleks komunikacja, koordynacja i współpraca między kombinacjami szybować agentów i ludzi. Systemy te udział w DARPA jest syntetyczny działaniach wojennych (Stow-97) Pozostałe Pojęcie demonstracyjnych (ActD), który w tym czasie był największy Fielding środków syntetycznych wspólnych bojowej przez okres 48 godzin, a udział szkolenia aktywnych pracowników obowiązek. Systemy te wykazały żywotność stosując środki AI szkolenia dużą skalę.

PAROWY

Jednym z ważnych wypustek na RWA-Soar projektu było opracowanie przez STEAM Milind Tambe , ramy dla elastycznej pracy zespołowej, w której środki utrzymywanej modele swoich kolegów za pomocą wspólnych ram intencje Cohen & Levesque .

NTD-Soar

NTD-Soar była symulacja dyrektora NASA testowym (NTD), osoby odpowiedzialnej za koordynację przygotowań do NASA Space Shuttle przed startem. To był zintegrowany model poznawczy że włączone różne złożone funkcje poznawcze oraz przetwarzania języka naturalnego , uwagi i poszukiwania wizualnego i rozwiązywania problemów w szerokim modelu agenta.

Wirtualne Humans

Szybować został wykorzystany do symulacji wirtualnych ludzi wspierających twarzą w twarz dialogi i współpracę w wirtualnym świecie opracowanej w Instytucie Creative Technology w USC. Wirtualne ludzie mają wbudowane możliwości percepcji , naturalnego rozumienia języka , emocji , kontroli ciała i działania, między innymi.

Gra AIS i Mobile Apps

Gry AI środki zostały zbudowane przy użyciu Soar dla gier takich jak StarCraft , Quake II , Descent 3 , Unreal Tournament oraz Minecraft , wspieranie możliwości, takie jak rozumowania przestrzennego , strategii czasu rzeczywistego , a przeciwnik oczekiwaniu . AI środki zostały również stworzone do gier wideo, w tym Nieskończonego Mario , który korzystał uczenia zbrojenia i Frogger II , Space Invaders , i Fast Eddie, która stosowana zarówno naukę zbrojenia i obrazy umysłowe .

Szybować może działać natywnie na urządzeniach mobilnych . Mobilna aplikacja do gry Liar za Dice został opracowany dla iOS , która prowadzi Soar architekturę bezpośrednio z telefonu jako silnik dla przeciwnika AI.

Robotyka

Wiele różnych aplikacji zrobotyzowanych zostały zbudowane przy użyciu Soar ponieważ oryginalny Robo-Soar został wdrożony w 1991 roku do sterowania ramieniem robota Puma. Te wahały się od telefonu do kontroli robota humanoidalnego usług Reem robotów, taskable zrobotyzowanych mułów i bezzałogowych pojazdów podwodnych .

Zadanie Interactive Learning

Aktualnym tematem badań i rozwoju w środowisku szybować Zadanie jest Interactive Learning (ITL), automatyczne uczenie się nowych zadań, funkcji, ograniczeń środowiskowych, behawioralnych i innych specyfikacji poprzez naturalną interakcję instruktora. Badania w ITL została zastosowana do gry stołowe gry i nawigacji multi-room.

Planowanie

Na początku, Merle-Soar wykazać jak Soar mogą nauczyć złożone zadanie planowania wzorowany na ołowiu planującego człowieka w zakładzie produkcyjnym szyba przednia znajduje się niedaleko Pittsburgha.

Zobacz też

Referencje

Bibliografia

Linki zewnętrzne