Reaktywny planowanie - Reactive planning

W sztucznej inteligencji , reaktywne planowania oznacza grupę technik wyboru działania przez czynniki niezależne . Techniki te różnią się od planowania klasycznego w dwóch aspektach. Po pierwsze, działają one w odpowiednim czasie, a tym samym może poradzić sobie z bardzo dynamicznych i nieprzewidywalnych warunkach . Po drugie, obliczyć tylko jeden następne działania w każdej chwili, na podstawie aktualnego kontekstu. Reaktywne planistów często (ale nie zawsze) wykorzystać reaktywne plany , które są przechowywane struktur opisujących priorytety i zachowania agenta.

Chociaż termin planowanie reaktywny sięga co najmniej 1988 roku, termin „ reaktywny ” stał się pejoratywne używany jako antonim dla proaktywne . Ponieważ prawie wszystkie środki wykorzystujące reaktywny planowania aktywne, niektórzy badacze zaczęli odnoszące się do biernej planowania jako dynamicznego planowania .

Reaktywny przedstawienie planu

Istnieje kilka sposobów, aby reprezentować reaktywny plan. Wszystko wymaga podstawowej jednostki reprezentacyjne i środki do komponowania tych jednostek w planach.

Warunek-akcja zasad (produkcje)

Zasada działania warunek, lub jeżeli-to reguła jest regułą w postaci: jeśli stan ówczesnego działania . Zasady te są nazywane produkcje . Znaczenie tej zasady jest następująca: jeśli warunek jest spełniony, należy wykonać czynności. Akcja może być zewnętrzne (na przykład wybrać coś się i przesunąć go) lub wewnętrzne (np napisać fakt w pamięci wewnętrznej lub ocenić nowy zestaw reguł). Warunki są normalnie logiczna i działanie albo mogą być wykonane, czy nie.

Zasady produkcji mogą być zorganizowane w strukturach stosunkowo płaskie, ale częściej są zorganizowane w hierarchię pewnego rodzaju. Na przykład, Architektura Brooksa składa się z warstw połączonych ze sobą zachowań , a właściwie każdej skończonej maszyny stanów , który działa w odpowiedzi na odpowiednim wejściu. Warstwy te są następnie podzielone prosty stos, z wyższych warstw podporządkowania celów niższych nich. Inne systemy mogą korzystać z drzew , lub mogą zawierać specjalne mechanizmy do zmiany których celem / zasada podzbiór jest obecnie najważniejsze. Struktury płaskie są stosunkowo łatwe do zbudowania, ale pozwala jedynie do opisu prostych zachowań lub wymagają ogromnie skomplikowane warunki do wyrównania struktury brakuje.

Ważną częścią żadnej rozproszonych selekcji działanie algorytmów jest mechanizmem rozwiązywania konfliktów. To jest mechanizm rozwiązywania konfliktów pomiędzy działaniami proponowanymi gdy więcej niż jeden warunek rules' posiada w danej chwili. Konflikt ten może być rozwiązany na przykład przez

  • przypisanie priorytetów ustalonych w przepisach z góry,
  • przypisywanie preferencje (np Soar architekturę),
  • uczenie narzędzia względne między zasadami (np ACT-R ),
  • wykorzystując formę planowania .

Systemy eksperckie często korzystać z innych prostszych heurystyki takie jak recency do wyboru zasady, ale trudno jest zagwarantować dobre zachowanie w dużym systemie z prostych metod.

rozwiązywanie konfliktów jest konieczne tylko dla reguł, które chcą wziąć wzajemnie wykluczających się działań (por Blumberg 1996).

Pewne ograniczenia tego rodzaju reaktywnej planowania można znaleźć w Brom (2005).

Skończonych państwa Machines

Skończona maszyna stanu (FSM) jest model zachowania systemu. FSMs są powszechnie używane w informatyce. Modelowanie zachowań agentów jest tylko jednym z ich możliwych zastosowań. Typowym FSM, kiedy używany do opisywania zachowań agenta, składa się z szeregu stanów i przejść między tymi stanami. Przejścia są rzeczywiście zasady działania warunek. W każdej chwili tylko jeden stan FSM jest aktywny, a jego przejścia są oceniane. Jeżeli przejście zostanie podjęta aktywuje inny stan. Oznacza to, że w ogólne przejścia są zasady w następującej postaci: jeśli warunek następnie aktywować-new-stan . Ale przejścia mogą także łączyć się z „ja” stanie, w niektórych systemach, aby umożliwić wykonanie działań przejściowych faktycznie bez zmiany stanu.

Istnieją dwa sposoby, jak produkować zachowanie przez FSM. Zależą one od tego, co jest związane ze stanami przez projektanta --- mogą być zarówno „akty” lub skrypty. „Akt” jest działaniem atomowej, które powinny być wykonywane przez agenta, jeżeli jego FSM jest dany stan. Ta czynność jest wykonywana w każdym kroku czasowym wtedy. Jednak coraz częściej jest to drugi przypadek. Tu każdy stan jest związany ze skryptem, który opisuje sekwencję działań, które agent ma wykonywać, jeśli jego FSM jest w danym stanie. Jeżeli przejście aktywuje nowy stan, byłego skrypt jest po prostu przerwany, a nowy jest uruchomiona.

Jeśli skrypt jest bardziej skomplikowane, może być podzielone na kilka skryptów i hierarchiczną FSM może być wykorzystany. W taki automat, każde państwo może zawierać podstanami. Tylko państwa na poziomie atomowym są związane ze skryptu (co nie jest skomplikowane) lub działania atomowej.

Obliczeniowo hierarchiczne FSMS odpowiadają FSMs. Oznacza to, że każdy hierarchicznej FM może być przekształcany do klasycznego FM. Jednak hierarchiczne podejście ułatwi wzory lepiej. Zobacz papier Damian Isla (2005) na przykład ASM z botami gier komputerowych , który wykorzystuje hierarchiczne FSMs.

Fuzzy podejścia

Zarówno if-then zasady i FSMs można łączyć z logiki rozmytej . Warunków, stany i działania nie są bardziej logiczna lub „tak / nie” odpowiednio ale są przybliżone i gładka. W związku z tym, spowodowało zachowanie będzie płynne przejście, zwłaszcza w przypadku przejścia między dwoma zadaniami. Jednak ocena rozmytych warunkach jest znacznie wolniejszy niż ocena ich ostre odpowiedniki.

Zobacz architekturę Alex Champandard .

Connectionists podejścia

Reaktywne plany może być wyrażona także przez koneksjonistyczne sieciach , takich jak sztuczne sieci neuronowe lub hierarchie wolnego przepływu. Podstawową jednostką reprezentacyjne to jednostka z kilku linków wejściowych, które żywią jednostkę z „abstrakcyjną aktywność” i wyjściowych linków, które propagują aktywność do następujących jednostek. Każda jednostka sama pracuje jako przetwornik aktywności. Zazwyczaj, jednostki są połączone w strukturę warstwową.

Pozytywne sieci koneksjonistyczne jest, po pierwsze, że otrzymaną działanie jest bardziej gładka niż zachowania wytwarzanego przez ostry if następnie zasady i FSMS, z drugiej strony, struktura jest często adaptacyjne i trzeci mechanizm hamowania może być stosowany, a więc zachowanie może być opisano również proscriptively (za pomocą reguł można opisać zachowanie tylko prescriptively). Jednak metody mają też kilka wad. Po pierwsze, dla projektanta, jest o wiele bardziej skomplikowana, aby opisać zachowanie przez sieć w porównaniu z IF-następnie reguł. Po drugie, tylko stosunkowo proste zachowanie można opisać, zwłaszcza jeśli adaptacyjna funkcja ma być wykorzystany.

Algorytmy planowania reaktywne

Typowy algorytm planowania reaktywny tylko ocenia if-then zasady lub wylicza stan na koneksjonistyczne sieci. Jednak niektóre algorytmy mają szczególne cechy.

  • Rete ocena : z właściwą reprezentację logicznego (który nadaje się tylko dla wyraźnych reguł), zasady nie muszą być poddane ponownej ocenie na każdym kroku czasowym. Zamiast formą pamięci podręcznej przechowującej oceny z poprzedniego etapu mogą być użyte.
  • Języki skryptowe: Zdarza się, że przepisy lub FSMs są bezpośrednio prymitywy z architektury (np Soar ). Jednak coraz częściej, reaktywne plany są programowane w języku skryptowym , gdzie zasady są tylko jedną z pierwotnych (jak w dżemie lub ABL).

Sterowniczy

Zwrotnica specjalną techniką reagującego nawigacji agentów. Najprostsza postać sterowania reaktywnego jest stosowany w pojazdach Braitenberg , który czujnik mapę wejścia bezpośrednio do wyjścia efektorowych i można śledzić albo unikać. Bardziej złożone systemy są oparte na superpozycję atrakcyjnych lub odpychających sił wpływ na agenta. Tego rodzaju układ kierowniczy jest oparty na oryginalnej pracy na algorytm stada Craig Reynolds. Za pomocą kierownicy, można osiągnąć prostą formę:

  • do nawigacji cel
  • Przeszkody unikania zachowań
  • ściana następujące zachowanie
  • nieprzyjaciel zbliża
  • unikanie drapieżne
  • zachowanie kibiców

Zaletą jest to, że układ kierowniczy jest bardzo wydajne obliczeniowo. W grach komputerowych , setki żołnierzy mogą być napędzane przy użyciu tej techniki. W przypadkach bardziej złożonych (np terenu budynek), jednak sterujące muszą być połączone ze ścieżki rozpoznawcze (jak np Milani [1] ), która jest formą planowania .

Zobacz też

Referencje

  • Blumberg, B .: starych sztuczek, Nowe Psy: etologia i stworzenia interaktywnego. Praca doktorska, Massachusetts Institute of Technology (1996).
  • Brom, C .: hierarchiczne Reactive Planowanie: Gdzie jest jej granica? W: Proceedings of warsztacie MNAS. Edynburg, Szkocja (2005)
  • Bryson, J .: inteligencji Wzór: Principles modułowości i koordynacyjne inżynierii złożonych adaptacyjne agentów. Praca doktorska, Massachusetts Institute of Technology (2001)
  • Champandard AJ: AI Game Development: Syntetyczne Stworzenia z nauką i biernej zachowań. New Riders, USA (2003)
  • Wielki, S., Cliff, D., Malhotra, A .: Stworzenia: Sztuczne życie oprogramowanie autonomiczne środki do domowej rozrywki. W: Johnson, WL (red.): Postępowanie z Pierwszej Międzynarodowej Konferencji w sprawie czynników autonomicznych. ACM Press (1997), 22-29
  • Huber, MJ: JAM: a BDI-mobile teoretyczny środek architektura . W: Proceedings of the Trzeciej Międzynarodowej Konferencji pełnomocników autonomiczne (Agents'99). Seattle (1999) 236-243
  • Isla, D .: Postępowanie złożoność w Halo 2 . W: Gamastura Online 03/11 (2005)
  • Milani, A., Poggioni, V., Planowanie w Reactive Środowiska . Komputerowa inteligencji, 23 (4), 439-463, Wiley-Blackwell, (2005), [2]
  • Reynolds, CW stada, trzody i Szkoły: rozproszonego modelu behawioralnym. W: Computer Graphics, 21 (4) (SIGGRAPH '87 Conference Proceedings) (1987) 25-34.
  • de Sevin, E. Thalmann, D.:A motywacyjny Model wyboru działania wirtualnych ludzi. W: Computer Graphics International (CGI), IEEE Computer SocietyPress, New York (2005)
  • Softimage produkt / Zachowanie . Avid Technology Inc.
  • Tyrrell, T .: Computational Mechanizmy wyboru działania. Ph.D. Rozprawa. Center for Cognitive Science, University of Edinburgh (1993)
  • van Waveren, JMP: Quake III Arena Bot. Praca magisterska. Wydział ITS, Politechnika Delft (2001)
  • Wooldridge, M. Wprowadzenie do wieloagentowym Systems. John Wiley & Sons (2002)
  • Pogamut2 . Platforma dla agenta szybkiego prototypowania w Unreal Tournament 2004 - przy użyciu Posh - reaktywne planowania zaprojektowane i opracowane przez JJ Bryson.
  • [3] . Wortham, RH, Gaudl, SE & Bryson, JJ, Instinct: biologicznie Zainspirowany Reactive Planner dla inteligentnych systemów wbudowanych, w: Cognitive Systems Research. (2018)


Linki zewnętrzne