AlphaGo - AlphaGo

Logo AlphaGo
Logo AlphaGo

AlphaGo to program komputerowy, który gra w grę planszową Go . Został opracowany przez DeepMind Technologies, spółkę zależną Google (obecnie Alphabet Inc. ). Kolejne wersje AlphaGo stawały się coraz potężniejsze, w tym wersja, która konkurowała pod nazwą Master . Po wycofaniu się z rywalizacji, AlphaGo Master został zastąpiony przez jeszcze potężniejszą wersję znaną jako AlphaGo Zero , która była całkowicie samoukiem bez uczenia się na ludzkich grach. AlphaGo Zero został następnie uogólniony w program znany jako AlphaZero , który grał w dodatkowe gry, w tym w szachy i shogi . AlphaZero został z kolei zastąpiony przez program znany jako MuZero, który uczy się bez uczenia się zasad.

AlphaGo i jego następcy używają algorytmu wyszukiwania drzewa Monte Carlo , aby znaleźć swoje ruchy w oparciu o wiedzę nabytą wcześniej przez uczenie maszynowe , w szczególności przez sztuczną sieć neuronową ( metoda głębokiego uczenia ) poprzez intensywne szkolenie, zarówno z ludzi, jak i z gry komputerowej. Sieć neuronowa jest szkolona, ​​aby identyfikować najlepsze ruchy i zwycięski procent tych ruchów. Ta sieć neuronowa poprawia siłę przeszukiwania drzewa, co skutkuje silniejszym wyborem ruchu w następnej iteracji.

W październiku 2015, w meczu z Fan Hui , oryginalny AlphaGo stał się pierwszym komputerowym programem Go , który pokonał profesjonalnego gracza Go bez handicapu na pełnowymiarowej planszy 19×19. W marcu 2016 roku pokonał Lee Sedola w pięciomeczowym meczu , po raz pierwszy program komputerowy Go pokonał 9-danowego profesjonalistę bez niepełnosprawności. Chociaż przegrał z Lee Sedolem w czwartej grze, Lee zrezygnował w ostatniej grze, dając wynik 4 do 1 na korzyść AlphaGo. W uznaniu zwycięstwa AlphaGo została nagrodzona honorowym 9-dan przez Korea Baduk Association . Prowadzenie i pojedynek z Lee Sedolem zostały udokumentowane w filmie dokumentalnym, również zatytułowanym AlphaGo , w reżyserii Grega Kohsa. Zwycięstwo AlphaGo zostało wybrane przez Science jako jedno z wicemistrzów w kategorii Przełom Roku w dniu 22 grudnia 2016 r.

W 2017 przyszłości Go szczytu The Mistrz wersja AlphaGo pokonać Ke Jie , jeden numer w rankingu graczem na świecie w momencie, w meczu trzy gry , po którym AlphaGo został nagrodzony profesjonalnym 9-dan przez chińskiego Weiqi Stowarzyszenia .

Po meczu między AlphaGo i Ke Jie, DeepMind wycofał AlphaGo, kontynuując badania nad sztuczną inteligencją w innych obszarach. Samouk AlphaGo Zero osiągnął 100-0 zwycięstwo nad wczesną, konkurencyjną wersją AlphaGo, a jego następca AlphaZero jest obecnie postrzegany jako najlepszy gracz na świecie w Go, a także prawdopodobnie w szachach .

Historia

Go jest uważane za znacznie trudniejsze do wygrania przez komputery niż w innych grach, takich jak szachy , ponieważ jego znacznie większy współczynnik rozgałęzień sprawia, że ​​korzystanie z tradycyjnych metod sztucznej inteligencji, takich jak przycinanie alfa-beta , przechodzenie przez drzewa i wyszukiwanie heurystyczne, jest niezwykle trudne .

Prawie dwie dekady po tym, jak komputer IBM Deep Blue pokonał mistrza świata w szachach Garry'ego Kasparowa w meczu z 1997 roku , najsilniejsze programy Go wykorzystujące techniki sztucznej inteligencji osiągnęły jedynie amatorski poziom 5 dan i nadal nie mogły pokonać profesjonalnego gracza Go bez handicapu . W 2012 r. program Zen , działający na cztero-komputerowym klastrze, dwukrotnie pokonał Masaki Takemiya ( 9p ) z handicapami pięcio- i czterokamiennymi. W 2013 Crazy Stone pokonał Yoshio Ishidę (9p) z handicapem czterech kamieni.

Według Davida Silvera z DeepMind , projekt badawczy AlphaGo powstał około 2014 roku, aby sprawdzić, jak dobrze sieć neuronowa wykorzystująca głębokie uczenie może konkurować w Go. AlphaGo stanowi znaczną poprawę w stosunku do poprzednich programów Go. W 500 grach przeciwko innym dostępnym programom Go, w tym Crazy Stone i Zen, AlphaGo działający na jednym komputerze wygrał wszystko oprócz jednego. W podobnym pojedynku AlphaGo działająca na wielu komputerach wygrała wszystkie 500 gier rozegranych z innymi programami Go, a 77% gier rozegranych przeciwko AlphaGo uruchomionej na jednym komputerze. Wersja dystrybuowana w październiku 2015 r. używała 1202 procesorów i 176 procesorów graficznych .

Mecz przeciwko Fan Hui

W październiku 2015 r. dystrybuowana wersja AlphaGo pokonała mistrza Europy w go, Fan Hui , profesjonalistę z 2 dan (możliwe na 9 dan), pięć do zera. To był pierwszy raz, kiedy program komputerowy Go pokonał profesjonalnego gracza na pełnowymiarowej planszy bez utrudnień. Ogłoszenie wiadomości zostało przesunięte do 27 stycznia 2016 r., aby zbiegło się w czasie z publikacją artykułu w czasopiśmie Nature opisującym zastosowane algorytmy.

Mecz przeciwko Lee Sedol

AlphaGo grał południowokoreańskiego profesjonalnego gracza Go Lee Sedola , który uzyskał 9 dan, jednego z najlepszych graczy w Go. Pięć gier odbyło się w hotelu Four Seasons w Seulu w Korei Południowej w dniach 9, 10, 12, 13 i 15 marca 2016, które były transmitowane na żywo. Na pięć gier AlphaGo wygrał cztery, a Lee wygrał czwartą, co sprawiło, że został zarejestrowany jako jedyny gracz, który pokonał AlphaGo we wszystkich 74 oficjalnych grach. AlphaGo działała w chmurze Google z serwerami znajdującymi się w Stanach Zjednoczonych. W meczu zastosowano chińskie zasady z komi 7,5 punktu , a każda ze stron miała dwie godziny na myślenie plus trzy 60-sekundowe okresy byoyomi . Wersja AlphaGo grająca przeciwko Lee wykorzystywała podobną ilość mocy obliczeniowej, jak w meczu Fan Hui. The Economist poinformował, że używał 1920 procesorów i 280 procesorów graficznych. W czasie gry Lee Sedol miał drugą co do wielkości liczbę zwycięstw w międzynarodowych mistrzostwach Go na świecie po południowokoreańskim graczu Lee Changho, który utrzymał tytuł mistrza świata przez 16 lat. Ponieważ nie ma jednej oficjalnej metody rankingu w międzynarodowym Go , rankingi mogą się różnić w zależności od źródeł. Chociaż czasami był na szczycie, niektóre źródła umieściły Lee Sedola jako czwartego najlepszego gracza na świecie w tym czasie. AlphaGo nie została specjalnie przeszkolona, ​​aby stawić czoła Lee, ani nie została zaprojektowana do konkurowania z konkretnymi ludzkimi graczami.

Pierwsze trzy mecze wygrało AlphaGo po rezygnacji Lee. Jednak Lee pokonał AlphaGo w czwartej partii, wygrywając rezygnacją w ruchu 180. AlphaGo kontynuował odnoszenie czwartej wygranej, wygrywając piątą partię przez rezygnację.

Nagroda wyniosła 1 milion dolarów. Ponieważ AlphaGo wygrał cztery z pięciu, a tym samym całą serię, nagroda zostanie przekazana organizacjom charytatywnym, w tym UNICEF . Lee Sedol otrzymał 150 000 dolarów za udział we wszystkich pięciu grach i dodatkowe 20 000 dolarów za wygraną w grze 4.

W czerwcu 2016 roku, podczas prezentacji zorganizowanej na uniwersytecie w Holandii, Aja Huang, jeden z zespołu Deep Mind, ujawnił, że naprawił logiczną słabość, która wystąpiła podczas czwartej gry meczu pomiędzy AlphaGo i Lee, i że po ruch 78 (który został nazwany przez wielu zawodowców „ boskim ruchem ”), zagrałby zgodnie z przeznaczeniem i utrzymałby przewagę czarnych. Przed ruchem 78, AlphaGo prowadził w całej grze, ale ruch Lee spowodował, że moc obliczeniowa programu została odwrócona i zdezorientowana. Huang wyjaśnił, że sieć polityczna AlphaGo polegająca na znalezieniu najdokładniejszego porządku ruchu i kontynuacji nie prowadziła dokładnie AlphaGo do wykonania prawidłowej kontynuacji po 78 ruchu, ponieważ jego sieć wartości nie określiła 78. ruchu Lee jako najbardziej prawdopodobnego, a zatem kiedy ruch powstało AlphaGo nie mogło dokonać odpowiedniego dopasowania do logicznej kontynuacji.

Sześćdziesiąt gier online

29 grudnia 2016 r. nowe konto na serwerze Tygem o nazwie „Magister” (oznaczone jako „Magist” w chińskiej wersji serwera) z Korei Południowej zaczęło grać w gry z profesjonalnymi graczami. Zmienił nazwę konta na „Master” 30 grudnia, a następnie przeniósł się na serwer FoxGo 1 stycznia 2017 roku. 4 stycznia DeepMind potwierdził, że „Magister” i „Master” są odtwarzane przez zaktualizowaną wersję AlphaGo, zwany Mistrzem AlphaGo . Na dzień 5 stycznia 2017 r. rekord online AlphaGo Master wynosił 60 wygranych i 0 przegranych, w tym trzy zwycięstwa nad najlepszym graczem Go, Ke Jie , który został po cichu z wyprzedzeniem poinformowany, że Master jest wersją AlphaGo. Po przegranej z Mistrzem, Gu Li zaoferował nagrodę w wysokości 100 000 juanów (14 400 USD) pierwszemu graczowi, który mógł pokonać Mistrza. Mistrz grał w tempie 10 gier dziennie. Wielu szybko podejrzewało, że jest to gracz AI z powodu niewielkiego lub żadnego odpoczynku między grami. Jej przeciwnikami było wielu mistrzów świata, takich jak Ke Jie , Park Jeong-hwan , Yuta Iyama , Tuo Jiaxi , Mi Yuting , Shi Yue , Chen Yaoye , Li Qincheng, Gu Li , Chang Hao , Tang Weixing, Fan Tingyu , Zhou Ruiyang , Jiang Weijie , Chou Chun-hsun , Kim Ji-seok , Kang Dong-yun , Park Yeong-hun i Won Seong-jin ; mistrzowie krajowi lub wicemistrzowie świata, tacy jak Lian Xiao , Tan Xiao , Meng Tailing, Dang Yifei, Huang Yunsong, Yang Dingxin , Gu Zihao, Shin Jinseo, Cho Han-seung i An Sungjoon. Wszystkie 60 gier z wyjątkiem jednej były szybkimi grami z trzema 20- lub 30-sekundowymi byo-yomi . Mistrz zaproponował przedłużenie byo-yomi do jednej minuty podczas gry z Nie Weipingiem ze względu na jego wiek. Po wygraniu 59. gry Master ujawnił się na czacie pod kontrolą dr Aja Huang z zespołu DeepMind, po czym zmienił narodowość na Wielką Brytanię. Po ukończeniu tych gier współzałożyciel Google DeepMind, Demis Hassabis , powiedział w tweecie: „nie możemy się doczekać, aby zagrać w niektóre oficjalne, pełnometrażowe gry później [2017] we współpracy z organizacjami i ekspertami Go”.

Eksperci Go byli pod wrażeniem wydajności programu i jego nieludzkiego stylu gry; Ke Jie stwierdził, że „Po tym, jak ludzkość spędziła tysiące lat na ulepszaniu naszej taktyki, komputery mówią nam, że ludzie całkowicie się mylą… Posunąłbym się do stwierdzenia, że ​​ani jeden człowiek nie dotknął krawędzi prawdy o Go”.

Przyszłość Go Summit

Podczas Future of Go Summit, który odbył się w Wuzhen w maju 2017 r., AlphaGo Master rozegrał trzy gry z Ke Jie, graczem nr 1 na świecie, a także dwie gry z kilkoma najlepszymi chińskimi profesjonalistami, jedną grę w pary Go i jedną przeciwko współpracującym zespół pięciu ludzkich graczy.

Google DeepMind zaoferował zwycięzcy 1,5 miliona dolarów za trzymeczowy mecz między Ke Jie i Master, podczas gdy strona przegrywająca zgarnęła 300 000 dolarów. Master wygrał wszystkie trzy mecze z Ke Jie, po czym AlphaGo otrzymał profesjonalne 9-dan od Chińskiego Stowarzyszenia Weiqi.

Po wygraniu trzymeczowego meczu z Ke Jie, najlepiej oceniany gracz na świecie w Go, AlphaGo, przeszedł na emeryturę. DeepMind rozwiązał również zespół, który pracował nad grą, aby skupić się na badaniach nad sztuczną inteligencją w innych obszarach. Po zakończeniu szczytu Deepmind opublikował 50 pełnometrażowych meczów AlphaGo vs AlphaGo w prezencie dla społeczności Go.

AlphaGo Zero i AlphaZero

Zespół AlphaGo opublikował artykuł w czasopiśmie Nature w dniu 19 października 2017 r., przedstawiając AlphaGo Zero, wersję bez danych ludzkich i silniejszą niż jakakolwiek poprzednia wersja pokonująca ludzkich mistrzów. Grając przeciwko sobie, AlphaGo Zero przewyższył siłę AlphaGo Lee w trzy dni, wygrywając 100 gier do 0, osiągnął poziom AlphaGo Master w 21 dni i przekroczył wszystkie stare wersje w 40 dni.

W artykule opublikowanym na arXiv 5 grudnia 2017 r. DeepMind twierdził, że uogólnił podejście AlphaGo Zero do pojedynczego algorytmu AlphaZero, który osiągnął w ciągu 24 godzin nadludzki poziom gry w szachy , shogi i Go , pokonując mistrza świata. programy, Stockfish , Elmo i 3-dniowa wersja AlphaGo Zero w każdym przypadku.

Narzędzie do nauczania

11 grudnia 2017 r. DeepMind udostępnił na swojej stronie internetowej narzędzie do nauczania AlphaGo, które analizuje wskaźniki wygranych różnych otwarć Go, obliczone przez AlphaGo Master . Narzędzie do nauczania zbiera 6000 otwarć Go z 230 000 ludzkich gier, z których każda została przeanalizowana za pomocą 10 000 000 symulacji przez AlphaGo Master. Wiele otworów zawiera sugestie ruchów człowieka.

Wersje

Wczesna wersja AlphaGo została przetestowana na sprzęcie z różną liczbą procesorów i GPU , działających w trybie asynchronicznym lub rozproszonym. Na każdy ruch przeznaczono dwie sekundy czasu na namysł. Otrzymane oceny Elo są wymienione poniżej. W meczach z większą ilością czasu na ruch osiągane są wyższe notowania.

Konfiguracja i wydajność
Konfiguracja Szukaj
wątków
Liczba procesorów Liczba GPU Ocena Elo
Pojedynczy str. 10-11 40 48 1 2181
Pojedynczy 40 48 2 2738
Pojedynczy 40 48 4 2850
Pojedynczy 40 48 8 2890
Rozpowszechniane 12 428 64 2937
Rozpowszechniane 24 764 112 3079
Rozpowszechniane 40 1202 176 3140
Rozpowszechniane 64 1920 280 3168

W maju 2016 r. Google zaprezentował własne, zastrzeżone sprzętowe „ jednostki przetwarzania tensorów ”, które, jak twierdził, zostały już wdrożone w wielu wewnętrznych projektach Google, w tym w meczu AlphaGo z Lee Sedolem.

W Future of Go Summit w maju 2017 r. DeepMind ujawnił, że wersja AlphaGo użyta podczas tego szczytu to AlphaGo Master , i ujawnił, że mierzył siłę różnych wersji oprogramowania. AlphaGo Lee, wersja użyta przeciwko Lee, mogła dać AlphaGo Fan, wersja używana w AlphaGo vs. Fan Hui, trzy kamienie, a AlphaGo Master był nawet o trzy kamienie silniejszy.

Konfiguracja i siła
Wersje Sprzęt komputerowy Ocena Elo Data Wyniki
Wentylator AlphaGo 176 procesorów graficznych , rozproszonych 3144 Październik 2015 5:0 przeciwko Fan Hui
AlphaGo Lee 48 TPU , rozproszone 3739 marzec 2016 4:1 przeciwko Lee Sedolowi
Mistrz AlphaGo 4 TPU, pojedyncza maszyna 4,858 maj 2017 60:0 przeciwko profesjonalnym graczom;
Przyszłość Go Summit
AlphaGo Zero (blok 40) 4 TPU, pojedyncza maszyna 5185 Październik 2017 100:0 przeciwko AlphaGo Lee

89:11 przeciwko AlphaGo Master

AlphaZero (20 bloków) 4 TPU, pojedyncza maszyna 5018

grudzień 2017 60:40 przeciwko AlphaGo Zero (20 bloków)

Algorytm

Od 2016 r. algorytm AlphaGo wykorzystuje kombinację uczenia maszynowego i technik wyszukiwania drzew , w połączeniu z obszernym szkoleniem, zarówno z ludzi, jak i gier komputerowych. Wykorzystuje wyszukiwanie drzewa Monte Carlo , kierując się „siecią wartości” i „siecią zasad”, obydwa zaimplementowane przy użyciu technologii głębokich sieci neuronowych . Ograniczona ilość wstępnego przetwarzania funkcji wykrywania specyficznych dla gry (na przykład w celu podkreślenia, czy ruch pasuje do wzorca nakade ) jest stosowana do danych wejściowych przed wysłaniem ich do sieci neuronowych. Sieci są splotowymi sieciami neuronowymi z 12 warstwami, wyszkolonymi przez uczenie ze wzmocnieniem .

Sieci neuronowe systemu były początkowo pobierane z wiedzy o rozgrywkach człowieka. AlphaGo został początkowo przeszkolony, aby naśladować ludzką grę, próbując dopasować ruchy doświadczonych graczy z zarejestrowanych gier historycznych, korzystając z bazy danych zawierającej około 30 milionów ruchów. Po osiągnięciu pewnego stopnia zaawansowania był dalej szkolony, grając dużą liczbę gier przeciwko innym instancjom, wykorzystując uczenie się ze wzmocnieniem, aby poprawić swoją grę. Aby uniknąć „bez szacunku” marnowania czasu przeciwnika, program jest specjalnie zaprogramowany do rezygnacji, jeśli jego ocena prawdopodobieństwa wygranej spadnie poniżej pewnego progu; na mecz z Lee próg rezygnacji ustalono na 20%.

Styl gry

Toby Manning, sędzia meczowy AlphaGo vs. Fan Hui, określił styl programu jako „konserwatywny”. Styl gry AlphaGo zdecydowanie faworyzuje większe prawdopodobieństwo wygranej mniejszą liczbą punktów nad mniejszym prawdopodobieństwem wygranej większą liczbą punktów. Jego strategia maksymalizacji prawdopodobieństwa wygranej różni się od tego, co zwykle robią gracze, czyli maksymalizacji zdobyczy terytorialnych, i wyjaśnia niektóre z jego dziwnie wyglądających ruchów. Wykonuje wiele ruchów otwierających, które nigdy lub rzadko były wykonywane przez ludzi. Lubi używać ciosów w barki , zwłaszcza gdy przeciwnik jest nadmiernie skoncentrowany.

Odpowiedzi na zwycięstwo 2016

Społeczność AI

Zwycięstwo AlphaGo w marcu 2016 r. było kamieniem milowym w badaniach nad sztuczną inteligencją. Go wcześniej uważano za trudny problem w uczeniu maszynowym, który miał być poza zasięgiem ówczesnej technologii. Większość ekspertów uważała, że ​​program Go tak potężny jak AlphaGo będzie oddalony o co najmniej pięć lat; niektórzy eksperci sądzili, że minie co najmniej dekada, zanim komputery pokonają mistrzów Go. Większość obserwatorów na początku meczów 2016 spodziewała się, że Lee pokona AlphaGo.

Z grami takimi jak warcaby (które zostały „ rozwiązane ” przez zespół graczy w warcaby Chinook ), szachy, a teraz Go wygrywane przez komputery, zwycięstwa w popularnych grach planszowych nie mogą już służyć jako kamienie milowe dla sztucznej inteligencji w sposób, w jaki do. Deep Blue „s Murray Campbell nazywa zwycięstwo AlphaGo za«koniec pewnej ery ... gry planszowe są bardziej lub mniej zrobione i nadszedł czas, aby przejść dalej.»

W porównaniu z Deep Blue lub Watson , podstawowe algorytmy AlphaGo są potencjalnie bardziej uniwersalne i mogą być dowodem na to, że społeczność naukowa czyni postępy w kierunku sztucznej inteligencji ogólnej . Niektórzy komentatorzy uważają, że zwycięstwo AlphaGo jest dobrą okazją dla społeczeństwa do rozpoczęcia przygotowań na możliwy przyszły wpływ maszyn z inteligencją ogólnego przeznaczenia . Jak zauważył przedsiębiorca Guy Suter, AlphaGo wie tylko, jak grać w Go i nie posiada ogólnej inteligencji; „[To] nie mogło po prostu obudzić się pewnego ranka i zdecydować, że chce nauczyć się posługiwania bronią palną”. Badacz sztucznej inteligencji Stuart Russell powiedział, że systemy sztucznej inteligencji, takie jak AlphaGo, rozwijają się szybciej i stają się potężniejsze niż oczekiwano, dlatego musimy opracować metody, aby zapewnić, że „pozostają pod kontrolą człowieka”. Niektórzy uczeni, tacy jak Stephen Hawking , ostrzegali (w maju 2015 r. przed meczami), że niektóre przyszłe samodoskonalenia AI mogą uzyskać rzeczywistą ogólną inteligencję, prowadząc do nieoczekiwanego przejęcia AI ; inni badacze nie zgadzają się z tym: ekspert ds. sztucznej inteligencji Jean-Gabriel Ganascia uważa, że ​​„Rzeczy takie jak „ zdrowy rozsądek ”... mogą nigdy nie być powtarzalne” i mówi: „Nie rozumiem, dlaczego mielibyśmy mówić o lękach. Wręcz przeciwnie, budzi to nadzieje w wielu dziedzinach, takich jak zdrowie i eksploracja kosmosu”. Informatyk Richard Sutton powiedział: „Nie uważam, że ludzie powinni się bać… ale uważam, że ludzie powinni zwracać na to uwagę”.

W Chinach AlphaGo było „ momentem Sputnika ”, który pomógł przekonać chiński rząd do nadania priorytetu i radykalnego zwiększenia finansowania sztucznej inteligencji.

W 2017 roku zespół DeepMind AlphaGo otrzymał inauguracyjny medal IJCAI Marvin Minsky za wybitne osiągnięcia w sztucznej inteligencji. „AlphaGo jest wspaniałym osiągnięciem i doskonałym przykładem tego, co zainicjowano w uznaniu Medalu Minsky'ego”, powiedział profesor Michael Wooldridge , przewodniczący Komitetu Nagród IJCAI. „Szczególne wrażenie na IJCAI zrobiło to, że AlphaGo osiąga to, co robi dzięki doskonałemu połączeniu klasycznych technik sztucznej inteligencji z najnowocześniejszymi technikami uczenia maszynowego, z którymi DeepMind jest tak blisko związany. To zapierająca dech w piersiach demonstracja współczesnej sztucznej inteligencji, i cieszymy się, że możemy to wyróżnić tą nagrodą”.

Idź do społeczności

Go to popularna gra w Chinach, Japonii i Korei, a mecze z 2016 roku obejrzało prawdopodobnie sto milionów ludzi na całym świecie. Wielu czołowych graczy Go określiło niekonwencjonalne zagrania AlphaGo jako pozornie wątpliwe ruchy, które początkowo wprawiały w zakłopotanie widzów, ale z perspektywy czasu miały sens: „Wszyscy oprócz najlepszych graczy Go tworzą swój styl, naśladując najlepszych graczy. AlphaGo wydaje się mieć całkowicie oryginalne ruchy, które sam tworzy ”. Wygląda na to, że AlphaGo niespodziewanie stała się znacznie silniejsza, nawet w porównaniu z meczem w październiku 2015 r., w którym komputer po raz pierwszy pokonał profesjonalistę Go bez przewagi handicapu. Dzień po pierwszej porażce Lee, Jeong Ahram, główny korespondent Go jednej z największych gazet codziennych w Korei Południowej, powiedział: „Ostatnia noc była bardzo ponura… Wiele osób piło alkohol”. Korea Baduk Association , organizacja, która nadzoruje specjalistów pójść w Korei Południowej, przyznawany AlphaGo honorowy tytuł 9-dan do wykazywania zdolności twórcze i popychając do przodu postęp w grze.

Chińczyk Ke Jie , 18-latek, w tamtym czasie powszechnie uznawany za najlepszego gracza w go na świecie, początkowo twierdził, że byłby w stanie pokonać AlphaGo, ale odmówił gry przeciwko niemu z obawy, że „skopiuje mój styl”. W miarę postępu meczów Ke Jie chodził tam iz powrotem, stwierdzając, że „jest bardzo prawdopodobne, że (mogę) przegrać” po przeanalizowaniu pierwszych trzech meczów, ale odzyskanie pewności siebie po AlphaGo wykazało wady w czwartym meczu.

Toby Manning, sędzia meczu AlphaGo z Fan Hui, i Hajin Lee, sekretarz generalny Międzynarodowej Federacji Go , obaj twierdzą, że w przyszłości gracze Go otrzymają pomoc od komputerów, aby dowiedzieć się, co zrobili źle w grach i poprawić swoje umiejętności.

Po drugim meczu Lee powiedział, że czuł się „bez słowa”: „Od samego początku meczu nigdy nie udało mi się zdobyć przewagi w jednym ruchu. To było całkowite zwycięstwo AlphaGo”. Lee przeprosił za swoje porażki, stwierdzając po trzecim meczu, że „błędnie oceniłem możliwości AlphaGo i poczułem się bezsilny”. Podkreślił, że porażka była „porażką Lee Se-dola”, a „nie porażką ludzkości”. Lee powiedział, że jego ostateczna przegrana z maszyną była „nieunikniona”, ale stwierdził, że „roboty nigdy nie zrozumieją piękna gry w taki sam sposób, jak my, ludzie”. Lee nazwał swoją grę cztery zwycięstwo „bezcenną wygraną, której (nie zamieniłbym) na nic”.

Podobne systemy

Facebook pracuje również nad własnym systemem Go-playing darkforest , również opartym na połączeniu uczenia maszynowego i wyszukiwania drzewa Monte Carlo . Chociaż był silnym graczem przeciwko innym programom komputerowym Go, od początku 2016 roku nie pokonał jeszcze profesjonalnego gracza. Darkforest przegrał z CrazyStone i Zen i szacuje się, że ma podobną siłę do CrazyStone i Zen.

DeepZenGo , system opracowany przy wsparciu serwisu internetowego Dwango i Uniwersytetu Tokijskiego , przegrał 2-1 w listopadzie 2016 roku z mistrzem Go Cho Chikunem , który jest rekordzistą pod względem największej liczby tytułów Go w Japonii.

W artykule opublikowanym w Nature z 2018 r. przytoczono podejście AlphaGo jako podstawę nowego sposobu obliczania potencjalnych cząsteczek leków farmaceutycznych.

Przykładowa gra

AlphaGo Master (biały) przeciwko Tang Weixing (31 grudnia 2016), AlphaGo wygrał przez rezygnację. Biały 36 był powszechnie chwalony.

Przejdź do ul.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Przejdź do ur.svg
Idź l.svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Przejdź 69.svg Idź .svg Idź .svg Idź .svg Przejdź do r.svg
Idź l.svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź 83.svg Przejdź 68.svg Idź .svg Idź .svg Idź .svg Idź .svg Przejdź do r.svg
Idź l.svg Idź .svg Idź .svg Idź w2.svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Przejdź -.svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Przejdź do b1.svg Idź .svg Idź .svg Przejdź do r.svg
Idź l.svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź 73.svg Idź .svg Idź .svg Idź 71.svg Idź .svg Przejdź do r.svg
Idź l.svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Przejdź 72.svg Przejdź 70.svg Idź .svg Przejdź do r.svg
Idź l.svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Przejdź do r.svg
Idź l.svg Idź .svg Przejdź 58.svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Przejdź 76.svg Idź .svg Idź .svg Przejdź do r.svg
Idź l.svg Idź .svg Przejdź 56.svg Przejdź 57.svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Przejdź 82.svg Przejdź 78.svg Idź .svg Przejdź 74.svg Przejdź 75.svg Idź .svg Przejdź do r.svg
Idź l.svg Przejdź 54.svg Przejdź 15.svg Przejdź -.svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Przejdź -.svg Idź .svg Idź .svg Przejdź do 80.svg Przejdź 79.svg Idź .svg Przejdź 77.svg Przejdź 67.svg Idź .svg Przejdź do r.svg
Idź l.svg Przejdź 52.svg Przejdź 53.svg Idź 36.svg Przejdź 37.svg Idź .svg Idź 47.svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź 81.svg Idź .svg Idź .svg Idź .svg Idź .svg Przejdź do r.svg
Idź l.svg Przejdź 48.svg Przejdź 39.svg Przejdź 27.svg Idź .svg Idź 46.svg Przejdź 41.svg Przejdź 40.svg Idź 51.svg Przejdź 92.svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Przejdź 84.svg Idź .svg Przejdź do r.svg
Idź l.svg Przejdź 42.svg Przejdź 38.svg Przejdź do b9.svg Idź .svg Idź .svg Przejdź 44.svg Przejdź 45.svg Idź .svg Idź 26.svg Idź .svg Przejdź 91.svg Idź .svg Idź .svg Idź .svg Idź .svg Przejdź 98.svg Idź 93.svg Przejdź do r.svg
Przejdź 64.svg Przejdź 43.svg Przejdź do b7.svg Przejdź w8.svg Przejdź 10.svg Idź .svg Idź .svg Przejdź 25.svg Idź .svg Idź .svg Przejdź 90.svg Przejdź 89.svg Idź .svg Przejdź 85.svg Idź .svg Przejdź 87.svg Idź .svg Idź .svg Przejdź do r.svg
Idź l.svg Idź .svg Przejdź 13.svg Przejdź 22.svg Idź .svg Przejdź 28.svg Przejdź 29.svg Idź 19.svg Przejdź 24.svg Idź .svg Idź .svg Przejdź 66.svg Idź .svg Idź 86.svg Idź .svg Przejdź 88.svg Przejdź w6.svg Przejdź 99.svg Przejdź do r.svg
Idź l.svg Przejdź 62.svg Przejdź 11.svg Idź w4.svg Idź .svg Przejdź 21.svg Idź .svg Idź 17.svg Idź 18.svg Przejdź -.svg Idź .svg Idź .svg Idź .svg Przejdź 30.svg Idź .svg Przejdź 34.svg Idź 97.svg Idź 96.svg Przejdź do r.svg
Idź l.svg Przejdź 49.svg Przejdź 12.svg Przejdź 14.svg Idź .svg Przejdź do b5.svg Idź .svg Przejdź do 20.svg Idź 16.svg Idź .svg Idź .svg Idź .svg Przejdź 23.svg Idź 31.svg Przejdź 35.svg Przejdź do b3.svg Przejdź 32.svg Przejdź 95.svg Przejdź do r.svg
Przejdź 55.svg Przejdź 50.svg Przejdź 59.svg Idź .svg Idź .svg Przejdź 65.svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Przejdź 33.svg Idź 94.svg Przejdź do r.svg
Przejdź 63.svg Przejdź 60.svg Przejdź 61.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Przejdź do dr.svg
Pierwsze 99 ruchów
Przejdź do ul.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Idź u.svg Przejdź do ur.svg
Idź l.svg Przejdź 48.svg Idź 46.svg Idź 47.svg Idź .svg Idź 36.svg Przejdź 54.svg Przejdź 53.svg Idź 51.svg Idź .svg Przejdź 27.svg Przejdź 14.svg Przejdź 13.svg Idź 17.svg Przejdź do .svg Idź .svg Przejdź 85.svg Idź .svg Przejdź do r.svg
Idź l.svg Przejdź 34.svg Przejdź 29.svg Przejdź 33.svg Przejdź 35.svg Przejdź w8.svg Idź .svg Przejdź 52.svg Idź 26.svg Przejdź do b9.svg Przejdź 23.svg Przejdź 12.svg Przejdź do .svg Idź w .svg Idź .svg Idź .svg Idź 83.svg Przejdź 84.svg Przejdź do r.svg
Przejdź 42.svg Idź 31.svg Przejdź 30.svg Idź w.svg Przejdź 37.svg Idź .svg Idź .svg Idź .svg Idź .svg Przejdź 22.svg Idź 18.svg Przejdź 15.svg Przejdź 10.svg Przejdź 11.svg Idź .svg Przejdź do b.svg Idź .svg Przejdź do 80.svg Przejdź do r.svg
Idź l.svg Przejdź 32.svg Przejdź 41.svg Przejdź 43.svg Przejdź 68.svg Przejdź 40.svg Przejdź 38.svg Przejdź 70.svg Idź .svg Przejdź 24.svg Przejdź 21.svg Idź 19.svg Idź 16.svg Przejdź do .svg Idź .svg Idź .svg Przejdź do .svg Idź 81.svg Przejdź 82.svg
Idź l.svg Przejdź 45.svg Idź .svg Idź .svg Przejdź 44.svg Przejdź 39.svg Przejdź 64.svg Przejdź 63.svg Idź .svg Przejdź 69.svg Idź .svg Idź .svg Przejdź do 20.svg Idź 71.svg Idź .svg Idź w .svg Idź w .svg Przejdź 78.svg Przejdź do r.svg
Idź l.svg Idź .svg Idź .svg Idź .svg Idź .svg Przejdź 65.svg Przejdź 66.svg Idź .svg Idź .svg Idź .svg Przejdź 75.svg Przejdź 25.svg Przejdź 72.svg Idź 73.svg Idź .svg Idź .svg Idź .svg Idź .svg Przejdź do r.svg
Idź l.svg Idź .svg Idź w .svg Przejdź 28.svg Idź .svg Przejdź 67.svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Przejdź 74.svg Idź .svg Idź .svg Idź w .svg Idź .svg Idź .svg Przejdź do r.svg
Idź l.svg Idź .svg Idź w .svg Przejdź do .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź 86.svg Idź .svg Idź .svg Idź w .svg Idź w .svg Idź .svg Idź w .svg Przejdź do .svg Idź .svg Przejdź do r.svg
Idź l.svg Idź w .svg Przejdź do .svg Przejdź -.svg Idź .svg Idź .svg Idź .svg Idź .svg Przejdź 76.svg Przejdź 55.svg Idź .svg Idź .svg Idź w .svg Przejdź do .svg Idź .svg Przejdź do b.svg Przejdź do .svg Przejdź do b3.svg Przejdź do r.svg
Idź l.svg Idź w .svg Przejdź do .svg Idź w .svg Przejdź do .svg Idź .svg Przejdź do .svg Przejdź 77.svg Idź .svg Przejdź 62.svg Przejdź w6.svg Idź .svg Idź w4.svg Przejdź do .svg Idź .svg Idź .svg Przejdź 79.svg Idź w2.svg Przejdź do r.svg
Idź l.svg Idź w .svg Przejdź do .svg Przejdź do .svg Idź .svg Idź w .svg Przejdź do .svg Idź w .svg Przejdź do .svg Idź w .svg Idź .svg Przejdź 56.svg Przejdź do b5.svg Przejdź 57.svg Idź .svg Idź .svg Idź w .svg Przejdź do b7.svg Przejdź do r.svg
Idź l.svg Idź w .svg Idź w .svg Przejdź do .svg Idź .svg Idź .svg Idź w .svg Przejdź do .svg Idź .svg Idź w .svg Idź .svg Przejdź do .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź w .svg Przejdź do .svg Przejdź do r.svg
Idź w.svg Przejdź do .svg Przejdź do .svg Idź w .svg Idź w .svg Idź .svg Idź .svg Przejdź do .svg Idź .svg Idź .svg Idź w .svg Przejdź do .svg Idź .svg Przejdź do .svg Idź .svg Przejdź do .svg Przejdź 00.svg Idź .svg Przejdź do r.svg
Idź l.svg Idź .svg Przejdź do .svg Idź w .svg Idź .svg Idź w .svg Przejdź do .svg Przejdź do .svg Idź w .svg Idź .svg Idź .svg Idź w .svg Idź .svg Idź w .svg Idź .svg Idź w .svg Idź w .svg Przejdź do .svg Przejdź do r.svg
Idź l.svg Idź w .svg Przejdź do .svg Idź w.svg Idź .svg Przejdź do .svg Idź .svg Przejdź do .svg Idź w .svg Przejdź -.svg Przejdź 60.svg Przejdź 58.svg Idź .svg Idź w .svg Idź .svg Idź w.svg Przejdź do .svg Idź w .svg Przejdź do b1.svg
Idź l.svg Przejdź do .svg Idź w .svg Idź w .svg Idź .svg Przejdź do .svg Idź .svg Idź w .svg Idź w .svg Przejdź 61.svg Przejdź 59.svg Idź .svg Przejdź do .svg Przejdź do .svg Przejdź do .svg Przejdź do .svg Idź .svg Przejdź do .svg Przejdź do r.svg
Przejdź do b.svg Idź .svg Przejdź do .svg Idź .svg Idź .svg Przejdź do .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Idź .svg Przejdź do .svg Idź w .svg Przejdź do r.svg
Przejdź do b.svg Idź d.svg Przejdź do b.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Idź d.svg Przejdź do dr.svg
Ruchy 100-186 (149 na 131, 150 na 130)

Wpływ na Go

Film dokumentalny AlphaGo wzbudził nadzieje, że Lee Sedol i Fan Hui skorzystaliby z ich doświadczenia z graniem w AlphaGo, ale od maja 2018 r. ich oceny niewiele się zmieniły; Lee Sedol zajął 11 miejsce na świecie, a Fan Hui 545. 19 listopada 2019 r. Lee ogłosił odejście z profesjonalnej gry, argumentując, że nigdy nie będzie najlepszym graczem w Go ze względu na rosnącą dominację sztucznej inteligencji. Lee odniósł się do nich jako do „bytu, którego nie można pokonać”.

Zobacz też

Bibliografia

Zewnętrzne linki