AlphaGo - AlphaGo
AlphaGo to program komputerowy, który gra w grę planszową Go . Został opracowany przez DeepMind Technologies, spółkę zależną Google (obecnie Alphabet Inc. ). Kolejne wersje AlphaGo stawały się coraz potężniejsze, w tym wersja, która konkurowała pod nazwą Master . Po wycofaniu się z rywalizacji, AlphaGo Master został zastąpiony przez jeszcze potężniejszą wersję znaną jako AlphaGo Zero , która była całkowicie samoukiem bez uczenia się na ludzkich grach. AlphaGo Zero został następnie uogólniony w program znany jako AlphaZero , który grał w dodatkowe gry, w tym w szachy i shogi . AlphaZero został z kolei zastąpiony przez program znany jako MuZero, który uczy się bez uczenia się zasad.
AlphaGo i jego następcy używają algorytmu wyszukiwania drzewa Monte Carlo , aby znaleźć swoje ruchy w oparciu o wiedzę nabytą wcześniej przez uczenie maszynowe , w szczególności przez sztuczną sieć neuronową ( metoda głębokiego uczenia ) poprzez intensywne szkolenie, zarówno z ludzi, jak i z gry komputerowej. Sieć neuronowa jest szkolona, aby identyfikować najlepsze ruchy i zwycięski procent tych ruchów. Ta sieć neuronowa poprawia siłę przeszukiwania drzewa, co skutkuje silniejszym wyborem ruchu w następnej iteracji.
W październiku 2015, w meczu z Fan Hui , oryginalny AlphaGo stał się pierwszym komputerowym programem Go , który pokonał profesjonalnego gracza Go bez handicapu na pełnowymiarowej planszy 19×19. W marcu 2016 roku pokonał Lee Sedola w pięciomeczowym meczu , po raz pierwszy program komputerowy Go pokonał 9-danowego profesjonalistę bez niepełnosprawności. Chociaż przegrał z Lee Sedolem w czwartej grze, Lee zrezygnował w ostatniej grze, dając wynik 4 do 1 na korzyść AlphaGo. W uznaniu zwycięstwa AlphaGo została nagrodzona honorowym 9-dan przez Korea Baduk Association . Prowadzenie i pojedynek z Lee Sedolem zostały udokumentowane w filmie dokumentalnym, również zatytułowanym AlphaGo , w reżyserii Grega Kohsa. Zwycięstwo AlphaGo zostało wybrane przez Science jako jedno z wicemistrzów w kategorii Przełom Roku w dniu 22 grudnia 2016 r.
W 2017 przyszłości Go szczytu The Mistrz wersja AlphaGo pokonać Ke Jie , jeden numer w rankingu graczem na świecie w momencie, w meczu trzy gry , po którym AlphaGo został nagrodzony profesjonalnym 9-dan przez chińskiego Weiqi Stowarzyszenia .
Po meczu między AlphaGo i Ke Jie, DeepMind wycofał AlphaGo, kontynuując badania nad sztuczną inteligencją w innych obszarach. Samouk AlphaGo Zero osiągnął 100-0 zwycięstwo nad wczesną, konkurencyjną wersją AlphaGo, a jego następca AlphaZero jest obecnie postrzegany jako najlepszy gracz na świecie w Go, a także prawdopodobnie w szachach .
Historia
Go jest uważane za znacznie trudniejsze do wygrania przez komputery niż w innych grach, takich jak szachy , ponieważ jego znacznie większy współczynnik rozgałęzień sprawia, że korzystanie z tradycyjnych metod sztucznej inteligencji, takich jak przycinanie alfa-beta , przechodzenie przez drzewa i wyszukiwanie heurystyczne, jest niezwykle trudne .
Prawie dwie dekady po tym, jak komputer IBM Deep Blue pokonał mistrza świata w szachach Garry'ego Kasparowa w meczu z 1997 roku , najsilniejsze programy Go wykorzystujące techniki sztucznej inteligencji osiągnęły jedynie amatorski poziom 5 dan i nadal nie mogły pokonać profesjonalnego gracza Go bez handicapu . W 2012 r. program Zen , działający na cztero-komputerowym klastrze, dwukrotnie pokonał Masaki Takemiya ( 9p ) z handicapami pięcio- i czterokamiennymi. W 2013 Crazy Stone pokonał Yoshio Ishidę (9p) z handicapem czterech kamieni.
Według Davida Silvera z DeepMind , projekt badawczy AlphaGo powstał około 2014 roku, aby sprawdzić, jak dobrze sieć neuronowa wykorzystująca głębokie uczenie może konkurować w Go. AlphaGo stanowi znaczną poprawę w stosunku do poprzednich programów Go. W 500 grach przeciwko innym dostępnym programom Go, w tym Crazy Stone i Zen, AlphaGo działający na jednym komputerze wygrał wszystko oprócz jednego. W podobnym pojedynku AlphaGo działająca na wielu komputerach wygrała wszystkie 500 gier rozegranych z innymi programami Go, a 77% gier rozegranych przeciwko AlphaGo uruchomionej na jednym komputerze. Wersja dystrybuowana w październiku 2015 r. używała 1202 procesorów i 176 procesorów graficznych .
Mecz przeciwko Fan Hui
W październiku 2015 r. dystrybuowana wersja AlphaGo pokonała mistrza Europy w go, Fan Hui , profesjonalistę z 2 dan (możliwe na 9 dan), pięć do zera. To był pierwszy raz, kiedy program komputerowy Go pokonał profesjonalnego gracza na pełnowymiarowej planszy bez utrudnień. Ogłoszenie wiadomości zostało przesunięte do 27 stycznia 2016 r., aby zbiegło się w czasie z publikacją artykułu w czasopiśmie Nature opisującym zastosowane algorytmy.
Mecz przeciwko Lee Sedol
AlphaGo grał południowokoreańskiego profesjonalnego gracza Go Lee Sedola , który uzyskał 9 dan, jednego z najlepszych graczy w Go. Pięć gier odbyło się w hotelu Four Seasons w Seulu w Korei Południowej w dniach 9, 10, 12, 13 i 15 marca 2016, które były transmitowane na żywo. Na pięć gier AlphaGo wygrał cztery, a Lee wygrał czwartą, co sprawiło, że został zarejestrowany jako jedyny gracz, który pokonał AlphaGo we wszystkich 74 oficjalnych grach. AlphaGo działała w chmurze Google z serwerami znajdującymi się w Stanach Zjednoczonych. W meczu zastosowano chińskie zasady z komi 7,5 punktu , a każda ze stron miała dwie godziny na myślenie plus trzy 60-sekundowe okresy byoyomi . Wersja AlphaGo grająca przeciwko Lee wykorzystywała podobną ilość mocy obliczeniowej, jak w meczu Fan Hui. The Economist poinformował, że używał 1920 procesorów i 280 procesorów graficznych. W czasie gry Lee Sedol miał drugą co do wielkości liczbę zwycięstw w międzynarodowych mistrzostwach Go na świecie po południowokoreańskim graczu Lee Changho, który utrzymał tytuł mistrza świata przez 16 lat. Ponieważ nie ma jednej oficjalnej metody rankingu w międzynarodowym Go , rankingi mogą się różnić w zależności od źródeł. Chociaż czasami był na szczycie, niektóre źródła umieściły Lee Sedola jako czwartego najlepszego gracza na świecie w tym czasie. AlphaGo nie została specjalnie przeszkolona, aby stawić czoła Lee, ani nie została zaprojektowana do konkurowania z konkretnymi ludzkimi graczami.
Pierwsze trzy mecze wygrało AlphaGo po rezygnacji Lee. Jednak Lee pokonał AlphaGo w czwartej partii, wygrywając rezygnacją w ruchu 180. AlphaGo kontynuował odnoszenie czwartej wygranej, wygrywając piątą partię przez rezygnację.
Nagroda wyniosła 1 milion dolarów. Ponieważ AlphaGo wygrał cztery z pięciu, a tym samym całą serię, nagroda zostanie przekazana organizacjom charytatywnym, w tym UNICEF . Lee Sedol otrzymał 150 000 dolarów za udział we wszystkich pięciu grach i dodatkowe 20 000 dolarów za wygraną w grze 4.
W czerwcu 2016 roku, podczas prezentacji zorganizowanej na uniwersytecie w Holandii, Aja Huang, jeden z zespołu Deep Mind, ujawnił, że naprawił logiczną słabość, która wystąpiła podczas czwartej gry meczu pomiędzy AlphaGo i Lee, i że po ruch 78 (który został nazwany przez wielu zawodowców „ boskim ruchem ”), zagrałby zgodnie z przeznaczeniem i utrzymałby przewagę czarnych. Przed ruchem 78, AlphaGo prowadził w całej grze, ale ruch Lee spowodował, że moc obliczeniowa programu została odwrócona i zdezorientowana. Huang wyjaśnił, że sieć polityczna AlphaGo polegająca na znalezieniu najdokładniejszego porządku ruchu i kontynuacji nie prowadziła dokładnie AlphaGo do wykonania prawidłowej kontynuacji po 78 ruchu, ponieważ jego sieć wartości nie określiła 78. ruchu Lee jako najbardziej prawdopodobnego, a zatem kiedy ruch powstało AlphaGo nie mogło dokonać odpowiedniego dopasowania do logicznej kontynuacji.
Sześćdziesiąt gier online
29 grudnia 2016 r. nowe konto na serwerze Tygem o nazwie „Magister” (oznaczone jako „Magist” w chińskiej wersji serwera) z Korei Południowej zaczęło grać w gry z profesjonalnymi graczami. Zmienił nazwę konta na „Master” 30 grudnia, a następnie przeniósł się na serwer FoxGo 1 stycznia 2017 roku. 4 stycznia DeepMind potwierdził, że „Magister” i „Master” są odtwarzane przez zaktualizowaną wersję AlphaGo, zwany Mistrzem AlphaGo . Na dzień 5 stycznia 2017 r. rekord online AlphaGo Master wynosił 60 wygranych i 0 przegranych, w tym trzy zwycięstwa nad najlepszym graczem Go, Ke Jie , który został po cichu z wyprzedzeniem poinformowany, że Master jest wersją AlphaGo. Po przegranej z Mistrzem, Gu Li zaoferował nagrodę w wysokości 100 000 juanów (14 400 USD) pierwszemu graczowi, który mógł pokonać Mistrza. Mistrz grał w tempie 10 gier dziennie. Wielu szybko podejrzewało, że jest to gracz AI z powodu niewielkiego lub żadnego odpoczynku między grami. Jej przeciwnikami było wielu mistrzów świata, takich jak Ke Jie , Park Jeong-hwan , Yuta Iyama , Tuo Jiaxi , Mi Yuting , Shi Yue , Chen Yaoye , Li Qincheng, Gu Li , Chang Hao , Tang Weixing, Fan Tingyu , Zhou Ruiyang , Jiang Weijie , Chou Chun-hsun , Kim Ji-seok , Kang Dong-yun , Park Yeong-hun i Won Seong-jin ; mistrzowie krajowi lub wicemistrzowie świata, tacy jak Lian Xiao , Tan Xiao , Meng Tailing, Dang Yifei, Huang Yunsong, Yang Dingxin , Gu Zihao, Shin Jinseo, Cho Han-seung i An Sungjoon. Wszystkie 60 gier z wyjątkiem jednej były szybkimi grami z trzema 20- lub 30-sekundowymi byo-yomi . Mistrz zaproponował przedłużenie byo-yomi do jednej minuty podczas gry z Nie Weipingiem ze względu na jego wiek. Po wygraniu 59. gry Master ujawnił się na czacie pod kontrolą dr Aja Huang z zespołu DeepMind, po czym zmienił narodowość na Wielką Brytanię. Po ukończeniu tych gier współzałożyciel Google DeepMind, Demis Hassabis , powiedział w tweecie: „nie możemy się doczekać, aby zagrać w niektóre oficjalne, pełnometrażowe gry później [2017] we współpracy z organizacjami i ekspertami Go”.
Eksperci Go byli pod wrażeniem wydajności programu i jego nieludzkiego stylu gry; Ke Jie stwierdził, że „Po tym, jak ludzkość spędziła tysiące lat na ulepszaniu naszej taktyki, komputery mówią nam, że ludzie całkowicie się mylą… Posunąłbym się do stwierdzenia, że ani jeden człowiek nie dotknął krawędzi prawdy o Go”.
Przyszłość Go Summit
Podczas Future of Go Summit, który odbył się w Wuzhen w maju 2017 r., AlphaGo Master rozegrał trzy gry z Ke Jie, graczem nr 1 na świecie, a także dwie gry z kilkoma najlepszymi chińskimi profesjonalistami, jedną grę w pary Go i jedną przeciwko współpracującym zespół pięciu ludzkich graczy.
Google DeepMind zaoferował zwycięzcy 1,5 miliona dolarów za trzymeczowy mecz między Ke Jie i Master, podczas gdy strona przegrywająca zgarnęła 300 000 dolarów. Master wygrał wszystkie trzy mecze z Ke Jie, po czym AlphaGo otrzymał profesjonalne 9-dan od Chińskiego Stowarzyszenia Weiqi.
Po wygraniu trzymeczowego meczu z Ke Jie, najlepiej oceniany gracz na świecie w Go, AlphaGo, przeszedł na emeryturę. DeepMind rozwiązał również zespół, który pracował nad grą, aby skupić się na badaniach nad sztuczną inteligencją w innych obszarach. Po zakończeniu szczytu Deepmind opublikował 50 pełnometrażowych meczów AlphaGo vs AlphaGo w prezencie dla społeczności Go.
AlphaGo Zero i AlphaZero
Zespół AlphaGo opublikował artykuł w czasopiśmie Nature w dniu 19 października 2017 r., przedstawiając AlphaGo Zero, wersję bez danych ludzkich i silniejszą niż jakakolwiek poprzednia wersja pokonująca ludzkich mistrzów. Grając przeciwko sobie, AlphaGo Zero przewyższył siłę AlphaGo Lee w trzy dni, wygrywając 100 gier do 0, osiągnął poziom AlphaGo Master w 21 dni i przekroczył wszystkie stare wersje w 40 dni.
W artykule opublikowanym na arXiv 5 grudnia 2017 r. DeepMind twierdził, że uogólnił podejście AlphaGo Zero do pojedynczego algorytmu AlphaZero, który osiągnął w ciągu 24 godzin nadludzki poziom gry w szachy , shogi i Go , pokonując mistrza świata. programy, Stockfish , Elmo i 3-dniowa wersja AlphaGo Zero w każdym przypadku.
Narzędzie do nauczania
11 grudnia 2017 r. DeepMind udostępnił na swojej stronie internetowej narzędzie do nauczania AlphaGo, które analizuje wskaźniki wygranych różnych otwarć Go, obliczone przez AlphaGo Master . Narzędzie do nauczania zbiera 6000 otwarć Go z 230 000 ludzkich gier, z których każda została przeanalizowana za pomocą 10 000 000 symulacji przez AlphaGo Master. Wiele otworów zawiera sugestie ruchów człowieka.
Wersje
Wczesna wersja AlphaGo została przetestowana na sprzęcie z różną liczbą procesorów i GPU , działających w trybie asynchronicznym lub rozproszonym. Na każdy ruch przeznaczono dwie sekundy czasu na namysł. Otrzymane oceny Elo są wymienione poniżej. W meczach z większą ilością czasu na ruch osiągane są wyższe notowania.
Konfiguracja | Szukaj wątków |
Liczba procesorów | Liczba GPU | Ocena Elo |
---|---|---|---|---|
Pojedynczy str. 10-11 | 40 | 48 | 1 | 2181 |
Pojedynczy | 40 | 48 | 2 | 2738 |
Pojedynczy | 40 | 48 | 4 | 2850 |
Pojedynczy | 40 | 48 | 8 | 2890 |
Rozpowszechniane | 12 | 428 | 64 | 2937 |
Rozpowszechniane | 24 | 764 | 112 | 3079 |
Rozpowszechniane | 40 | 1202 | 176 | 3140 |
Rozpowszechniane | 64 | 1920 | 280 | 3168 |
W maju 2016 r. Google zaprezentował własne, zastrzeżone sprzętowe „ jednostki przetwarzania tensorów ”, które, jak twierdził, zostały już wdrożone w wielu wewnętrznych projektach Google, w tym w meczu AlphaGo z Lee Sedolem.
W Future of Go Summit w maju 2017 r. DeepMind ujawnił, że wersja AlphaGo użyta podczas tego szczytu to AlphaGo Master , i ujawnił, że mierzył siłę różnych wersji oprogramowania. AlphaGo Lee, wersja użyta przeciwko Lee, mogła dać AlphaGo Fan, wersja używana w AlphaGo vs. Fan Hui, trzy kamienie, a AlphaGo Master był nawet o trzy kamienie silniejszy.
Wersje | Sprzęt komputerowy | Ocena Elo | Data | Wyniki |
---|---|---|---|---|
Wentylator AlphaGo | 176 procesorów graficznych , rozproszonych | 3144 | Październik 2015 | 5:0 przeciwko Fan Hui |
AlphaGo Lee | 48 TPU , rozproszone | 3739 | marzec 2016 | 4:1 przeciwko Lee Sedolowi |
Mistrz AlphaGo | 4 TPU, pojedyncza maszyna | 4,858 | maj 2017 | 60:0 przeciwko profesjonalnym graczom; Przyszłość Go Summit |
AlphaGo Zero (blok 40) | 4 TPU, pojedyncza maszyna | 5185 | Październik 2017 | 100:0 przeciwko AlphaGo Lee
89:11 przeciwko AlphaGo Master |
AlphaZero (20 bloków) | 4 TPU, pojedyncza maszyna | 5018
|
grudzień 2017 | 60:40 przeciwko AlphaGo Zero (20 bloków) |
Algorytm
Od 2016 r. algorytm AlphaGo wykorzystuje kombinację uczenia maszynowego i technik wyszukiwania drzew , w połączeniu z obszernym szkoleniem, zarówno z ludzi, jak i gier komputerowych. Wykorzystuje wyszukiwanie drzewa Monte Carlo , kierując się „siecią wartości” i „siecią zasad”, obydwa zaimplementowane przy użyciu technologii głębokich sieci neuronowych . Ograniczona ilość wstępnego przetwarzania funkcji wykrywania specyficznych dla gry (na przykład w celu podkreślenia, czy ruch pasuje do wzorca nakade ) jest stosowana do danych wejściowych przed wysłaniem ich do sieci neuronowych. Sieci są splotowymi sieciami neuronowymi z 12 warstwami, wyszkolonymi przez uczenie ze wzmocnieniem .
Sieci neuronowe systemu były początkowo pobierane z wiedzy o rozgrywkach człowieka. AlphaGo został początkowo przeszkolony, aby naśladować ludzką grę, próbując dopasować ruchy doświadczonych graczy z zarejestrowanych gier historycznych, korzystając z bazy danych zawierającej około 30 milionów ruchów. Po osiągnięciu pewnego stopnia zaawansowania był dalej szkolony, grając dużą liczbę gier przeciwko innym instancjom, wykorzystując uczenie się ze wzmocnieniem, aby poprawić swoją grę. Aby uniknąć „bez szacunku” marnowania czasu przeciwnika, program jest specjalnie zaprogramowany do rezygnacji, jeśli jego ocena prawdopodobieństwa wygranej spadnie poniżej pewnego progu; na mecz z Lee próg rezygnacji ustalono na 20%.
Styl gry
Toby Manning, sędzia meczowy AlphaGo vs. Fan Hui, określił styl programu jako „konserwatywny”. Styl gry AlphaGo zdecydowanie faworyzuje większe prawdopodobieństwo wygranej mniejszą liczbą punktów nad mniejszym prawdopodobieństwem wygranej większą liczbą punktów. Jego strategia maksymalizacji prawdopodobieństwa wygranej różni się od tego, co zwykle robią gracze, czyli maksymalizacji zdobyczy terytorialnych, i wyjaśnia niektóre z jego dziwnie wyglądających ruchów. Wykonuje wiele ruchów otwierających, które nigdy lub rzadko były wykonywane przez ludzi. Lubi używać ciosów w barki , zwłaszcza gdy przeciwnik jest nadmiernie skoncentrowany.
Odpowiedzi na zwycięstwo 2016
Społeczność AI
Zwycięstwo AlphaGo w marcu 2016 r. było kamieniem milowym w badaniach nad sztuczną inteligencją. Go wcześniej uważano za trudny problem w uczeniu maszynowym, który miał być poza zasięgiem ówczesnej technologii. Większość ekspertów uważała, że program Go tak potężny jak AlphaGo będzie oddalony o co najmniej pięć lat; niektórzy eksperci sądzili, że minie co najmniej dekada, zanim komputery pokonają mistrzów Go. Większość obserwatorów na początku meczów 2016 spodziewała się, że Lee pokona AlphaGo.
Z grami takimi jak warcaby (które zostały „ rozwiązane ” przez zespół graczy w warcaby Chinook ), szachy, a teraz Go wygrywane przez komputery, zwycięstwa w popularnych grach planszowych nie mogą już służyć jako kamienie milowe dla sztucznej inteligencji w sposób, w jaki do. Deep Blue „s Murray Campbell nazywa zwycięstwo AlphaGo za«koniec pewnej ery ... gry planszowe są bardziej lub mniej zrobione i nadszedł czas, aby przejść dalej.»
W porównaniu z Deep Blue lub Watson , podstawowe algorytmy AlphaGo są potencjalnie bardziej uniwersalne i mogą być dowodem na to, że społeczność naukowa czyni postępy w kierunku sztucznej inteligencji ogólnej . Niektórzy komentatorzy uważają, że zwycięstwo AlphaGo jest dobrą okazją dla społeczeństwa do rozpoczęcia przygotowań na możliwy przyszły wpływ maszyn z inteligencją ogólnego przeznaczenia . Jak zauważył przedsiębiorca Guy Suter, AlphaGo wie tylko, jak grać w Go i nie posiada ogólnej inteligencji; „[To] nie mogło po prostu obudzić się pewnego ranka i zdecydować, że chce nauczyć się posługiwania bronią palną”. Badacz sztucznej inteligencji Stuart Russell powiedział, że systemy sztucznej inteligencji, takie jak AlphaGo, rozwijają się szybciej i stają się potężniejsze niż oczekiwano, dlatego musimy opracować metody, aby zapewnić, że „pozostają pod kontrolą człowieka”. Niektórzy uczeni, tacy jak Stephen Hawking , ostrzegali (w maju 2015 r. przed meczami), że niektóre przyszłe samodoskonalenia AI mogą uzyskać rzeczywistą ogólną inteligencję, prowadząc do nieoczekiwanego przejęcia AI ; inni badacze nie zgadzają się z tym: ekspert ds. sztucznej inteligencji Jean-Gabriel Ganascia uważa, że „Rzeczy takie jak „ zdrowy rozsądek ”... mogą nigdy nie być powtarzalne” i mówi: „Nie rozumiem, dlaczego mielibyśmy mówić o lękach. Wręcz przeciwnie, budzi to nadzieje w wielu dziedzinach, takich jak zdrowie i eksploracja kosmosu”. Informatyk Richard Sutton powiedział: „Nie uważam, że ludzie powinni się bać… ale uważam, że ludzie powinni zwracać na to uwagę”.
W Chinach AlphaGo było „ momentem Sputnika ”, który pomógł przekonać chiński rząd do nadania priorytetu i radykalnego zwiększenia finansowania sztucznej inteligencji.
W 2017 roku zespół DeepMind AlphaGo otrzymał inauguracyjny medal IJCAI Marvin Minsky za wybitne osiągnięcia w sztucznej inteligencji. „AlphaGo jest wspaniałym osiągnięciem i doskonałym przykładem tego, co zainicjowano w uznaniu Medalu Minsky'ego”, powiedział profesor Michael Wooldridge , przewodniczący Komitetu Nagród IJCAI. „Szczególne wrażenie na IJCAI zrobiło to, że AlphaGo osiąga to, co robi dzięki doskonałemu połączeniu klasycznych technik sztucznej inteligencji z najnowocześniejszymi technikami uczenia maszynowego, z którymi DeepMind jest tak blisko związany. To zapierająca dech w piersiach demonstracja współczesnej sztucznej inteligencji, i cieszymy się, że możemy to wyróżnić tą nagrodą”.
Idź do społeczności
Go to popularna gra w Chinach, Japonii i Korei, a mecze z 2016 roku obejrzało prawdopodobnie sto milionów ludzi na całym świecie. Wielu czołowych graczy Go określiło niekonwencjonalne zagrania AlphaGo jako pozornie wątpliwe ruchy, które początkowo wprawiały w zakłopotanie widzów, ale z perspektywy czasu miały sens: „Wszyscy oprócz najlepszych graczy Go tworzą swój styl, naśladując najlepszych graczy. AlphaGo wydaje się mieć całkowicie oryginalne ruchy, które sam tworzy ”. Wygląda na to, że AlphaGo niespodziewanie stała się znacznie silniejsza, nawet w porównaniu z meczem w październiku 2015 r., w którym komputer po raz pierwszy pokonał profesjonalistę Go bez przewagi handicapu. Dzień po pierwszej porażce Lee, Jeong Ahram, główny korespondent Go jednej z największych gazet codziennych w Korei Południowej, powiedział: „Ostatnia noc była bardzo ponura… Wiele osób piło alkohol”. Korea Baduk Association , organizacja, która nadzoruje specjalistów pójść w Korei Południowej, przyznawany AlphaGo honorowy tytuł 9-dan do wykazywania zdolności twórcze i popychając do przodu postęp w grze.
Chińczyk Ke Jie , 18-latek, w tamtym czasie powszechnie uznawany za najlepszego gracza w go na świecie, początkowo twierdził, że byłby w stanie pokonać AlphaGo, ale odmówił gry przeciwko niemu z obawy, że „skopiuje mój styl”. W miarę postępu meczów Ke Jie chodził tam iz powrotem, stwierdzając, że „jest bardzo prawdopodobne, że (mogę) przegrać” po przeanalizowaniu pierwszych trzech meczów, ale odzyskanie pewności siebie po AlphaGo wykazało wady w czwartym meczu.
Toby Manning, sędzia meczu AlphaGo z Fan Hui, i Hajin Lee, sekretarz generalny Międzynarodowej Federacji Go , obaj twierdzą, że w przyszłości gracze Go otrzymają pomoc od komputerów, aby dowiedzieć się, co zrobili źle w grach i poprawić swoje umiejętności.
Po drugim meczu Lee powiedział, że czuł się „bez słowa”: „Od samego początku meczu nigdy nie udało mi się zdobyć przewagi w jednym ruchu. To było całkowite zwycięstwo AlphaGo”. Lee przeprosił za swoje porażki, stwierdzając po trzecim meczu, że „błędnie oceniłem możliwości AlphaGo i poczułem się bezsilny”. Podkreślił, że porażka była „porażką Lee Se-dola”, a „nie porażką ludzkości”. Lee powiedział, że jego ostateczna przegrana z maszyną była „nieunikniona”, ale stwierdził, że „roboty nigdy nie zrozumieją piękna gry w taki sam sposób, jak my, ludzie”. Lee nazwał swoją grę cztery zwycięstwo „bezcenną wygraną, której (nie zamieniłbym) na nic”.
Podobne systemy
Facebook pracuje również nad własnym systemem Go-playing darkforest , również opartym na połączeniu uczenia maszynowego i wyszukiwania drzewa Monte Carlo . Chociaż był silnym graczem przeciwko innym programom komputerowym Go, od początku 2016 roku nie pokonał jeszcze profesjonalnego gracza. Darkforest przegrał z CrazyStone i Zen i szacuje się, że ma podobną siłę do CrazyStone i Zen.
DeepZenGo , system opracowany przy wsparciu serwisu internetowego Dwango i Uniwersytetu Tokijskiego , przegrał 2-1 w listopadzie 2016 roku z mistrzem Go Cho Chikunem , który jest rekordzistą pod względem największej liczby tytułów Go w Japonii.
W artykule opublikowanym w Nature z 2018 r. przytoczono podejście AlphaGo jako podstawę nowego sposobu obliczania potencjalnych cząsteczek leków farmaceutycznych.
Przykładowa gra
AlphaGo Master (biały) przeciwko Tang Weixing (31 grudnia 2016), AlphaGo wygrał przez rezygnację. Biały 36 był powszechnie chwalony.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Pierwsze 99 ruchów |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ruchy 100-186 (149 na 131, 150 na 130) |
Wpływ na Go
Film dokumentalny AlphaGo wzbudził nadzieje, że Lee Sedol i Fan Hui skorzystaliby z ich doświadczenia z graniem w AlphaGo, ale od maja 2018 r. ich oceny niewiele się zmieniły; Lee Sedol zajął 11 miejsce na świecie, a Fan Hui 545. 19 listopada 2019 r. Lee ogłosił odejście z profesjonalnej gry, argumentując, że nigdy nie będzie najlepszym graczem w Go ze względu na rosnącą dominację sztucznej inteligencji. Lee odniósł się do nich jako do „bytu, którego nie można pokonać”.
Zobacz też
- Chinook (gra w warcaby) , program do gry w warcaby
- Słowniczek sztucznej inteligencji
- Idź i matematyka
- Leela (oprogramowanie)
- TD-Gammon , sieć neuronowa backgammon
- Pluribus (bot pokerowy)
- AlfaZero
- AlfaFold
Bibliografia
Zewnętrzne linki
- Multimedia związane z AlphaGo w Wikimedia Commons
- Cytaty związane z AlphaGo na Wikiquote
- Oficjalna strona internetowa
- Wiki AlphaGo w Sensei's Library , w tym linki do gier AlphaGo
- Strona AlphaGo z archiwum i grami
- Szacunkowa ocena Alpha Go . na rok 2017