Pytanie:
Jak ludzie są dobrzy w szachach?
Klangen
2020-04-29 16:12:48 UTC
view on stackexchange narkive permalink

Szacuje się, że całkowita liczba legalnych pozycji w szachach wynosi od 10 ^ 40 do 10 ^ 50. To oczywiście ogromna liczba. Dzisiejsze komputery z dość dobrym oprogramowaniem szachowym mogą czasami patrzeć 20 ruchów naprzód, aby znaleźć najlepszą kontynuację.

Ale (większość) ludzi nie jest w stanie wykonać takich obliczeń. Po każdym ruchu praktycznie niemożliwe jest obliczenie wszystkich konsekwencji i wariacji. Dlatego oczekuje się, że ruch wykonany przez człowieka będzie rzeczywiście bardzo słabym posunięciem.

Ale tak nie jest: patrząc na mecze GM, ci ludzie są w stanie znaleźć `` najlepsze '' ruchy zalecane przez najlepsze silniki, takie jak Stockfish, mimo że oczywiście nie obliczają miliardów kombinacji na minutę.

Więc co sprawia, że ​​ludzie są dobrzy w szachach, jeśli nie są w stanie dostrzec ogromnej przestrzeni przyszłych zmian? Kiedy patrzę na to, co GM robią lepiej niż amatorzy, zwykle widzę lepszą „intuicję” lub „wyczucie stanowiska”. Ale tego nie można określić ilościowo. GM oczywiście nie mają zdolności parapsychologicznych. Jak więc przez większość czasu mogą znaleźć najlepszy ruch? Mistrzowie szachów często twierdzą, że nie stosują wewnętrznego „algorytmu”. Więc co oni na Ziemi śledzą?

Jak ludzie mogą być tak dobrzy w szachach?

Należy zauważyć, że porównując ludzi i komputery w szachach, ludzie wcale nie są dobrzy. Nawet jeśli arcymistrzowie potrafią wykonywać dobre ruchy - lub nawet ruchy, z którymi komputer się zgadza - przez większość czasu, to nadal nie jest to cały czas. Rzeczywiście, minęły dziesięciolecia, odkąd ludzie naprawdę konkurowali z komputerami.
I nawet nie wiemy, jak oszacować, jak dobre są komputery ... zauważ, że wciąż jesteśmy w stanie znaleźć błędy w Lc0 (który wielu uważa za najsilniejszy silnik na świecie), a Lc0 jest w stanie pokonać Stockfisha ( który w zasadzie wszyscy uważają za najsilniejszy silnik na świecie).
większość ludzi nie jest :)
Ludzie rzadko przeszukują przestrzeń stanów. Algorytmy uczenia się ze wzmocnieniem są bardziej porównywalne z ludzkim myśleniem - to, co robią, polega na wielokrotnym graniu w grę, zbieraniu informacji zwrotnych i nauce modelu predykcyjnego, który może powiedzieć, jak dobry jest dany ruch z aktualnej planszy i proponowanego ruchu - komputerowa alternatywa dla intuicji . Dzięki doskonałemu modelowi predykcyjnemu (którego nie mamy), optymalnym działaniem dla planszy jest argmax (model_score (move)) na wszystkie możliwe ruchy, co jest szybkie do obliczenia. Algorytmy takie jak alphazero łączą te dwa podejścia - wyszukiwanie stanu + uczenie modeli predykcyjnych
„oczywiście nie oblicza miliardów kombinacji na minutę” nie jest do końca prawdziwe, a przynajmniej nie jest jasne. Wewnętrzne funkcjonowanie ludzkiego mózgu wciąż pozostaje tajemnicą, ale każda komórka w mózgu działa jak wiele bramek logicznych stanu (prawdopodobnie miliardy), a same komórki są miliardami. Nie ma (znanej) głównej częstotliwości zegara, ale można przesuwać ręcznie około 10 kHz. Rzeczywiście potężny komputer.
Zakładam, że 9.999999 ^ 50 tych ruchów jest całkowicie głupich.
@imallett Można by argumentować, że porównując ludzi i komputery w szachach, komputery wcale nie są dobre. Zakopują ludzi czystą mocą obliczeniową, ale nie prawdziwą inteligencją. Gdyby ktoś zaprogramował komputer, który musiałby wykonać ruch po rozważeniu zaledwie kilkudziesięciu pozycji, ludzki arcymistrz prawdopodobnie by go zniszczył.
Oprócz uwagi, że wiele z tych pozycji jest nieciekawych, wiele z nich jest również równoważnych funkcjonalnie, jeśli masz mata w jednym rogu planszy, istnieje wiele możliwości tego, co jest w przeciwnym rogu , ale większość z nich nie zmienia niczego w grze
Ile tur zajęłoby zrozumienie, że grasz przeciwko komputerowi? Domyślam się, że gra końcowa jest tam, gdzie błyszczą, gdzie pozostało zdecydowanie mniej niż tyle możliwości, ale wciąż zbyt wiele, aby człowiek mógł zastosować kontemplację nad nimi wszystkimi, zamiast tylko intuicji doświadczenia.
Powiedzmy, że prawdopodobieństwo, że ludzki arcymistrz wykona teoretyczny „najlepszy ruch” (jeśli istnieje lub może być dobrze zdefiniowany w jakiś znaczący sposób) w przypadkowej, typowej pozycji w grze środkowej wynosi co najmniej 5%. Następnie, z perspektywy dwudziestej szklanki pełnej, ludzie są całkiem dobrzy w szachach; z perspektywy pustych szklanych dziewiętnastych i dwudziestych dwudziestych są po prostu okropne.
Czternaście odpowiedzi:
#1
+40
Kortchnoi
2020-04-30 02:01:16 UTC
view on stackexchange narkive permalink

Herbert Simon poruszył tę kwestię. Otrzymał Nagrodę Turinga w 1975 r. I Nagrodę Nobla w dziedzinie ekonomii w 1978 r. Jego głównym zainteresowaniem badawczym było podejmowanie decyzji i jest najbardziej znany z teorii „ograniczonej racjonalności” i „ satysfakcjonującego”.

Satysfakcja to strategia podejmowania decyzji lub heurystyka poznawcza, która polega na przeszukiwaniu dostępnych alternatyw aż do osiągnięcia progu akceptowalności. Simon użył satysfakcjonującego wyjaśnienia zachowania decydentów w okolicznościach, w których nie można określić optymalnego rozwiązania.

W swoim artykule Theories of Bounded Rationality (1972), Simon użył „the gra w szachy jako mikrokosmos odzwierciedlający interesujące właściwości sytuacji decyzyjnych w prawdziwym świecie ”. Oto kilka przydatnych cytatów.

Przeciętnie na dowolnej pozycji w partii szachów jest około 30 legalnych okrągłych liczb dla ruchu i odpowiedzi, średnio około 10 ^ 3 kontynuacji. Czterdzieści posunięć byłoby rozsądnym oszacowaniem średniej długości gry. Wtedy byłoby może 10 ^ 120 możliwych partii szachów. Oczywiście dokładna liczba nie ma znaczenia: liczba taka jak 10 ^ 40 byłaby mniej spektakularna, ale wystarczająco duża, aby poprzeć wnioski niniejszego argumentu.

Szachiści nie rozważają wszystkich możliwych strategii i wybierają najlepiej, ale wygeneruj i zbadaj raczej małą liczbę, dokonując wyboru, gdy tylko odkryją taką, którą uważają za satysfakcjonującą.

Granice racjonalności w szachach .

(...) wymieniono trzy ograniczenia doskonałej racjonalności: niepewność co do konsekwencji, jakie wynikną z każdej alternatywy, niepełne informacje o zbiorze alternatyw oraz złożoność uniemożliwiająca wykonanie niezbędnych obliczeń wykonywane. Szachy ilustrują, jak w rzeczywistych sytuacjach rozwiązywania problemów te trzy elementy kategorie mają tendencję do łączenia się.

Satysfakcjonujące i optymalizujące.

Terminy satysfakcjonujące i optymalizujące (...) to określenia dwóch szerokich podejść do racjonalnego zachowania w sytuacje, w których złożoność i niepewność uniemożliwiają globalną racjonalność. W takich sytuacjach optymalizacja staje się optymalizacją przybliżoną - opis rzeczywistej sytuacji jest radykalnie uproszczony, aż do stopnia komplikacji, z którym decydent może sobie poradzić. Satysfakcjonujące podejścia dążą do tego uproszczenia w nieco innym kierunku, zachowując więcej szczegółów rzeczywistej sytuacji, ale decydując się na satysfakcjonującą, a nie przybliżoną najlepszą decyzję. Nie można ogólnie przewidzieć, które podejście doprowadzi do lepszych decyzji, mierzonych ich rzeczywistymi konsekwencjami. Przynajmniej w szachach dobrzy gracze wyraźnie uznali satysfakcję za bardziej użyteczną niż przybliżanie i optymalizowanie

Bardzo ciekawa lektura i zasługuje na kciuk ode mnie (wbrew temu, co powiem w dalszej części), ale tak naprawdę nie odpowiada na pytanie OP, po prostu jest trochę pedantyczny;)
@user3658510 dzięki! Twój komentarz daje mi możliwość dodania, że ​​odpowiada na pytanie w tym sensie, że ludzie nie mogą optymalizować („ludzie są niezdolni do takich obliczeń”), ale są „dobrzy”, ponieważ używają innej heurystyki poznawczej: satysfakcjonujący!
Ładny. Możesz dodać to do odpowiedzi, ponieważ uczyniłoby to ją bardziej kompletną. Ale tutaj jest też dobre miejsce. Każdy, kto jest naprawdę zainteresowany, przeczytałby przynajmniej kilka pierwszych komentarzy.
#2
+29
Mike Jones
2020-04-29 16:23:24 UTC
view on stackexchange narkive permalink

Porozmawiajmy. Liczba zdań, które można by wypowiedzieć, jest nieskończona. Liczba poprawnych gramatycznie jest nadal nieskończona, podobnie jak liczba poprawnych logicznie / konwersacyjnie. Ludzie ignorują to, co mówią w każdej sytuacji, kierując się intuicją / doświadczeniem. Kiedy szachiści uczą się, w co należy zagrać, ich zadanie jest znacznie łatwiejsze niż prowadzenie prostej rozmowy.

#3
+25
RemcoGerlich
2020-04-29 17:37:25 UTC
view on stackexchange narkive permalink

Ludzie próbują zrozumieć taką grę, sformułować zasady, spróbować rozpoznać wzorce tego, co działało w jednej pozycji i zastosować je w pozycjach, które uważają za podobne.

I okazuje się, że jest to możliwe w przeciwnym razie nie byłoby ludzi o różnej sile gry, wszyscy by zgadywali.

Następnie wykorzystaliśmy tę wiedzę do stworzenia silników takich jak Stockfish; w końcu nie mogą obliczyć całej drogi do mata na większości pozycji i mają funkcję oceny na podstawie tego, co uważamy za dobre. To ta sama zasada.

Dopiero od kiedy zupełnie nowe silniki, takie jak AlphaZero, które zaczynają od zerowej wiedzy na temat gry i same muszą sobie radzić, zmieniły się. Ciekawe, że najlepsi z nich są teraz mniej więcej na równi ze sztokfiszem.

Ale ważne jest, aby odwrócić to zjawisko - gdyby tak nie było nie gdybyśmy mogli nauczyć się zasad gry w szachy, które działają, wtedy gra byłaby bardzo nieciekawa i nigdy nie stałaby się popularna .

Np. wyobraź sobie grę, w której musisz odgadnąć liczbę całkowitą od 1 do 10 ^ 80. Nie dostaniesz żadnych wskazówek, jeśli jedno źle zrobisz, przegrywasz po milionie nieudanych prób. Niczego nie można się nauczyć i nikt by w to nie grał.

Jeśli gry można się nauczyć perfekcyjnie (jak kółko i krzyżyk lub Nim), to prawdopodobnie też nie stanie się zbyt popularny.

Szachy są najwyraźniej w jakimś słodkim miejscu.

Według: https://www.chess.com/news/view/updated-alphazero-crushes-stockfish-in-new-1-000-game-match wydaje się, że AlphaZero wyprzedziło Stockfisha około rok temu?
@Falco: stara wersja Stockfisha. Ale LeelaZero pobił obecną. Tak czy inaczej, stąd „mniej więcej” - są blisko.
#4
+6
Lawnmower Man
2020-04-30 13:16:46 UTC
view on stackexchange narkive permalink

Ciekawe szachy

Biorąc pod uwagę konfigurację szachownicy, wielu doświadczonych szachistów jest w stanie odtworzyć ruchy, które tworzą tę konfigurację. Jednak z 10 ^ 40 + pozycji na zarządach arcymistrzowie mieliby trudności z odtworzeniem zdecydowanej większości stanów zarządu. Dlaczego? Cóż, to dlatego, że większość z nich wiąże się oczywiście ze złymi ruchami, takimi jak samodzielne rozwijanie króla na środek planszy lub poświęcanie wszystkich pionków chcąc nie chcąc. Gry, które produkują te stany planszy, są nie interesujące . O wiele trudniejsze pytanie brzmi: „Ile stanów tablicy jest prawdopodobnych ?” A co, jeśli ta liczba wynosi zaledwie 10 ^ 10 lub więcej?

Nauka

Informatyka ma jedną potężną sztuczkę optymalizacyjną. Podczas wykonywania kosztownych obliczeń, które zawsze dają ten sam wynik dla określonego wejścia, programista może poinstruować program, aby po prostu zapamiętał odpowiedź . Ta technika nazywa się „zapamiętywaniem”. Następnie, gdy następnym razem zażąda się obliczenia, program „oszukuje” zwracając zapamiętaną wartość zamiast marnować mnóstwo wysiłku na obliczenie czegoś dokładnie w taki sam sposób, jak robił to wcześniej.

Ludzie mają również jedną potężną optymalizację sztuczka, zwana Hebbian Learning Rule, często podsumowywana jako: „Neurony, które razem odpalają, łączą się razem”. Zbyt łatwo jest powiedzieć, że to wyjaśnia całą ludzką naukę, ponieważ tak nie jest. Ale w pewnym sensie jest to najprostszy obliczeniowo i najbardziej abstrakcyjny sposób na uchwycenie tego, co robi technika zapamiętywania: jeśli wzór odpalania neuronowego konsekwentnie daje ten sam wynik, pójdźmy na skróty i nie wykonujmy całej pracy, którą wykonaliśmy za pierwszym razem .

Sztokfisz

Teraz porównajmy te sztuczki z tym, co robi Stockfish: brutalne przeszukiwanie drzewa gry. Oczywiście Stockfish jest mądrzejszy. Może korzystać z książki otwierającej i bazy danych gier końcowych, a także może przycinać gałęzie drzewa gry, które są banalnie głupie. Ale jest jedna rzecz, której Sztokfisz nie może zrobić: nie może powiedzieć: „Chwileczkę! Byłem tu wcześniej. Co robiłem, kiedy tu ostatnio byłem?” Sztokfisz nie ma pamięci (między grami). Oczywiście jest to przydatne do oceny pozycji, ponieważ odpowiedź Stockfisha nie zależy od gier, które już rozegrał. Poda tę samą odpowiedź za każdym razem, gdy oceniasz pozycję, nawet jeśli gra, w której odkryje, że jej ocena była niedokładna .

AlphaZero

Więc teraz zaczynamy rozumieć, dlaczego AlphaZero może ocenić 1000x mniej pozycji i nadal czyścić podłogę za pomocą Stockfisha: AlphaZero robi najprostszą rzecz, jaką może zrobić inteligentny system - pamięta przeszłość. Nie możesz zapytać, czym jest ocena pozycji AlphaZero, ponieważ jest to pytanie bez znaczenia. Każda instancja AlphaZero jest wyjątkowa, ukształtowana przez historię rozgrywanych gier. Zamiast mówić: „Zamierzam udawać, że nigdy wcześniej nie widziałem tego stanu planszy, i na ślepo przeszukam drzewo gry”, mówi: „Cóż, widziałem ten stan planszy 237 razy i już to wiem 3 ruchy są znacznie lepsze niż wszystkie inne, które oceniłem ”(właściwie nie wie, ile razy widziano stan szachownicy, z wyjątkiem domyślnych).

Nawiasem mówiąc, ta jedna prosta sztuczka jest również powodem, dla którego jest w stanie ocenić dziesiątki tysięcy ruchów mniej niż komputery i nadal grać w przyzwoitą grę. Arcymistrz nie jest człowiekiem, który potrafi ocenić 60 000 pozycji na sekundę. Arcymistrz to człowiek, który pamięta 60 000 pozycji na planszy oraz silne linie ataku i obrony od najważniejszych.

AlphaZero gra w szachy więcej ludzi niż jakikolwiek inny program wcześniej, ponieważ tak naprawdę uczy się szachów. W pewnym sensie prawdopodobnie rozumie szachy lepiej niż jakikolwiek byt we wszechświecie. Jego główną wadą jest brak zdolności komunikacyjnych. Gdyby miał język i potrafił opisać swoje rozumowanie, prawdopodobnie bylibyśmy zachwyceni jego analizami. A jednak prawdopodobnie bylibyśmy zaskoczeni, jak te analizy przypominają ludzkie, zauważając, że wciąż istnieje element wrażliwości obcych, wynikający z umiejętności oceny dziesiątek tysięcy ruchów na sekundę.

Fakt, że AlphaZero działa na tranzystorach, które mogą przełączać miliardy razy na sekundę, w porównaniu z marnymi 3-5 razy na sekundę dla typowego ludzkiego interneuronu, sugeruje, że w pewnym sensie AlphaZero jest bardzo podobny do hiper-przyspieszonego człowieka. Wróćmy jednak do pierwotnego pytania: ludzcy arcymistrzowie mogą przyjrzeć się ogromnej przestrzeni przyszłych ruchów. Robią to, pamiętając , które z tych ruchów są lepsze od innych, zamiast obliczać je na nowo za każdym razem. Oczywiście zabawa jest połączeniem pamięci i wyszukiwania drzew, więc ludzie, tacy jak AlphaZero, za każdym razem odkrywają nowe linie gry. Ale muszą być bardziej oszczędni w swoich poszukiwaniach, a to widać.

#5
+5
Inertial Ignorance
2020-04-30 07:54:48 UTC
view on stackexchange narkive permalink

„Intuicja” to po prostu dopasowywanie wzorców. Wykorzystujemy nasze doświadczenie z przeszłych sytuacji / pozycji szachowych, które są nam znane, w celu uzyskania „wyczucia” aktualnej pozycji. Mając tę ​​intuicję, możemy nadrobić obliczenie stosunkowo niewielkiej kwoty poprzez:

1) Umiejętność oceny wynikowych pozycji w naszych obliczeniach.

2) Wiedząc, które linie przyciąć w naszym drzewie obliczeń umysłowych.

To powiedziawszy, nawet najlepsi ludzie znajdują się daleko poniżej obecnego sztokfisza. I chociaż sztokfisz jest prawdopodobnie najlepszy / drugi najlepszy na świecie (z Leelą), nie wiadomo, czy jest naprawdę dobry. Gdyby grał przeciwko jakiemuś agentowi, który zawsze wykonywał dosłownie perfekcyjne ruchy, jest duża szansa, że ​​nie zrobiłby tego dobrze.

Jest tu również pewien rodzaj antropicznej zasady. Ludzie nie wymyśliliby gry, w której każdy, kto w nią grał, miałby na pewno okropny wynik. Wyobraź sobie liczbę gier teoretycznych, których złożoność przewyższa szachy (i każdą inną grę, w którą gramy) o x rzędów wielkości.

Wreszcie, wracając do intuicji / dopasowywania wzorców, w pewnym sensie można to określić ilościowo. Teoretycznie możesz zmierzyć, jak dobra jest czyjaś pamięć, jak dobrze / szybko mogą wykryć, gdy jedno zdarzenie jest podobne do innego itp.

Jednak złożone gry ewoluują w czasie (na przestrzeni wieków lub tysiącleci). Standardowa tablica Go to 19x19, ale początkujący nadal uczą się na tablicy 13x13, a historycznie używano zarówno 15x15, jak i 17x17. Obecnie format 21x21 byłby prawdopodobnie zbyt zaawansowany, aby ludzie mogli sobie z tym poradzić.
Chciałem tylko to napisać.
#6
+5
IceGlasses
2020-04-30 20:18:30 UTC
view on stackexchange narkive permalink

Na pewnym poziomie odpowiedź jest taka, że ​​nie wiemy, jak działa ludzki mózg. Ale coś nieco bardziej pomocnego:

Algorytm używany przez Stockfisha (i inne silniki szachowe przed powstaniem głębokich sieci neuronowych) nazywa się Minimax. Podstawowy pomysł wygląda mniej więcej tak:

  1. Wygeneruj drzewo wszystkich możliwych ruchów tak daleko, jak pozwalają na to zasoby.
  2. Każdej końcowej pozycji w drzewie przypisz wynik o tym, jak dobra jest dla Ciebie ta pozycja
  3. Pracuj wstecz w kierunku obecnej pozycji, decydując na przemian na różnych poziomach
    1. Czy powinienem wykonać ten ruch (prowadzi to do pozycji końcowej, która jest dobra dla ja)
    2. Czy mój przeciwnik wykona ten ruch (prowadzi to do niekorzystnej dla mnie pozycji końcowej)

A potem istnieją sposoby na optymalizację tych ocen, dzięki czemu nie musisz przetwarzać całego drzewa.

To, w czym komputer jest bardzo dobry, to krok 1: wymyślenie drzewa wszystkie możliwe ruchy. Komputer niezbyt dobry to krok 2: ustalenie, jak dobra jest dla ciebie pozycja. Silniki szachowe czerpią korzyści z patrzenia daleko w przyszłość nie tylko dlatego, że jest to bliższe mata, ale także dlatego, że łatwiej jest zdobyć pozycję końcową z mniejszą ilością materiału.

Okazuje się, że ludzie są lepsi w kroku 2. możemy w jakiś sposób spojrzeć na pozycję w środkowej fazie gry i zdecydować, że „ten atak wygląda na silny” lub „moja strona królewska wygląda słabo”, nawet jeśli nie wypracowaliśmy rzeczywistej linii gry, która wykorzystywałaby wspomnianą siłę lub słabość. To jest moment, w którym ludzie przedstawiają rozpoznawanie wzorców i doświadczają jako nieco niejasnych wyjaśnień tego, co robią ludzkie mózgi.

Więc to, co robi człowiek, jest bardziej „odgórne” niż „oddolne” komputera. Zamiast myśleć o milionach możliwych wyników, a następnie zacząć odrzucać gorsze, aby przyciąć drzewo, wyrzucamy gałęzie podczas budowania drzewa, gdy uznamy, że pozycja nie wygląda obiecująco.

Jeśli chodzi o ssanie komputerów w kroku 2, to dlatego, że stwierdziliśmy, że to właśnie działa najlepiej w silnikach szachowych. Maszyny szachowe, które próbują naśladować bardziej abstrakcyjne rozumowanie, można do pewnego stopnia stworzyć, ale zwykle są kiepskie. Nie idąc tak ekstremalnie, jak rozumowanie podobne do ludzkiego, nadal możemy wymyślić silniejsze funkcje oceny niż te, których obecnie używamy. Wadą tych rozwiązań jest to, że są wolniejsze i im wolniejsze, tym mniejszą głębokość może przeszukiwać wyszukiwarka; a im mniejszą głębokość może przeszukiwać wyszukiwarka, tym gorzej zwykle robi w porównaniu z wyszukiwarkami, które szukają głębiej.
#7
+4
postoronnim
2020-04-29 22:02:52 UTC
view on stackexchange narkive permalink

Dobre pytanie, sam byłem tego ciekawy. Ludzie mają dodatkową płaszczyznę rozumowania. Pierwsza ocena dotyczy tematów strategicznych mających zastosowanie do stanowiska, a następna to taktyczna z wybranych powyżej ścieżek. Ci, którzy potrafią pomyślnie wykonać pierwszy krok, mogą drastycznie zawęzić przestrzeń poszukiwań dla drugiego kroku, gdzie mogą powtórzyć podejście (strategię / taktykę), aby jeszcze bardziej zawęzić. Dla osób z najwyższymi umiejętnościami w obu przypadkach ścieżka do znalezienia najlepszego ruchu będzie składać się z kilku ocen, ponieważ przestrzeń wyszukiwania może być zmniejszana o rząd wielkości w każdej iteracji.

#8
+4
Stig Hemmer
2020-04-30 13:22:56 UTC
view on stackexchange narkive permalink

Robienie planów

(Wspomniano o dopasowywaniu wzorców. Ludzie są w tym dobrzy)

Ponadto robimy plany .

Na przykład patrząc na pozycję widzimy, że król i hetman przeciwnika są w dobrej pozycji na widelec naszego skoczka. Jednak odpowiednie pole jest obecnie strzeżone przez bierkę przeciwnika.

Dlatego szukamy sposobów na usunięcie tego pionka przeciwnika. A może możemy to przyszpilić.

Oczywiście, jeśli tylko przesuniemy bierkę, aby ją przyszpilić, nadejdzie kolejka przeciwników i mogą zrobić coś niszczycielskiego, jak np. Odsunięcie króla od niebezpieczeństwa.

Tak więc potrzebujemy ruchu, który jest jednocześnie zagrożeniem, na które przeciwnik musi odpowiedzieć, i ustawia widelec, który chcemy.

I tak dalej i tak dalej.

Chodzi o to, że podczas tworzenia takiego planu patrzymy tylko na niewielką liczbę ruchów i pozycji.

Nie ma znaczenia, że ​​ mamy inne ruchy, możemy je zignorować. Część planu polega na zmniejszeniu liczby możliwych ruchów przeciwnika.

Następna trudna część to sprawdzenie, czy plan jest wystarczający. Idealnie byłoby, gdyby ruchy przeciwnika były wymuszone, ale zwykle ma on kilka alternatyw na każdym kroku. Czy naprawdę jesteśmy pewni, że wszystkie kombinacje tych alternatyw są nieszkodliwe?

Oczywiście patrząc na pozycję i dostrzegając możliwe słabe punkty, które możemy zaplanować zaatakować, jest po prostu ponownym dopasowywaniem wzorców. Dlatego nie możemy zmusić graczy komputerowych do robienia planów, traciliby czas na przeprowadzanie całkowicie beznadziejnych ataków. Odrzuciliby te plany, które nie działają, ale zanim odrzuciliby plan numer kilka miliardów, straciliby na czas.

#9
+3
lvella
2020-04-30 17:26:21 UTC
view on stackexchange narkive permalink

Jestem bardzo złym szachistą amatorem, ale zauważam, że ludzie są w stanie udowodnić (w sensie matematycznym) wiele rzeczy na temat pozycji, a arcymistrz ma znacznie bardziej rozwiniętą intuicję (również w sensie matematycznym) i znacznie większy repertuar thoeremów, które pomagają udowodnić (lub wydobyć) informacje z pozycji niż przeciętny gracz. Dzięki udowodnieniu wielu rzeczy arcymistrz jest w stanie przyciąć wiele gałęzi drzewa wyszukiwania.

Trywialny przykład twierdzenia: po tym, jak złapałem biskupa początkującego przeciwnika, powiedział: , Myślałem, że jest chroniony przez drugiego biskupa ”, natychmiast ja i widz powiedziałem:„ to niemożliwe, biskup nigdy nie może ochronić drugiego biskupa ”. To jest bardzo podstawowe twierdzenie, którego szachista uczy się bardzo szybko.

W miarę postępów gracz uczy się znacznie bardziej zawiłych twierdzeń i uczy się intuicyjnie dostrzegać wzorce, aby korzystać z twierdzeń wyciągających informacje. Jedno twierdzenie wyraźnie sformułowane przez lepszego szachistę niż ja: skoczek nigdy nie może rozwidlać dwóch pionów, jeśli są na różnych kolorowych polach.

Nadal jestem zdezorientowany w grze końcowej, czy mój król będzie w stanie złapać pionka przed awansem lub jeśli mogę wypromować swojego pionka przed przeciwnikiem, ale wyobrażam sobie, że takie rzeczy są od razu oczywiste dla graczy na wyższym poziomie, z powodu bardziej rozwiniętej intuicji i większego repertuaru twierdzeń.

Myślę, że to to rodzaj informacji, których głębokie sieci neuronowe, takie jak AlphaZero, są w stanie nauczyć się po rozegraniu zbyt wielu gier. Nie zgadzam się z tym, że Lawnmowner Man po prostu „pamięta” pozycje i że wszystkie instancje AlphaZero są zasadniczo różne. Różnią się one ze względu na stochastyczną naturę uczenia sieci neuronowej, ale po zbyt wielu grach są w stanie wydobyć abstrakcje wyższego poziomu niż zwykłe zapamiętywanie pozycji i uzyskać mniej więcej ten sam zestaw najbardziej przydatnych twierdzeń i intuicji. Repertuar wspólny dla arcymistrzów.

#10
+3
NotThatGuy
2020-05-01 22:05:53 UTC
view on stackexchange narkive permalink

Dostrzeganie bardziej złożonych lub różnych typów wzorców

Komputerom nie jest łatwo zidentyfikować te same wzorce, które ludzie mogą łatwo zauważyć.

Jest to szczególnie zauważalne w czymś jak widzenie komputerowe. Komputery poczyniły spory postęp w rozpoznawaniu obiektów, ale nadal są prawdopodobnie gorsze niż małe dziecko w rozpoznawaniu nawet jednego lub dwóch różnych typów obiektów.

Chociaż każdy stan szachownicy może nie być ma tyle parametrów, co duży obraz i można to rozwiązać w bardziej systematyczny sposób, ma zastosowanie podobny argument.

Komputery i ludzkie mózgi po prostu nie działają w ten sam sposób.

Ludziom udaje się dostrzec skomplikowane wzorce dotyczące tego, które elementy lub części planszy są zagrożeniami lub słabościami. Komputery muszą rzucić mnóstwo mocy obliczeniowej, aby dostrzec te same wzorce, a nawet wtedy mogą nadal nie być w stanie zobaczyć dokładnie tych samych wzorców. Mogą pójść inną drogą i po prostu wypróbować kilka różnych ruchów i zagrać każdy z nich, aby wybrać najlepszy lub zrobić coś innego.

Ludzie czasami rozważają również różne ruchy i mentalnie je odgrywają, ale w każdym momencie działają różne mechanizmy określające, czy stan tablicy jest dobry, czy zły, lub czy warto rozważyć ruch.

Intuicja i podświadomość

zdjęcie kota i identyfikujesz go jako kota. Jeśli następnie poproszę cię o dokładne wyjaśnienie, dlaczego uważasz, że to kot, możesz nie mieć na to łatwego czasu (zwłaszcza jeśli nie możesz przy tym patrzeć na kota). Możesz zacząć identyfikować takie rzeczy, jak wąsy lub kocie uszy, ale jeśli kopnę trochę głębiej, możesz nie być w stanie dokładnie wyjaśnić, co oznaczają „kocie uszy”. Mogę również pokazać ci zdjęcie tego, co wyraźnie jest kotem (nawet tej samej rasy) bez tych cech, lub zdjęcie czegoś, co wyraźnie nie jest kotem z tymi cechami.

Twoja podświadomość prawdopodobnie wykonuje większość pracy przy rozpoznawaniu cech kota i po prostu mówi Ci „to jest kot”, nie dając świadomemu umysłowi więcej informacji.

Aby to przywrócić jeśli chodzi o szachy, możesz spojrzeć na ruch, a twoja podświadomość może dostrzec pewne wzorce w oparciu o reguły lub doświadczenie oglądania lub grania w poprzednie partie. Możesz użyć tego do zidentyfikowania posunięcia jako dobrego lub złego, niekoniecznie będąc w stanie go uzasadnić.

Zagłębianie się w ten krok prawdopodobnie przesunie dyskusję nieco za daleko w stronę psychologii, neuronauki i / lub informatyki .

To świetna odpowiedź, dziękuję.
#11
+2
AleksandrH
2020-04-30 21:45:18 UTC
view on stackexchange narkive permalink

Odpowiedź @ Kortchnoi jest bardzo wnikliwa i warta przeczytania.

Warto również zauważyć, że gra między dwoma doskonałymi silnikami sztucznej inteligencji szachów musi zawsze kończyć się w teorii pat z powodu odwzorowania algorytmu min-maxing po obu stronach.

Z drugiej strony, dwóch ludzi szachistów nie używa tego samego „algorytmu”, a zatem można argumentować, że jeden gracz jest po prostu lepiej niż inne. Co więcej, ludzie popełniają błędy; silnik szachowy ocenia możliwe stany gry i wybiera „najlepszy”, więc nie jest podatny na błędy ludzkie w tym sensie.

Jednym z przykładów z teorii gier, który przychodzi na myśl, jest dylemat pirata, gdzie najbardziej rozsądnym wyborem nie zawsze jest ten, który dana osoba ostatecznie podejmuje. Ludzie nie zawsze myślą jak sztuczna inteligencja - opierają wiele swoich decyzji na obawach, podejrzeniach i przeczuciach, a szachy nie są wyjątkiem.

#12
+2
Pi_die_die
2020-05-01 18:24:55 UTC
view on stackexchange narkive permalink

Jeśli chodzi o szachy, wiele osób przede mną udzieliło genialnych odpowiedzi. Ale dodatkowo chciałbym zaznaczyć, że wielu szachistów stosuje, oprócz twierdzeń, których nauczyli się w praktyce, inną strategię opartą na przeciwnikach.

Gry są symulowane w praktyce i sporządzane są zgrubne plany.

Jedną z takich strategii, których zwykle używam, są pionki ochronne, dopóki inny gracz nie popełni błędu, a następnie rzucą się na nie.

Często gracze próbują walczyć bez królowych, aby zmniejszyć napięcie psychiczne, jeśli mają szansę zrób to.

W grze motywacje są ważne, jeśli zauważę, że gracz próbuje osiągnąć określony cel, aby uzyskać mata, myślę tylko o tym drzewie decyzyjnym, aby go chronić lub uwięzić. mentalny obraz tego, co druga osoba próbuje osiągnąć.

Zazwyczaj decyduje o tym, czy druga osoba ma właściwy obraz, czy nie, oraz czy mamy wystarczającą wiedzę i praktykę, aby udaremnić jej plan.

#13
+1
user3658510
2020-05-01 09:47:59 UTC
view on stackexchange narkive permalink

Mówiąc o sile ludzkich szachistów, zwykle zapomina się wspomnieć, że to, co mają, to nie tylko ich własna praca. Większość z nich pochodzi od wielu pokoleń innych ludzi, którzy grali i studiowali szachy przez wiele lat i dodali do `` podstawowej '' współczesnej wiedzy o szachach. zupełnie inaczej, jeśli nie stanie się na ramionach gigantów :)

Sztokfisz jest jak Boski Geniusz, który ma mentalność noworodka, pamięć o mrówce i wiedzę szachisty, która właśnie nauczył się zasad (z wyłączeniem „sztucznych” dodatkowych książek otwierających i biblioteki gry końcowej). Alpha zero to to samo, z wyjątkiem tego, że ma doskonałą pamięć i, jeśli ma wystarczająco dużo czasu, może stać na własnych barkach.

Twoje pytanie jest podobne do pytania innego: dlaczego technologia ludzka jest tak „niska” przez tyle tysięcy lat, a teraz przyspiesza jak eksplozja?

Nauka rządzi się tak duża moc, kiedy jesteśmy tak słabi, jest jak wiedza szachowa.

#14
+1
user2845840
2020-05-28 00:47:32 UTC
view on stackexchange narkive permalink

Niewiele mogę dodać do innych odpowiedzi, ale chcę wyjaśnić, że zarówno liczba pozycji prawnych, jak i głębokość wyszukiwania są danymi mylącymi lub nawet nieistotnymi. O legalnych pozycjach: W końcówce króla & wieża kontra król jest ponad 200000 legalnych pozycji (nie biorąc pod uwagę symetrii), ale parowanie z wieżą jest na tyle łatwe, że prawdopodobnie musisz zobaczyć, jak jest wykonywana tylko raz i możesz zapamiętać algorytm. W przypadku reguł typu „para gońców jest warta więcej niż 2 biskupów”, nie trzeba porównywać ogromnej liczby pozycji z parą gońców z tymi bez niej. W rzeczywistości nie musisz nawet patrzeć na 1 pozycję, ponieważ prawdopodobnie nauczyłeś się tego od bardziej doświadczonego gracza bez odniesienia do żadnej konkretnej pozycji. Można go również wyprowadzić logicznie z właściwości biskupa. Patrząc poza szachy, wiadomo, że liczba legalnych pozycji Go wynosi około 2 * 10 ^ 171, a liczba legalnych pozycji Go na mniejszej planszy 9x9 wynosi około 1 * 10 ^ 38. Czy to oznacza, że ​​Go jest bardziej złożone niż Chess i że 9x9 Go jest mniej złożone? Bez dodatkowych informacji nie można tego osądzić. Byłoby nawet łatwe zaprojektowanie gry, która ma więcej legalnych pozycji niż Go, ale jest banalna. Wszystkie te przykłady powinny jasno pokazać, że liczba legalnych pozycji nie mówi nic o grze, nawet jeśli ograniczysz pozycje do pewnego podzbioru, np. „Pozycji z parą gońców”.

Informacje o głębokości wyszukiwania: Stockfish przeszukuje 60 milionów pozycji na sekundę na sprzęcie używanym przez Deepmind, aby porównać go z AlphaZero, podczas gdy AlphaZero przeszukiwał tylko około 60 tysięcy pozycji na sekundę. Obie mają podobną siłę. I mógłbyś łatwo napisać silnik szachowy, który wykorzystuje wysoce zoptymalizowane generowanie ruchów Stockfisha, ale zastępuje jego algorytmy przycinania i oceniania jakimś bzdurami, które powodują, że ten nowy silnik gra jak przeciętny gracz z tymi samymi zasobami, na których grałby sam Stockfish poziom mistrza świata. I nawet bez liczenia się w ogóle do przodu, gracz prowadzący człowieka czasami wybierze ruch, który jest zgodny z najsilniejszymi silnikami (np. Gdy królowa przeciwnika zabiera hetmana, intuicja podpowiada ci, abyś odbił hetmana przeciwnika). Innymi słowy: jakość twoich wyborów ruchów ma takie samo lub większe znaczenie niż głębokość wyszukiwania.



To pytanie i odpowiedź zostało automatycznie przetłumaczone z języka angielskiego.Oryginalna treść jest dostępna na stackexchange, za co dziękujemy za licencję cc by-sa 4.0, w ramach której jest rozpowszechniana.
Loading...