Pytanie:
Dlaczego silniki nie podniosły Elo najwyżej ocenianych szachistów?
user18196
2019-12-26 16:52:24 UTC
view on stackexchange narkive permalink

Pojawienie się silnych silników szachowych, takich jak Stockfish, Houdini czy Rybka, pozwoliło najlepszym graczom na dokładne przygotowanie linii w debiutach lub na studiowanie lepszych końcówek.

Spodziewałbym się wzrostu rankingu najlepszych graczy. Jednak najwyższy wynik Kasparowa z 1999 roku jest nadal drugim najlepszym wynikiem wszechczasów, a Karpov i Fischer nadal znajdują się w pierwszej dwudziestce historycznych graczy.

Enter image description here

Źródło: Wikipedia

Jeśli te silniki mają 3600 Elo, czy najlepsi gracze nie powinni czerpać z tego korzyści, opuszczając 2851 Kasparowa strzelić gola w 1999 roku daleko?

I czy nie powinno więcej niż 18 graczy przekroczyć 2785 Fischera w 1972 roku?

Pięć odpowiedzi:
#1
+25
PhishMaster
2019-12-26 19:19:12 UTC
view on stackexchange narkive permalink

Myślę, że z pewnością zwiększyli swoje ELO, ale co ważniejsze, swoją ogólną siłę szachową. ELO to tylko ocena w stosunku do innych w puli, więc może rosnąć wolniej, jeśli wszyscy w puli polepszą się, co mają łącznie.

Najpierw musisz wziąć średnią najlepszych graczy, zamiast patrzeć na dwóch niesamowicie wyjątkowych graczy, Kasparowa i Carlsena, i ich najwyższe oceny. Fischer był jak na swój czas całkowitą anomalią i znowu nie można wiele oprzeć na jednej osobie. Ludzie prawdopodobnie mają mentalne ograniczenia w taki sam sposób, w jaki biegacze ostatecznie trafią na barierę prędkości, której nie mogą złamać. To Bell Curve w akcji: Łatwo robić postępy w środku, ale trudniej na końcu.

ChessBase i pierwszy mocny silnik, KnightStalker (aka Fritz 1.0, przemianowany na wersję 2.0) wyszedł w 1990 roku, a Internet dopiero raczkował. W styczniu 1990 r. Było tylko dwóch graczy powyżej 2700, Karpow 2730 i Kasparow 2800. Dzisiaj jest 37 graczy powyżej 2700, a trzech z nich powyżej 2800.

Byłem gram przez długi czas, a każdy, kto zna moją rączkę, widział, jak oglądam sztafety z najlepszych turniejów na ICC od ponad 20 lat i mogę powiedzieć, że to nie tylko inflacja wynikająca z faktycznego obserwowania poprawy poziomu gry przez lata. Gracze na poziomie mistrzowskim, w tym nawet zwykli mistrzowie, są teraz DUŻO lepsi dzięki narzędziom dostępnym dzisiaj niż narzędzia dostępne, gdy po raz pierwszy zostałem mistrzem.

Kiedy zaczynałem grać, mieliśmy tylko książki i lokalny klub. Dziś mogę logować się praktycznie każdego dnia i grać w GM. Jako nastolatek byłem także tenisistą rankingowym i mogę ci powiedzieć z tego doświadczenia, że ​​gra w lepszej rywalizacji czyni cię lepszym, więc możliwość logowania się i gry z silniejszymi graczami niż kiedykolwiek podniosła ogólny poziom gry. Ponadto mamy teraz ChessBase i bazę danych około 8,3 mln gier, które można skutecznie sortować i badać. Jak wspomniano w pytaniu, mamy również silniki, które z pewnością wzbogaciły naszą wiedzę szachową i zasadniczo zmieniły sposób, w jaki przygotowują się najlepsi gracze. Na koniec wspomniałem o książkach i jako zapalony kolekcjoner (miałem 1800 u szczytu), mogę powiedzieć, że nawet jakość materiałów zawartych w książkach jest na innym poziomie od kiedy zacząłem.

Ja nie mogę powiedzieć, jaki procent wszystkich tych postępów wpłynął na wzrost X-liczby punktów rankingowych, ale mogę powiedzieć, że bez wątpienia wszystkie one doprowadziły do ​​graczy na najwyższych poziomach, a nawet na niższych, ogólnie rzecz biorąc .

Oczywiście poprawiło to grę dla wielu ludzi. Prawdziwe pytanie brzmi: dlaczego czołowi GM nie są jeszcze wyżej, skoro mają te lepsze silniki i bazy danych, które im pomagają.
Odpowiedziałem, że w pierwszym akapicie: „ELO to tylko ocena w stosunku do innych w puli, więc może rosnąć wolniej, jeśli wszyscy w puli polepszą się, co mają łącznie”. Widziałbyś tylko ogromne różnice, gdyby tylko jeden lub kilku graczy miał dostęp do tych narzędzi.
Częściowo. Większa pula powinna ostatecznie sprawić, że high end będzie jeszcze wyższy, ponieważ zdobywają punkty od nowych niższych graczy.
Krzywa dzwonu faktycznie implikuje coś przeciwnego. Niewielka zmiana średnich nie zmienia znacznie populacji środkowego dzwonka, ale może podwoić odpowiednią populację ogona ...
Albo nie mówimy o tym samym, albo nie opisałem tego wystarczająco dobrze, albo nie rozumiesz, o co mi chodzi; ale nie mówię o małych zmianach. Chodziło mi o to, że łatwiej jest robić postępy na środku krzywej niż w szczególności na górnym końcu. Łatwiej jest przejść z 50-60 niż z 99-100. Mam nadzieję, że to wyjaśnia, o co mi chodzi.
Wiem, co * miałeś na myśli * (zmniejszanie zwrotów / asymptotyczne zbliżanie się do bezwzględnego limitu), ale * nie * tak działa rozkład krzywej Bella. Przy odrobinie szczęścia możesz dowolnie oddalić się od średniej: oznacza to, że nie ma sztywnego limitu. (To odrębne, co wskazywał @StianYttervik). Krzywa Bella prawdopodobnie modeluje rzeczy tylko z dokładnością do kilku odchyleń standardowych od średniej i prawdopodobnie nie jest przydatna do przewidywania, o ile trudniej będzie zbliżyć się do ludzkich wyników limity. Jest to funkcja dystrybucji, a nie wykres wysiłek vs. wynik.
#2
+15
Kostya_I
2019-12-27 02:50:28 UTC
view on stackexchange narkive permalink

Pytanie najwyraźniej opiera się na niezrozumieniu sposobu działania ocen ELO. Nie ma absolutnie żadnego mechanizmu , dzięki któremu ogólny wzrost siły graczy prowadziłby do zwiększenia ich ELO. Rzeczywista wartość ratingu ELO nie ma znaczenia; ani też porównanie ELO w odległych czasach. Jedyną rzeczą, która ma bezpośrednie znaczenie, jest różnica w jednoczesnej ocenie między graczami.

Gdyby jutro FIDE zdecydowało się dodać stałą, powiedzmy, 500 punktów do oceny każdego gracza, w zasadzie nic by się nie zmieniło - wyniki gier doprowadziłyby do takich samych wzrostów ocen, więc dynamika ocen byłaby to samo, tylko na poziomie +500 punktów. A komputery nie dostarczą żadnego punktu bazowego - ich ELO jest odniesione do ludzkich graczy, więc będą grać na 3600 zamiast 3100.

To samo dotyczy sytuacji, gdy taka stała była w jakiś sposób dodawana lub odejmowana stopniowo z powodu naturalnych procesów - e. g., poszerzenie bazy ocenianych graczy, dezaktywacja graczy z wyższym ratingiem niż na początku, itp. I najwyraźniej stało się tak, ponieważ do niedawna byliśmy świadkami inflacji ratingów.

Podobnie, jeśli wszyscy gracze nagle lub stopniowo zaczną grać silniej, bez zmiany ich względnej siły , nie ma powodu, aby spodziewać się zmiany dynamiki rankingu.

Jednym ze sposobów zaobserwowania tego są „kieszenie ratingowe”; jeśli nastąpi boom w odizolowanej społeczności graczy, a wielu graczy zacznie szybko się poprawiać, ich oceny spadną, ponieważ w ocenianych turniejach będą głównie naprzeciw siebie. Ich izolacja oznacza, że ​​nawet jeśli niektórzy gracze biorą udział w turniejach „poza” kieszenią, do całkowitej puli kieszeni rankingowej dodaje się zbyt mało punktów ELO, aby zrekompensować ogólny wzrost poziomu umiejętności.
Myślę, że OP zakłada, że ​​najlepsi gracze używają programów komputerowych bardziej lub bardziej efektywnie, więc powinni poprawić się bardziej niż główna dziedzina, aby ich ranking Elo wzrósł. Może to również wpłynąć na ich ocenę w stosunku do poprzednich graczy. Myślę, że Brian odnosi się do tego argumentu (obalając go).
#3
+9
Brian Towers
2019-12-26 17:03:51 UTC
view on stackexchange narkive permalink

Jeśli te silniki mają 3600 Elo, czy najlepsi gracze nie powinni na tym skorzystać, pozostawiając 2851 wynik Kasparowa w 1999 daleko?

Nie. Głównym efektem silników, a także internetu, była demokratyzacja szachów. Najlepsi gracze zawsze mieli dostęp do oceny i wiedzy na najwyższym poziomie. Dla graczy na niższych poziomach ten rodzaj wiedzy, analizy, oceny pozycji, wiedzy końcowej był bardzo trudny do zdobycia.

Jest to ważne, ponieważ gracze na wyższych poziomach zdobywają punkty rankingowe, pokonując graczy na niższych poziomach. Jeśli tym niższym graczom trudniej jest pokonać z powodu zwiększonego dostępu do analiz i wiedzy, które zapewniają silniki i internet, to w rzeczywistości trudniej jest osiągnąć wyższy poziom mierzony rankingiem.

Więc Kasparowowi było trochę łatwiej. Ale on też nie miał tych narzędzi, co jest dla niego ważne. Wydaje mi się, że gdyby Carlsen cofnął się w czasie ze swoją wiedzą, wynik byłby> 2900. Więc silniki podniosły poziom szachów.
Zresztą nie rozumiem, jak mierzy się Stockfish 3100 ELO. Te silniki nie grają przeciwko ludziom. Jeśli odpowiedź na komentarze jest krótka, idealna. Jeśli nie, wkrótce opublikuję to pytanie.
@Universal_learner Myślę, że to nowe pytanie. Byłoby również interesujące, jaka jest korelacja / związek (jeśli istnieje) między silnikiem ELO a człowiekiem.
@Universal_learner cóż, * robią * czasami grają przeciwko ludziom i nie potrzebujesz tak wielu gier przeciwko ocenianym ludziom, aby statystycznie ocenić, gdzie się znajdują w obecnej skali ELO.
@Peteris: A 2800 nigdy nie przyciąga Sztokfisza, więc limit, jeśli spróbujesz porównać go w grze z ludźmi, jest wtedy, gdy zwycięstwo oznacza +0 punktów. Wydaje mi się, że jest to oceniane na podstawie słabszych silników, które grały przeciwko ludziom (a czasami GM ich narysował).
Nie wiem, gdzie czytałem Stockfish miał 3100, ale wygląda na to, że ma 3600 ELO. Zmień wycenę, jeśli chcesz, jak redagowałem mój post. Przepraszamy za niedogodności
@Universal_learner Jeśli chcesz, możesz swobodnie edytować mój post. W rzeczywistości nie potrzebujesz mojego pozwolenia, aw takich przypadkach byłoby to całkowicie normalne.
Pytanie, które planowałem opublikować, jest już [opublikowane] (https://chess.stackexchange.com/questions/18893/how-accurate-are-chess-engine-ratings)
#4
+4
Inertial Ignorance
2019-12-27 11:44:40 UTC
view on stackexchange narkive permalink

Kilka rzeczy:

1) Ogólne oceny mają tendencję do wzrostu z powodu inflacji większej liczby graczy wchodzących do puli, a nie z powodu wzrostu średniej siły gry graczy. Jeśli każdy stanie się lepszy z jakiegoś powodu dzięki silnikom, dlaczego oceny najlepszych graczy wzrosną? Grają teraz z przeciwnikami, którzy również stali się silniejsi o mniej więcej tyle samo.

2) Kasparow, Karpov i Fischer to pewnego rodzaju anomalie (zwłaszcza Kasparow), biorąc pod uwagę, że wszyscy są mistrzami świata. Mimo to zajmują tylko 3/20 miejsc na liście - wszystkie inne oceny zostały osiągnięte w epoce nowożytnej.

3) Silniki czynią ludzi silniejszymi, ale nie w dużym stopniu. Ludzie nie są w stanie wydobyć całej siły z silnika, po prostu widzimy ruchy, które zaleca.

Podsumowując, silniki sprawiają, że ludzie są nieco silniejsi, ale w każdym razie nie znalazłoby to odzwierciedlenia w oceny. Pula graczy to system zamknięty: każdy, kto staje się silniejszy, nie przynosi korzyści w szczególności jednemu graczowi / grupie graczy. Sposób, w jaki rosną rankingi (na wszystkich poziomach), wynika z faktu, że więcej osób dołącza do systemu.

EDYCJA: jeden ze sposobów, w jaki można zauważyć wzrost wyłącznie z powodu silników, to hipotetyczny scenariusz, w którym graliśmy przeciwko osoby, które nie miały dostępu do naszych silników.

EDYCJA 2: Punkt 1 może nie być całkowicie poprawny (zobacz dyskusję w komentarzach).

1) To powszechne nieporozumienie: czysty ranking ELO faktycznie * spada * z powodu wejścia nowych graczy do puli. Wchodzą z niską oceną, a następnie robią postępy, odbierając punkty innym. Gdy stają się nieaktywni, zdecydowana większość graczy ma wyższe oceny niż przy wejściu. Oznacza to, że odbierają punkty * z dala * od systemu.
@Kostya_I Ale nowi gracze wnoszą więcej punktów do systemu poprzez ich początkową ocenę. Nawet jeśli czyjaś ocena początkowa wynosi tylko 1000, nadal przyniosła 1000 punktów, zasadniczo niczego nie zabierając.
@Inertial_Ignorance, wyobraź sobie nowego gracza, który uzyska początkową ocenę 1000 punktów i nigdy więcej nie gra. Zgodnie z Twoją logiką, „przyniósł 1000 punktów”, ale w rzeczywistości nic się nie zmieniło dla innych graczy. A jeśli zagrają, zazwyczaj osiągną postęp - powiedzmy, do 1500. To 500 punktów odebranych innym graczom, więc ich ocena spadnie o tę kwotę, podczas gdy ich siła nie zmniejszy się. To jest deflacja. Oczywiście ktoś może spaść poniżej swojego początkowego poziomu, co jest jedynym przypadkiem, w którym naprawdę „przyniesie punkty”, ale to rzadki przypadek
@Kostya_I To dobra uwaga. Ale inflacja dzieje się z ratingami, więc jak to wyjaśnisz?
@Inertial_Ignorance, inflacja już się nie dzieje - średnie najwyższe N ​​są stabilne przez około 7-10 lat. Inflacja w latach 90. i 2000 mogła być spowodowana obniżeniem progu ratingu, do którego dodano wielu * ugruntowanych * graczy, którzy nie postępowali od tego momentu, ale postarzali się i tracili na sile, oddając punkty ratingowe. Może się też zdarzyć, że środki przeciwdziałające deflacji (inny współczynnik K dla nowych graczy) nie zostały odpowiednio dostosowane.
#5
+3
yobamamama
2019-12-26 17:01:19 UTC
view on stackexchange narkive permalink

Ludzie to nie komputery. Uczą się i zapamiętują tyle, ile to możliwe, ale nie potrafią zrobić tak dużo, jak komputer, ani tak szybko. Najlepsi gracze robią wszystko, co w ich mocy, ale nie potrafią tego wszystkiego tak, jak robi to komputer.

Cóż, myślę, że Carlsen czasami grał 25-ruchową linią Stockfisha, której nie było w książkach. Zgadzam się z twoją odpowiedzią i to ma rację, ale nie pytałem, dlaczego GM nie osiąga poziomu silników, pytałem, dlaczego nie podniosą trochę bardziej jego oceny, mówiąc, że wszyscy najlepsi gracze na 2900.
Podejrzewam, że wszyscy najlepsi gracze wykorzystują tyle, ile mogą, zarówno drukowane, jak i online, do poprawy. Więc jeśli nikt nie polepszy się bardziej niż inni i grają tylko sami, ich oceny pozostaną takie same. Najlepsi arcymistrzowie muszą grać w szerszej rywalizacji i wziąć część swoich punktów od graczy z niższymi ocenami, aby najlepsi mogli się poprawić.
O to chodzi w moim pytaniu. Wszyscy mają silniki, ale najlepiej oceniani gracze mogą przygotowywać lepsze gry niż powiedział, 2600. Caruana mówi, że chodzi mu o przygotowanie gry. Czy silniki nie pomagają 2800 pokonać leniwego 2600 łatwiej niż Bobby, Gary czy Anatolij?
Może, ale to nie wpłynie na oceny.


To pytanie i odpowiedź zostało automatycznie przetłumaczone z języka angielskiego.Oryginalna treść jest dostępna na stackexchange, za co dziękujemy za licencję cc by-sa 4.0, w ramach której jest rozpowszechniana.
Loading...