Pytanie:
Ważona korekta dla względnego Elo
Andrew Latham
2012-09-05 18:36:43 UTC
view on stackexchange narkive permalink

Patrzyłem na moje największe zmartwienia i zdałem sobie sprawę, że wynik był niezadowalający. Większość z nich była zdenerwowana na 500-600 punktów, kiedy wciąż byłem naprawdę nisko oceniany (tj. 800 pokonując 1300), podczas gdy zdenerwowanie, które uważam za największe, to te 150-200 punktów zdobyte jako gracz typu A lub ekspert. Podobnie byłoby znacznie większym zmartwieniem, gdyby 2650 pokonało Levona Aroniana, niż gdyby pokonało mistrza 1500. Wygląda na to, że im wyższe są oceny, tym większe znaczenie mają punkty - różnica 100 punktów ma o wiele większe znaczenie, im wyżej się znajdujesz.

Czy ktoś może wymyślić ważony lub logarytmiczny sposób przedstawiania ocen Elo w jakaś skala, aby była dokładnie odwzorowana i można było porównywać graczy w spójny sposób, czy też taka skala już istnieje?

Cztery odpowiedzi:
#1
+7
Andrew
2012-09-05 18:54:22 UTC
view on stackexchange narkive permalink

Myślę, że zjawisko, które opisujesz, jest spowodowane zmiennością gry na niższych poziomach. Elo jest definiowane na podstawie statystycznego prawdopodobieństwa, że ​​jeden gracz pokona drugiego.

Oto dokładny wzór na uzyskanie oczekiwanego wyniku gracza (rating = Ra) w porównaniu z przeciwnikiem (rating = Rb):
ELO Rating formula

Oznacza to, że 800 graczy teoretycznie jest w stanie pokonać 1000 graczy, tak jak 2200 graczy jest w stanie pokonać 2400 graczy.

Oczywiście tak nie jest, ponieważ na niższych poziomach istnieje znacznie większa wyniki. Ta różnica jest dość dobrze ujęta w systemie ocen Glicko. Zasadniczo gracz ma ocenę, a także odchylenie ratingów (RD), które reprezentuje, jak dobrze ugruntowana jest ocena gracza. Tak więc w twoim przypadku, gdy zostałeś oceniony na 800, najprawdopodobniej byłeś bliżej siły 1100 lub 1200, ale twoja ocena jeszcze nie dogoniła twojej siły. Jedną z podstawowych wad wszystkich systemów ratingowych jest to, że ocena zawsze pozostaje w tyle. Gdyby USCF korzystało z systemu Glicko, te wczesne zwycięstwa spowodowałyby znacznie większy skok w rankingu niż w rzeczywistości, a twój przeciwnik straciłby również mniej punktów.

Podsumowując, podczas gdy systemy ocen nie są doskonałe, a Twoja siła będzie często przewyższała Twój ranking, z czysto matematycznego punktu widzenia prawdopodobieństwo 800 lepsze od 1000 i 2600 od 2800. / p>

Odpowiedź Andrzeja już zasadniczo mówi to, co mam zamiar powiedzieć, ale może to być przydatne przeformułowanie. Ocena to tylko oszacowanie prawdziwej wartości parametru (siły gry) i ta wartość będzie się zmieniać w czasie. Ponieważ słabszy gracz ma potencjał do szybkiego podniesienia tej wartości, podczas gdy silny gracz nie, możemy oczekiwać, że oceny słabszych graczy będą generalnie gorszymi ocenami niż te dla silniejszych graczy, dlatego powinniśmy widzieć większe zdenerwowanie na tych poziomach też. RD systemu Glicko zapewnia wyraźny wskaźnik pewności, jaką należy mieć w danych ocenach / szacunkach.
#2
+1
D M
2018-05-21 06:59:15 UTC
view on stackexchange narkive permalink

Możesz zbudować dowolną skalę ... ale jak już powiedziano, oceny są już obliczane, więc określona różnica w ocenach da określony oczekiwany wynik. Korekta prawdopodobnie po prostu wypaczy rzeczy, zwłaszcza jeśli korekta jest w stopniu, który sugerujesz i opiera się wyłącznie na liczbach ocen (w przeciwieństwie do, powiedzmy, faktu, że Twoja ocena z lat 800-tych była tymczasowa i poszła znacznie wzrosła w kilku turniejach, które zajęło ustalenie twojego rankingu.)

Myślę, że przeceniasz, jak rzadkie jest, aby 2650 pokonało 2820 lub coś koło tego. Jeśli różnica w ocenach wynosi 170 punktów, oczekuje się, że niższa osoba uzyska około 27-28%. Chociaż większość tego wyniku pochodzi z remisów, czasem niższy gracz wygrywa. Aby dowiedzieć się, jak często, przejrzałem bazę danych zawierającą 127 000 gier. Odfiltrowałem to pod kątem gier, w których 2800+ grało z kimś 2650 lub niższym. Było 230 takich gier. Spośród nich 16 wygrała słabsza strona. To około 7%.

A może nie doceniasz tego, jak trudno jest pokonać mistrza 1500. Nie mam bazy danych niżej ocenianych graczy vs mistrzów, ale przyjrzałem się historii gier USCF o 2309 FM z mojego stanu. Rozegrał 48 meczów przeciwko ludziom z oceną poniżej 1500, odkąd zaczęli śledzić je pod koniec 1991 roku i przegrał zero . Rozegrał 104 mecze przeciwko ludziom z oceną 1500-1699 i przegrał 4. Z graczami z oceną 1700-1999 przegrał 33 z 589, czyli około 5,6%.

Tak, mieszam rankingi USCF i FIDE według porównując te dwa, ale mimo wszystko powiedziałbym, że pokonanie mistrza 1500 jest w rzeczywistości większym zmartwieniem niż 2650 (co prawie wystarcza, aby znaleźć się na liście 100 najlepszych na świecie) pokonując 2820.

Ale ty nie pytałem o to, więc odłożę to teraz. Pytałeś o możliwe formuły. Jedna formuła, która może być w duchu tego, co wydaje się być zamierzone (silnie ważąca wielkość zmartwienia na podstawie oceny przeciwnika i wpływająca na wszystkie obszary skali ocen) to:

A = D * 2 ^ ((R / 300) -5)

„A” to skorygowana kwota zmartwienia, „D” to różnica w oceny, a „R” to ocena przeciwnika. 2 oznacza, że ​​skorygowane zdenerwowanie podwaja się dla danej wartości rankingu przeciwnika (gdyby było 3, zamiast tego potroiłoby się), a 300 oznacza kwotę potrzebną do wprowadzenia tej zmiany. (5 oznacza tylko skalę). Tak więc, zgodnie z tym wzorem, na każde 300 punktów, na które oceni przeciwnik, dostosowana kwota zdenerwowania podwaja się.

Osobiście uważam, że to sposób zbyt stroma (różnica w punktach oceny 1500 przeciwnika oznacza, że ​​jest skorygowana o współczynnik 32, i nie sądzę, aby można było powiedzieć, że różnica 10 punktów to to samo, co różnica 320 punktów), ale wydaje się, że pasuje do tego, co było chciał. Ta formuła sprawiłaby, że 2650 pokonuje 2820 nieco lepiej niż 1500 pokonując 2200 i sprawiłoby, że 1800 pokonujące 1950 byłoby lepsze niż 800 pokonujące 1300.

#3
  0
edwina oliver
2020-02-08 22:49:56 UTC
view on stackexchange narkive permalink

Mógłbyś wymyślić o wiele bardziej skomplikowane sposoby mierzenia wydajności, ale to nie naprawiłoby odpowiednio NIEZGODNOŚCI i ZMIENNOŚCI graczy z niższymi ocenami.

Ponadto oceny nie są wcale dokładne na niskich poziomach, ponieważ jest niewystarczające wymieszanie konkurencji. Najlepsi arcymistrzowie grają sami, co jest znacznie mniejszą grupą niż ci, którzy oceniają graczy na poziomie klubowym na całym świecie, a nawet w jednym dużym kraju. Z tego względu mały kraj powinien mieć mniej słabych graczy niż całkowita liczba WSZYSTKICH GMów na świecie.

A oceny szacują tylko WCZEŚNIEJSZĄ WYDAJNOŚĆ, co, jak mówią reklamy, nie gwarantuje przyszłych wyników. Dzieci bardzo się poprawiają; GMowie starzeją się i zwykle nieco słabsi.

#4
-1
Jamal Munshi
2014-08-29 06:00:07 UTC
view on stackexchange narkive permalink

Słabością systemu rankingowego Elo jest to, że opiera się on na „punktacji”, czyli zamianie wyników gry w szachy trójmianowe na dwumianowe „wyniki” (wygrana = 1, przegrana = 0, remis = 1/2). Punktacja powoduje utratę niektórych informacji o wyniku gry. Dokonałem empirycznej miary utraty informacji i stwierdziłem, że jest ona znacząca. Zaproponowałem dwuwymiarową miarę wydajności, która jest dokładniejsza, ponieważ zawiera więcej informacji.

nie mogę czytać gazety bez jeszcze jednej relacji


To pytanie i odpowiedź zostało automatycznie przetłumaczone z języka angielskiego.Oryginalna treść jest dostępna na stackexchange, za co dziękujemy za licencję cc by-sa 3.0, w ramach której jest rozpowszechniana.
Loading...