Group Details Private

team

Команда форума

 
  • RE: Grand Prix

    Какое совпадение!

    0_1558810681101_Screenshot from 2019-05-26 04-57-32.png

    posted in Турниры
  • RE: Grand Prix

    Ок, по Вашему методу, как я его теперь понимаю, получилось следующее.

    Делаем раз. Выписываем плотность распределения очков ГП: перебираем все значения очков, подсчитываем сколько раз такое число встретилось у вышедших с двух первых мест и делим каждое число на два миллиона для нормализации. Сумма этих значений равна единице.

    Делаем два. Находим функцию распределения очков ГП: накапливаем сумму плотности при проходе от наименьшего числа очков (0) к наибольшему (37).

    Теперь, допустим, Грищук набрал по итогам ГП 19 очков. Чтобы узнать, насколько это отличается от «обычного» значения, смотрим в колонку CDF и находим там 0.82. Это означает, что с вероятностью 82% Грищук круче теоретического среднего игрока, вышедшего из ГП. Иначе говоря, он как бы попадает в 82-й процентиль.
    Всё, больше ничего не нужно. Никаких нуль-гипотез.

    Points Probability density Cumulative distribution
    0 0 0
    1 0 0
    2 0 0
    3 0 0
    4 0 0
    5 0 0
    6 0 0
    7 0 0
    8 0.000001 0.000001
    9 0.000036 0.000037
    10 0.001878 0.001915
    11 0.020537 0.022452
    12 0.069447 0.091899
    13 0.1102 0.202099
    14 0.127925 0.330024
    15 0.130626 0.46065
    16 0.120535 0.581186
    17 0.098503 0.679688
    18 0.078275 0.757964
    19 0.060249 0.818212
    20 0.047513 0.865725
    21 0.040651 0.906376
    22 0.032329 0.938705
    23 0.022059 0.960764
    24 0.013277 0.974042
    25 0.008413 0.982454
    26 0.005799 0.988253
    27 0.004056 0.992309
    28 0.002668 0.994977
    29 0.001811 0.996788
    30 0.00117 0.997958
    31 0.000827 0.998785
    32 0.000604 0.999389
    33 0.000393 0.999782
    34 0.000167 0.999949
    35 0.000046 0.999995
    36 0.000005 1
    37 0 1

    0_1558797886099_gppoints.jpg

    Название графика плохое, но теперь не буду переделывать. Нужно было упомянуть, что это очки только занявших первые два места.

    posted in Турниры
  • RE: Grand Prix

    Ок, я начинаю понимать, что Вы хотите. Типа насколько результат, показанный двумя вышедшими из конкретного ГП (например, 19 и 17 очков), является необычно высоким, если сравнивать его с усреднёнными результатами моделирования, когда все игроки равны (например, в среднем они набирают 16 и 14 соответственно).
    Это действительно совершенно не похоже на мой метод 1-6. Заход с другой стороны. Ок, я подумаю, что можно сделать.

    posted in Турниры
  • RE: Всякая жуть и прочий horror

    Участник @комс написал в Всякая жуть и прочий horror:

    Априлье будет интересно
    https://mossudmed.livejournal.com/938923.html

    мне правда интересно... а как ты узнал, что я люблю такое?

    posted in Разное
  • RE: Grand Prix

    Насколько я понял, задача формулируется таким образом:

    при каких набранных очках мы с большой степенью вероятности отбираем лучших на сегодняшний момент

    Т.е., делаем следующее:

    1. Предполагаем, что рейтинг правильно показывает кто лучше играет.
    2. Берём откуда-то большую статистику сыгранных Гран При. Это количество обозначаем N.
    3. Перебираем все встретившиеся числа Top1Points и Top2Points, находим соответствующих игроков и их рейтинги. Здесь Top1Points и Top2Points являются набранными очками двух игроков, вышедших из ГП в ТП.
    4. Из статистики подсчитываем все реализации Гран При, в которых Top1Points и Top2Points принадлежали двум самым высокорейтинговым игрокам (это число M).
    5. Число M / N покажет относительную частоту «успешных» реализаций. Типа вероятности того, что топовые игроки пройдут в ТП при условии, что они набрали Top1Points и Top2Points очков соответственно.
    6. Все возможные пары Top1Points и Top2Points можно отсортировать и найти наилучшую пару ­— в которой M / N будет максимально.

    Так сделать возможно. Но

    • Вся эта канитель с проверкой статистических гипотез по ссылкам нерелевантна. Она имеет отношение только к случаю, когда статистика реальная, т.е., из реальных турниров, и она ограничена по объёму. Тогда да — в условиях жёсткой нехватки данных нужно будет делать, что там написано. Будут сформулированы и приняты гипотезы с определённым уровнем значимости и т.д. Но это не имеет отношения к нашему случаю, а именно, случаю, когда мы сами симулируем турниры. Ведь мы можем просимулировать сколько угодно раз. Не миллион, а 10 миллионов, например. И мы сразу этим снижаем уровень значимости тоже, наверное, на порядок. Миллион и так взят хоть и на глазок, но с явным запасом. Какой смысл в том, что мы будем подсчитывать по тем методам уровень значимости для наших данных после миллиона симуляций, если мы можем не напрягаться, а просто сделать ещё 9 миллионов симуляций, чтобы уж точно не сомневаться уже?
    • Если делать по алгоритму выше (пункты 1-6), то да — мы найдём некую пару чисел, например, 19 и 17 очков. Типа при данном раскладе рейтингов и при таких очках двух финишировавших первыми игроков эти самые игроки окажутся наиболее высокорейтинговыми с наибольшей вероятностью. Но отличаться результат этой пары чисел от соседних пар будет на мизерную величину. И никакого практического интереса в этом не будет.
    posted in Турниры
  • RE: Grand Prix

    Участник @xajik написал в Grand Prix:

    По колонке а ( с ее помощью), можно относительно просто построить модель и посчитать, с какой вероятностью мы определяем, что получили лучших. С какой вероятностью эти 2 участника являются лучшими при набраном количестве очков. Статистическая "нуль-гипотеза" или что-то похожее. Дополнить табличку , почитав стандартные отклонения на полученных распределениях, и посчитать для каждого резудьтата очков. Модель грубая, но вполне хорошая, думаю, будет.И именно по 2750 усредненному посчитать, как базе ( то есть мы строим модель, насколько различаются результаты, добытые игроками от случайного распределения, случайного шума в этом формате).

    По колонке "а"? Не понял, что имеется в виду тогда под лучшими, если все игроки были 2750. Они все были одинаковыми в таком случае. Понятно, что имелось в виду использовать колонку "а" как какую-то базу, но из такого описания не уловил суть. Требуется более формальное описание, чтобы я смог понять.

    Причём, я уже для себя сделал похожую, видимо, вещь. Но не по "а", а, скорее, по "б". Используя реальные рейтинги как матожидание скилла, я посчитал статистику: вероятность выхода каждого игрока. Грубо говоря, у Непо, как наиболее рейтингового, цифра должна быть выше всего. И она и оказалась выше — примерно 17%. Я пошёл дальше и стал изменять очки за выход в след. стадию, за тайбрейк и т.д. Так вот, интересно, что как ни крути этими очками, это практически не влияет на результат — как было у Непо 17% на выход в ТП, так и осталось, плюс-минус 1%. Хоть просто тупо по одному очку давай за каждый проход. Это означает, что по большому счёту все эти пляски с очками могут иметь большой смысл только для каких-то вспомогательных целей (например, разделение призового фонда пропорционально очкам, а не местам и т.п.), но никак не для основной — пройдут всё равно сильнейшие.

    posted in Турниры
  • RE: Обрывки мыслей , шахматные.

    Грубо говоря, черными играешь нестандартнее, а белыми- шаблоннее (это четче видно по шахматам Фишера, и не у меня одного, в класссике это труднее заметить по простым причинам). Это не для всех, но думаю, для большинства, кто играет на определенно уровня лучше "условного 2 разряда".

    Лучше 2-го разряда я, возможно, играю, но такого за собой не замечал. Чёрными одно и то же плотненько и своё всегда — Каро-Канн, и всё такое. Иначе будут ловить на то, чего не знаю, а именно чёрными попадать в незнакомую ситуацию не люблю больше. Возможно, что-то психологическое: считаешь, что белыми вывернуться из незнакомой позиции проще без больших потерь. Белыми охотнее иду на поводу у соперника, проверяю его идеи.
    Вообще, чёрным рисковать математически невыгодно. У меня был пост с цифрами на другом форуме на эту тему — могу поискать.

    posted in Разное
  • RE: Обрывки мыслей , шахматные.

    У меня всё наоборот почему-то. Белыми ловлю на заготовки. А когда я чёрными, то соперник обычно почему-то отклоняется от подготовленного варианта, и я страдаю.

    posted in Разное
  • RE: Grand Prix

    В этой таблице показана вероятность выхода в ТП из Гран При 2019 при условии набора игроком определённого количества очков.
    Колонка "а" получена после моделирования без учёта реальных рейтингов игроков (у всех 2750).
    Колонка "б" получена после моделирования с использованием реальных рейтингов игроков.

    Очки ГП Вероятность выхода в ТП (а) Вероятность выхода в ТП (б)
    7 0.000000 0.000000
    8 0.000001 0.000000
    9 0.000077 0.000046
    10 0.003452 0.002150
    11 0.038895 0.026751
    12 0.162197 0.124071
    13 0.366352 0.305635
    14 0.575004 0.509850
    15 0.746391 0.687993
    16 0.862297 0.824118
    17 0.934381 0.908371
    18 0.971775 0.958566
    19 0.988628 0.982120
    20 0.996051 0.993645
    21 0.998954 0.997904
    22 0.999744 0.999366
    23 0.999825 0.999861
    24 1.000000 0.999862
    25 1.000000 1.000000

    Результаты не такие, какие я ожидал интуитивно. Думал, что для 50%-го шанса выхода нужно будет 16 очков, а моделирование показало, что всего 14.
    Интересно, что один раз из миллиона симуляций кто-то умудрился пролезть даже с 8 очками. Если интересно, могу повторить эту симуляцию и обнародовать подробные результаты.

    Некоторые детали симуляции

    • Миллион прогонов
    • Жеребьёвку (сетку) как в реальном ГП было делать лень, так что она полностью слепая. На результаты это должно влиять очень слабо.
    • Не просто каждый раунд кидал монетку, чтобы узнать, кто выйдет, но учитывал рейтинг по известной формуле. Не хочется расписывать это всё.
    • Упростил — не стал моделировать каждую партию по отдельности, а моделировал сразу весь матч. Базовую вероятность тайбрека установил в 40%, и она линейно уменьшается с увеличением разности рейтингов: если разница 100 очков, то вероятность тайбрейка 30%.
    • На последнем этапе в Википедии не хватает одного игрока до 16. Я не знал, что с этим делать, и добавил болвана, который проиграет в первом раунде тому, кому попадётся (но очко за победу в осн. время не давал).
    posted in Турниры