Хиллсборо и другие исторические события
kudr1984
Сообщения: 294
Зарегистрирован: 27 авг 2017, 21:17

Статистика

Непрочитанное сообщение kudr1984 »

mooromets писал(а): 11 ноя 2021, 15:21 Но, знаешь чего мне не хватает? Цифры-значения, которое бы характеризовало "полный провал". Чтобы было от чего оттолкнуться.
Подобными категориями не мыслил. Хотелось сравнить два способа отчета между собой, а не в абсолюте. Если говорить о "полном провале" то безусловно надо сравнивать не между собой, а с идеальной моделью, в данном случае итоговой таблицей. Тут получается следующая история:
1. Первый расчет (для сезона 2018/2019) на основании набранных очков погрешность 139 очков, по xPTS 104. Всего разыгранных очков 537*2 = 1074 командами с момента расчета. Точность 87 (100*(1074-139)/1074) и 90 (100*(1074-104)/1074) процентов соответственно.
2. Второй расчет (для сезона 2020/2021) на основании набранных очков погрешность 208 очков, по xPTS 150. Всего разыгранных очков 704*2 = 1408 командами с момента расчета. Точность 85 (100*(1408-208)/1408) и 89 (100*(1408-150)/1408) процентов соответственно.
Примечание: и там и там умножаем разыгранные очки на два, т.к. на одном матче наша максимальная ошибка не 3, а 6 очков.

При этом оценить "полный провал" для 20 команд в пределе можно оценить следующим образом - 2*570 (очков на круг)/600 ≈ 47 процентов, где 600, максимальная разница в очках между прогнозом и реальной таблицей, которую можно получить за круг.

PS: если посчитать прогноз для регулярки НБА первым способом в середине сезона, то точность 95 - 97 процентов, так что можно сказать что при прогнозах на футбол полный провал и там и там :)
Аватара пользователя
mooromets
Сообщения: 3012
Зарегистрирован: 28 фев 2007, 17:16
Откуда: Карлсруэ<-Киев<-Донецк

Статистика

Непрочитанное сообщение mooromets »

Скриню:
kudr1984 писал(а): 12 ноя 2021, 10:49 1. Первый расчет (для сезона 2018/2019) на основании набранных очков погрешность 139 очков, по xPTS 104. Всего разыгранных очков 537*2 = 1074 командами с момента расчета. Точность 87 (100*(1074-139)/1074) и 90 (100*(1074-104)/1074) процентов соответственно.
2. Второй расчет (для сезона 2020/2021) на основании набранных очков погрешность 208 очков, по xPTS 150. Всего разыгранных очков 704*2 = 1408 командами с момента расчета. Точность 85 (100*(1408-208)/1408) и 89 (100*(1408-150)/1408) процентов соответственно.
Т.е. реальная разница между прогнозами "по таблице" и xG составляет 3-4% в точности прогноза. Как-то у меня это не укладывается с предыдущими утверждениями, что "нет ничего хуже, чем смотреть в таблицу для прогноза будущих результатов", а тут оказывается, что великий xG (xPTS) даёт аж почти целых +5% к точности такого прогноза.
При том, что если подойти к 14-летнему школьнику и предложить ему идею "в оставшихся 25 играх чемпионата команды будут играть так же, как в первых 13-ти", то он покрутит у виска. Зато "Покрутить у виска +5%" - это вдруг стало эталоном успеха и мерилом адекватности. Непонятно всё это как-то :nok
"большинство хотя бы в первой части моего поста согласны со мной" (C)
kudr1984
Сообщения: 294
Зарегистрирован: 27 авг 2017, 21:17

Статистика

Непрочитанное сообщение kudr1984 »

mooromets писал(а): 12 ноя 2021, 11:20 "нет ничего хуже, чем смотреть в таблицу для прогноза будущих результатов"
Такого я точно не говорил :no есть много чего хуже. Я говорил, что лучше заглянуть и сюда, так оно вернее будет.
mooromets писал(а): 12 ноя 2021, 11:20 Т.е. реальная разница между прогнозами "по таблице" и xG составляет 3-4% в точности прогноза. Как-то у меня это не укладывается с предыдущими утверждениями, что "нет ничего хуже, чем смотреть в таблицу для прогноза будущих результатов", а тут оказывается, что великий xG (xPTS) даёт аж почти целых +5% к точности такого прогноза.
Более правильным будет считать погрешность относительно диапазона 53 % (от худшего варианта прогноза 47 % - до лучшего 100 %), т.о. разница будет 6 и 8 процентов соответственно. Для меня это большой процент. Для примера в 12 из 29 сезонов АПЛ разрыв между первым и вторым местом в АПЛ по очкам был меньше 6 %, еще в одном в промежутке 6-8 %.
Аватара пользователя
mooromets
Сообщения: 3012
Зарегистрирован: 28 фев 2007, 17:16
Откуда: Карлсруэ<-Киев<-Донецк

Статистика

Непрочитанное сообщение mooromets »

kudr1984 писал(а): 12 ноя 2021, 12:15
mooromets писал(а): 12 ноя 2021, 11:20 Т.е. реальная разница между прогнозами "по таблице" и xG составляет 3-4% в точности прогноза. Как-то у меня это не укладывается с предыдущими утверждениями, что "нет ничего хуже, чем смотреть в таблицу для прогноза будущих результатов", а тут оказывается, что великий xG (xPTS) даёт аж почти целых +5% к точности такого прогноза.
Более правильным будет считать погрешность относительно диапазона 53 % (от худшего варианта прогноза 47 % - до лучшего 100 %), т.о. разница будет 6 и 8 процентов соответственно. Для меня это большой процент. Для примера в 12 из 29 сезонов АПЛ разрыв между первым и вторым местом в АПЛ по очкам был меньше 6 %, еще в одном в промежутке 6-8 %.
Это какое-то математическое порно. Нельзя считать проценты от процентов.
Акции компании А выросли на 2% в год. Акции компании Б выросли на 3% в год. Значит, Компания Б на 50% более доходная, чем комания А.
Выходит, если мы вложим 100 пиастров в А, то мы получим 102. Зато если вложим 100 пиастров в Б (которая на 50% более доходная), то получим 152?
"большинство хотя бы в первой части моего поста согласны со мной" (C)
kudr1984
Сообщения: 294
Зарегистрирован: 27 авг 2017, 21:17

Статистика

Непрочитанное сообщение kudr1984 »

mooromets писал(а): 12 ноя 2021, 12:57 Это какое-то математическое порно. Нельзя считать проценты от процентов.
А я и не считал, я считал проценты от диапазона. Можно было бы сначала посчитать дипазон и потом высчитывать от него проценты, наверное, логически так было бы правильнее, но итог был бы тот же.
Аватара пользователя
mooromets
Сообщения: 3012
Зарегистрирован: 28 фев 2007, 17:16
Откуда: Карлсруэ<-Киев<-Донецк

Статистика

Непрочитанное сообщение mooromets »

Как-то Черчилль сказал: "Демократия – очень плохая система, но лучше никто не придумал". Тоже самое можно сказать про xG, но, если о плюсах я писал выше, то здесь сконцентрируюсь на минусах.
(минусы-общеизвестные факты, которые гуглятся за 5 минут, вроде "рассчитан для среднего игрока и не учитывает мастерство вратаря" опустим)

Когда даже бабка у подъезда говорит тебе покупать биткоин - жди обвала.
Сейчас xG плывёт на волне хайпа. Ещё несколько лет назад широкая футбольная общественность считала, что самыми лучшими показателями игры команды может быть владение мячом и количество ударов, и эксперты в студии после матча говорили только о них. Сейчас появился xG, который на порядок лучше отображает в цифрах то, что мы глазами увидели на поле: справедливое соотношение сил, в соответствии с созданными опасными (или не очень) моментами. Хайповые вещи всегда обрастают легендами, наделяются магическими свойствами и также всегда переоценивается их реальная полезность.

Хвост машет собакой или "корреляция не подразумевает причинно-следственной связи"
Есть такой мем-график, про связь между количеством пиратов и глобальным потеплением.
читать дальше »
Изображение

Из которого видно, что за последние 200 лет количество пиратов уменьшалось обратно-пропорционально средней температуре на планете. Можно ли утверждать, что если мы увеличим количество пиратов, то остановим или хотя бы затормозим глобальное потепление? :wink:
Ладно, пираты и температура - это совсем юмор, но есть другие глупые вещи, который творятся в футболе с умным лицом статистики.
Например, Брендан Роджерс, когда был назначен в Ливерпуль, произнёс такую фразу: "По статистике, команды, которые имели больше 65% владения мячом в матче, в 83% случаев выигрывали. Наша цель - владеть много мячом и таким образом будем обеспечивать победы" (цифры не точные - лень было искать, 65 и 83 взято для примера).
Ну, что? Уловили где в словах Роджерса пираты, а где - потепление? Дело в том, что условные 65% владения - это не футбол. Команды вроде Барселоны, Баварии, Арсенала, Ливерпуля и пр. старались выиграть в футбол: они хотели забивать и не пропускать; топовые клубы зажимали андердогов на их половине поля, обстреливали ворота - старались выиграть через забитые голы, в тот момент, как андердоги были рады отдать мяч и просто продержаться 90 минут на 0-0 или 1-1, в лучшем случае. Отсюда появились эти магические "65% владения", которые понадобилось победителю, чтобы сломить соперника. Но никто из победителей не ставил цели добиться 65% владения, чтобы подняться в таблице. Поэтому, утверждать, что ты можешь через какую-либо статистику, отличную от голов в матче, перейти к очкам в таблице - это то же самое уменьшение температуры через увеличение пиратов.

xG - это не футбол.
Цель футбола - это победа в матче. Голы - это средство достижения победы. Опасные моменты, созданные у ворот - именно их и меряет xG - это средство достижения голов и это третий приоритет в матче для каждой команды.
При этом, мы можем сказать такое утверждение: если команда хочет победить, то она должна забивать больше соперника, что будет верно и обратное: если команда забила больше соперника, то она победила.
С xG так не работает. Нет закона "кто настрелял больше xG, тот победил". Такого закона нет в пределах матчах, в пределах 10 матчей и даже в пределах сезона (хотя нас часто пытаются убедить в обратном).
Проблема xG - в усреднении, но усреднении не только игроков, сколько стратегий на игру. Я, хоть и не считал, но уверен, что xG гораздо лучше прогнозирует средние команды со средними игроками и средними тренерскими идеями. Если тренер пытается выстроить какую-то особенную уникальную тактику, то он может своей тактикой и стратегией дурить xG на прояжении очень долгого времени, даже целого сезона, хотя и половины сезона порой достаточно для достижения приемлимых целей. Или взять Пепа, я вот был уверен, что его стратегия футбола в Сити (никогда не останавливаться - состав же бесконечный) имеет наименьшие отклонения по xG среди всех клубов за последние лет 5. Опять же, я не считал, но поклацал understat - визуально так и выглядит.
С обратной стороны то, как Ливерпуль выиграл своё чемпионство - игру за игрой, забивая ранние голы или гол первым, а потом сводя игру к полумоментам с обеих сторон, понимая, что в обмене такими слабыми моментами качество игроков Ливерпуля решит. Так Фергюссон выиграл большинство своих титулов. В некрасивое пободие этого играет Атлетико Симионе и играл Моуриньо в свой первый приход в Челси. Эти тактики могут реализовать топ-клубы и эти тактики будут приводить к стабильному набору очков при низких показателях xG.
В этот самый момент куча других клубов, которые недобирали или перебирали очков по xG, будут откатываться к среднему, но не "наши" клубы, во главе которых стоят тренеры "с идеями". (под "идеями" здесь я понимаю даже плохих тренеров, с плохими идеями, но просто такими нестандартными, которые не улкадываются в общепринятую логику: "атакуем сколько можем, защищаемся всё время, пока не атакуем")

Подделка лучше оргинала
Что даже забавляет в использовании xG, так это то, что если даже предположить, что XG непогрешим и отражает наиболее точно справедливую форму команды, то какой в этом толк, если футбол
Abel писал(а): 10 ноя 2021, 07:18 в любом случае это более показательно, чем сухое количество очков либо забитых и пропущенных голов. Ибо футбол спорт низкой результативности.
Низкая результативность подразумевает, что высокой остаётся доля случая в каждом матче. Так такой смысл в оттачивании измерительных приборов для честной формы команды, если в следующей игре, и через неделю, и через две, вся форма команды разобьётся о случайный рикошет, подмышечную линию оффсайда, спорный пенальти или глупую обрезку?
Это как, знаете, если изобрести прибор, который идеально угадывает вероятности для монеток рязных типов. Ну, там, нанесение герба и других элементов делает одну сторону тяжелее и меняет вероятность с 50/50. Например, мы изобрели такой прибор и он показал, что 1 доллар на "орле" вместо 50% имеет 49.3%, 1 евро - 48.9%, а один рубль - 50.4%. Это очень важные знания, если у вас спорт высокой результативности и вы подбрасываете монетку раз 30. Но если вы бросаете её 1 раз, то ваш сверхточный прибор показывающий честное распределение сил, просто тонет под весом случая: нет существенной разницы между 49/51 и 50/50, если монету бросают всего раз или даже 2-3.

Поэтому мне очень трудно понять следующие вещи нужно относить к тому, что случайность перекрыла точность формулы xG или просто формула требуется в доработке:
1.
Abel писал(а): 11 ноя 2021, 02:53 Челси забили на 5,28 больше своих xG и пропустили на 6,86 меньше своих xGA. На дистанции в 11 туров это аномальный результат. Самое сильное отклонение в лиге по обоим показателям: https://understat.com/league/EPL/2021
А по разнице ожидаемых и реальных пропущенных - это самый сильный оверперформ среди всех клубов топ-5 лиг Европы.
2.
Abel писал(а): 11 ноя 2021, 02:53 Это сравнимо с нашим прошлогодним недобором в атаке, когда за 14 туров с 28 декабря по 8 марта Ливерпуль насоздавал на 20,90 хG, а забил лишь 11 мячей (разница в 9,9).
3.
Ливерпуль в 2019-2020 - аномалия длиною в весь сезон, где по забитым перебрали +10, по пропущенным недобрали -6, по очкам перебрали +25 (рекорд? Опять?)
4.
Ла Лига с мая 2016 по май 2017 - https://understat.com/ + https://understat.com/league/La_liga/2016 - 13 месяцев подряд всем чемпионатом оверперформили. Ещё раз: 20 команд одного чемпионата (замкнутая система, игры друг с другом) оверперформили 400 матчей подряд.

Эти все примеры показывают, что даже если и существует в природе "регрессия к среднему xG", то она может наступить слишком поздно в мире реальных чемпионатов. Если регрессия произошла позже окончания сезона или позже, чем сделала непоправимые изменения в таблице, то тогда какой в этом смысл? Просто статистическая мастурбация? Спустя 137 матчей голы Челси вернулись к среднему по xG... Спасибо, блин :D

Мои выводы такие, что нет статитики лучше, чем та, которая приближает ближе к победам, та о которой думают игроки во время матча: очки и голы.
Главное - это добивается ли команда результата или нет. Три победы - это три победы. Пять побед - это пять побед.
Если взять голы, то ты можешь уточнить (но не перевернуть) выводы сделанные по результатам. Т.к. это разные вещи, выигрывать 2-1 и 1-0 против побед 2-0 и 3-0.
Если взять xG, то ты можешь уточнить понимание (но не перевернуть, не перечеркнуть) насколько легко забивались голы, какая доля случая была в них.
"большинство хотя бы в первой части моего поста согласны со мной" (C)
MaTiUs
Сообщения: 1
Зарегистрирован: 06 авг 2019, 09:40

Статистика

Непрочитанное сообщение MaTiUs »

Болельщик Ливерпуля с 2001, самому 34 (скоро будет 35), абсолютно (живу в украинской глубинке) не верю в силу интернета и т.д.
Верю в себя и свой клан.
Но тут не сдержался.
Первое сообщение ever
Ребята, пожалуйста, не сдерживайте себя - обсуждайте тему дальше.
Круто было бы конечно "Данте" и "Ромку".
Но там по ходу другие темы в приоритете

В любом случае, дякую всім, сайт неймовірний
Аватара пользователя
Umadi
Сообщения: 542
Зарегистрирован: 02 апр 2008, 11:35
Откуда: Казахстан
Контактная информация:

Статистика

Непрочитанное сообщение Umadi »

А почему не кто не учитывает игровой стиль.
Сити это команда который любит атаковать. И тренер и подбор игроков под это очень заточено.
Челси команда которуй любит защищаться. Игроки этого плана.
Не поверью что Челси после 1-0 будет и дальше бомбить и создавать моменты. Может пару контр атак они сделают но чтобы как Сити до конца матча бомбили и держали контроль. Отсюда и колоссальная разница по всем статистикам.
Если Сити сравнивать по статситике то надо с Ливерпулем. А Челси с Атлетико Мадрид.
Конечно есть лож есть статистика. Но оно и правду показывает. Только его надо умеет смотреть.
Я бы хотел посмотреть рекордные сезоны и сравнить тот отрезок с этим. Тогда мы приблизительно получим Сколько Сити наберёт в этом году. Плюс фактор Куна.
А с Челси я отчасти согласен что им где то фортить итд итп. Но пока идут ровно как и Сити в отличие от других. На дистанций Сити выглядит боле мене фаворитом. Сити просто стала машиной по добыванию очков. И Гваридоила гений на дистанцый. Что бы Сити обыргарть на Дистанцый надо пгругнуть высше головы и то не факт.
Наконец то сериал "следующий сезон наш" завершился
kudr1984
Сообщения: 294
Зарегистрирован: 27 авг 2017, 21:17

Статистика

Непрочитанное сообщение kudr1984 »

Не помню уже где, но кто-то сомневался, смотрит ли Клопп на xG и подобные метрики. Да и плюс в копилку предыдущего обсуждения xG.

Цитата Тухеля:
In the last few games we’ve kept the opposition’s xG very, very low. This is something that we look into, you cannot rely just on results.

Примерный перевод: В последних нескольких играх мы держали xG соперника на очень низком уровне. Это то, что мы изучаем, нельзя полагаться только на результаты.

Ссылка на полную статью:
читать дальше »
Ответить

Вернуться в «История клуба»