Алгоритм ошибся

by:LondDataMind1 неделю назад
1.68K
Алгоритм ошибся

Матч, который противоречит логике

17 июня 2025 года в Рио-де-Жанейро под фонарями соперничали два клуба из бразильской Сérie B: «Вольта Редонда» против «Аваи». Финальный свисток прозвучал в 00:26 18 июня — после напряжённых 96 минут. Счёт? Плоская ничья — 1:1.

Я отслеживал этот матч с понедельника. Моя модель машинного обучения — обученная на более чем 40 000 матчах — предсказывала небольшую победу «Аваи». Уверенность: 68%. А получилось совсем иначе.

Профили команд и контекст сезона

«Вольта Редонда» входила в матч на девятом месте в Сérie B с тремя победами и четырьмя поражениями за последние одиннадцать игр. Известны дисциплинированной обороной и зависимостью от стандартных положений — особенно угловых от полузащитника Рафаэля Мораэса.

«Аваи»? Более нестабильная команда с крепкой базой фанатов из Флорианополиса. Сезон проходил сложно — только две чистки за весь год, но были моменты блестящего выступления против лидеров.

Обе команды стремились попасть в зону плей-офф к середине сезона. Для них это была не просто игра — это была математика выживания.

Что пошло не так с моделью?

Даю честный ответ: модель не провалилась — она просто упустила контекст.

Она учитывала владение мячом («Аваи» имел 54%), разницу xG (+0,3) и форму («Вольта Редонда» выиграла две из трёх последних). Но ни один из показателей не учитывал одну ключевую переменную:

Вес ожиданий

Болельщики «Вольта Редонды» заполнили почти половину стадиона той ночью — не потому что громче других, а потому что верят. А вера меняет поведение.

На 78-й минуте, когда «Вольта Редонда» сравняла сильным головой с углового (третий удар), мой алгоритм не зарегистрировал это как ‘моральный импульс’. Он видел лишь очередной удар из-за штрафной с умеренным значением xG.

Именно поэтому футбол такой прекрасный — и такой труднопредсказуемый.

Тактические нюансы, скрытые под носом

«Аваи» начало игру высоким прессингом, но после перерыва стало терять пространство из-за усталости игроков — данные GPS-жилетов уже были в обучающей выборке. Модель предполагала стабильные уровни выносливости на протяжении всего матча… но реальные игроки не следуют линейным кривым снижения производительности.

Между тем «Вольта Редонда» после первого гола на 54-й минуте перешла на глубокую оборону. Это было вне их обычного плана… но тренеры адаптируются по интуиции. А моей системе было слишком жёстко учиться этому без размеченных примеров… которых крайне мало во второстепенных лигах.

Байесы данных, которые нельзя видеть, но чувствовать

Несмотря на то что ни один показатель не может передать страсть или страх — важно осознавать границы алгоритмов:

  • Домашний преимуществ: недооценено из-за нерегулярности отчетности бразильских клубов;
  • Усталость игрока: производительность падает после 65 минуты — часто недостаточно точно фиксируется;
  • Тактическая гибкость: тренеры меняют стратегию во время игры по интуиции; модели считают стратегии стабильными до тех пор, пока обучены другому. The reality is simple: numbers explain patterns—but not stories.* The best predictions account for both.

LondDataMind

Лайки37.74K Подписчики1.48K