В поисках Числа

Генеральный менеджер Хьюстона Дерил Моури - один из самых ярких представителей аналитического подхода в НБА, фото northwestern.edu
Sport Arena представляет очерк об эволюции статистических критериев оценки полезности игроков в Национальной Баскетбольной Ассоциации.

С самого своего зарождения баскетбол был неразрывно связан с числами. Это было вызвано не только тем, что спорт возник в США, где к цифрам и статистике особое отношение, но и самой природой баскетбола. Намного большее количество очков по сравнению с другими популярными видами спорта вроде футбола или хоккея, совмещенное с небольшим количеством игроков, которые эти очки распределяют между собой, позволяло достаточно легко и очевидно оценить индивидуальный вклад каждого игрока в результат матча.

Цифры очаровывали, и одним из самых первых и самых ярких примеров такого очарования был Уилт Чемберлен. Единственный игрок в истории Ассоциации, набравший 100 очков в одном матче, уже тогда, в далеком 1962 году понимал, что баскетбол изменится, правила изменятся, но его сто очков всегда останутся сотней очков. Ведь этот показатель стал не столько следствием его великолепной игры, сколько желанием установить именно этот рекорд, набрать именно сотню, ради чего он игнорировал партнеров, а его партнеры игнорировали возможности отметиться на табло самим. Причем погоня Уилта за статистикой не ограничивается одним стоочковым матчем. Взять хотя бы сезон 1967/68, когда легендарный центровой, неоднократно добывавший титулы самому результативному и самому подбирающему игроку, решил стать лучшим ассистентом в НБА, что у него, конечно, получилось. Популярный журналист Билл Симмонс в своей книге даже спекулировал, что если бы Ассоциация начала считать блок-шоты в то время, когда Уилт играл, он бы стал куда активнее выкладываться на своей половине паркета.

Однако блок-шоты, как и перехваты, начали подсчитываться уже после того, как Чемберлен повесил кроссовки на гвоздь, в сезоне 1973/74, четырьмя годами позже последовали перехваты. Когда в чемпионате 1979/80 была введена трехочковая черта, баскетбольная статистика окончательно предстала в том виде, в котором она сохраняется в официальных бокс-скорах (вроде такого) по сей день.

Долгое время процент попадания был самой «продвинутой» статистикой, которую использовали для оценки эффективности спортсменов, изредка дополняя его пересчетом статистики баскетболистов на игровое время, например, «очки за 36 минут» или «очки за 48 минут», чтобы получить возможность сравнить атлетов, получающих разное время, например, резервиста и игрока стартовой пятерки. Однако «цифровая революция», начавшаяся в бейсболе и получившая название «саберметрики», постепенно перешла и в американский баскетбол.

Ее первым шагом стало изменение минимальной единицы отсчета: вместо минуты начали использовать владение. Это позволяло учесть, например, разницу в очках, связанную не только с реализацией, но и с тем, сколько времени команда тратит на атаку. Например, как 96 очков, так и 108 могут быть следствием 50% реализации при одинаковом количестве штрафных, подборов и потерь, просто потому, что одна команда успевает за матч провести 48 атак, а вторая — 54. Это породило еще один, связанный показатель, а именно темп — количество владений (атакующих и защитных), которое команда успевает провести за один матч.

Юта Джаз, самая "медленная" команда в этом чемпионате, в среднем проводит всего 95 владений за матч, фото USA Today Sports
Юта Джаз, самая «медленная» команда в этом чемпионате, в среднем получает всего 95 владений за матч, фото USA Today Sports

Поскольку эта статистика была предложена приблизительно 20 лет назад, и ее подсчет стал куда точнее, чем раньше, то на данный момент в аналитических материалах пересчет набранных и пропущенных очков за 100 владений (которые называются, соответственно, рейтинг нападения и рейтинг защиты) стал куда популярнее, чем аналогичные показатели в среднем за игру.

Однако изменение своеобразного «атома» статистики стало лишь стартовой точкой поиска Числа — святого Грааля цифровой аналитики, способного одним показателем выразить всю полезность игрока. Пионером и проводником в этом поиске стал Джон Холлинджер, в прошлом журналист, а ныне вице-президент по баскетбольным операциям Мемфис Гриззлис. Взяв на вооружение понятие владения, Холлинджер вызвался свести весь бокс-скор в одно-единственное Число, которое отражало бы полезность игрока по всем показателям. Результатом его изысканий стал PER, или Player Efficiency Rating (по-русски: «Рейтинг эффективности»).

Как и было обещано, он брал все показатели, которые можно было найти в послематчевой статистике, пропускал их через мясорубку в виде формулы (с ней можно ознакомиться здесь), которая учитывала, кроме этого, количество владений и темп, после чего делала так, чтобы средний показатель всегда равнялся 15.  Поскольку за разработку этого критерия Холлинджер получил работу на ESPN, одном из ведущих американских спортивных сайтов, там PER всегда был в почете, однако прочно закрепить его в статусе Числа у развлекательного конгломерата не получилось.

Тому было несколько причин. Во-первых, он никак не учитывал полезность игрока в обороне. Это было связано с тем, что в «горнило» формулы из защитных показателей отправлялись исключительно перехваты и блок-шоты, и если вам кажется, что они дают адекватное представление о том, насколько полезен был какой-то игрок в обороне, то вам следует смотреть больше баскетбола. Во-вторых, формула отдавала предпочтение количеству бросков перед качеством, или, иначе говоря, поощрение за результативные броски настолько перевешивало штраф за неточные, что увеличение количества попыток практически всегда (за исключением совсем провальной реализации вроде менее 30% с двухочковой дистанции и 21% с трехочковой) означало увеличение рейтинга эффективности. Ну и, в-третьих, эта формула не получила поддержки от самих клубов НБА, поскольку полнее отражала эффективность игрока в фэнтези-Лиге, чем в настоящей.

Однако неприятие PER клубами вовсе не означало, что фрэнчайзы стоимостью сотни миллионов (а ныне счет уже перешел на миллиарды) долларов будут продолжать оценивать игроков «на глазок». Постепенно переманив к себе ведущих аналитиков и специалистов по статистике клубы начали разработку собственных показателей, которые до сих пор в большинстве своем остаются за закрытыми дверями. Часть из них была связана с камерами SportsVU, доступ к показаниям которых в позапрошлом году открыли для широкой публики на официальном сайте NBA. Они, правда, действовали противоположным образом тому, как работал PER. Вместо того, чтобы сводить множество показателей к одному, они давали в разы больше информации, чем обычный бокс-скор, включая эффективность игроков в различных конкретных компонентах вроде изоляций один-на-один, атаки и защиты в лоу-посте, бросках из угла площадки, бросках после передач или после дрибблинга, и массу других.

Кевин Лав в этом сезоне является наиболее эффективным игроком в НБА по игре спиной к кольцу, фото АР
Кевин Лав в этом сезоне является наиболее эффективным баскетболистом в НБА по игре спиной к кольцу, фото АР

Но при всем этом изобилии прогрессировала оценка игроков и на другом фронте, который взял самую простую идею эффективности игрока и попытался дать ей числовое значение. Им стал такой компонент, как +/-, то есть соотношение забитых и пропущенных командой очков за то время, когда баскетболист был на паркете. Несмотря на то, что в хоккее этот показатель используется очень давно и повсеместно, в баскетболе он долгое время игнорировался, хотя идея, которую он выражает, очень проста: если ты действительно помогаешь команде, то когда ты на паркете, она играет лучше, чем когда тебя там нету.

Одним из первых ресурсов, который стал предоставлять подобную информацию широкой общественности, стал 82games.com. Сайт на данный момент уже не обновляется, не выдержав конкуренции с ведущими «поставщиками» баскетбольной статистики вроде nba.com/stats или basketball-reference.com, которые включили в себя его функционал. Аналогичный акцент, как стало известно, расставили и в клубах, открытых к аналитическому вкладу (а таких в НБА гораздо больше, чем может показаться на первый взгляд, включая, например, Сан-Антонио, которые были в первых рядах цифровой революции и до сих пор могут похвастаться одним из самых прогрессивных аналитических штабов, Хьюстон, Даллас, Майами, Торонто, Финикс, Бостон, Портленд и многие другие). Так, в интервью главного тренера Майами Эрика Споэльстры, датированного 2011 годом, можно встретить следующие слова:

«Можно сколько угодно спорить о разных вещах, но в конце концов самой важной статистикой является результат на табло в то время, когда ты находишься на паркете. Я думаю, это находит отклик у игроков, потому мы все время подталкиваем наших баскетболистов. Принеси пользу команде за свои полученные минуты. Сколько бы ты ни получил игрового времени, не позволяй счету измениться.

После каждой игры я получаю большую распечатку, порядка 30 страниц, из разных статистических показателей. Я не смотрю на все, что там написано, но есть определенные компоненты, на которые я обращаю внимание в первую очередь. Я всегда смотрю индивидуальные показатели +/- отдельных игроков, но, я считаю, это может создать обманчивое впечатление. После этого ты всегда должен смотреть на комбинации».

Эрик Споэльстра начал свою карьеру в Хит именно с работы аналитиком, фото USA Today Sports
Эрик Споэльстра начал свою карьеру в Хит именно с работы аналитиком, фото USA Today Sports

Итак, вместо того, чтобы оценивать вклад игрока в статистику, отражающийся в индивидуальных очках, передачах, перехватах и так далее, основой нового подхода становится попытка оценить вклад игрока в результат команды: то, сколько очков она набирает и сколько очков она пропускает. Это сходу решает одну из главных проблем PER: оценку защитного вклада. Если ты реально мешаешь сопернику набирать очки, не совершая при этом блок-шотов или перехватов, то в твое присутствие на паркете соперник будет набирать меньше очков, чем когда ты сидишь на скамейке запасных.

Естественно, не составляет труда сходу придумать сразу несколько вопросов к подобному подходу. Например, что делать с баскетболистом, который играет в паре с Кевином Дюрантом или ЛеБроном Джеймсом, которые всегда усиливают атаку команды из-за своего умения самостоятельно набирать очки? Или в ситуации, когда запасной игрок «пропускает» меньше очков, чем основной, просто потому, что играет против таких же запасных, а значит менее умелых спортсменов? Или когда защитник, который классно «закрывает» своего игрока, страдает из-за того, что центровой за его спиной не умеет играть в обороне, понижая тем самым его показатели +/-?

Эти вопросы сразу же возникли и у аналитических штабов. Без дополнительной обработки показатель +/- отдельного игрока требовал учета контекста, превращая один показатель в целую группу, без анализа которой он был бесполезен, а иногда, как заметил Споэльстра, и обманчив. А ведь соблазн найти Число никуда не делся. Особенно велик он был у представителей масс-медиа. Ведь если у тренерского штаба есть время вникать в целый ряд цифр, это входит в их служебные обязанности, то обычному болельщику хочется получать информацию в как можно более простом виде. Да и сами журналисты понимали, что все матчи посмотреть невозможно, а какой-то ориентир для адекватной оценки полезности игрока все же необходим. Потому под предводительством уже другой группы, включающую докторов наук вроде Стива Иларди, Джеремайаса Энгельманна и Аарона Барзилаи, началась разработка модифицированных показателей +/-.

Подобно PER, основу расчета составили отдельные владения и усреднение показателей до какого-то уровня. Только если в рейтинге эффективности средним значением считалось число 15, то при вычислении +/- в качестве усреднения выбрали 0, а результирующие очки считают в расчете на 100 владений. Таким образом, игрок, который имеет среднюю полезность как в атаке, так и в защите будет давать команде «ноль» в показателях +/-, а значение «+5» будет означать, что присутствие игрока на паркете помогает команде набирать на пять очков больше за 100 владений, чем если на его месте будет играть среднестатистический баскетболист. Однако у новых подходов было одно очень важно отличие от PER: они вовсе не использовали информацию из бокс-скора.

Это звучит контринтуитивно, но это так — для вычисления «продвинутых» показателей +/- не требуется информация вроде набранных очков, взятых подборов или даже процента реализации. Вместо этого используются, прежде всего, данные об изменении счета, совмещенные с множеством переменных в виде других игроков, которые находятся на паркете в каждый конкретный момент.

Поскольку такой подсчет в самой своей основе является относительным, для получения наиболее корректных результатов необходима большая выборка. По сути, для максимальной репрезентации нужно оценить каждую возможную комбинацию игроков НБА на паркете и посмотреть, как они взаимодействуют между собой, чего, естественно, добиться нельзя. Соответственно, чем меньше выборка, тем больше каждое отдельное владение влияет на итоговый результат. В первоначальных версиях подобной статистики (получивших название APM — Adjusted Plus-Minus, по-русски: Откорректированный плюс-минус) для адекватной оценки было недостаточно даже данных одного сезона, не говоря уже о его части. Для правильной оценки полезности игрока требовалось подключать информацию из прошлых сезонов, и все равно прогностическая функция у такого критерия хромала.

Однако сдаваться никто не собирался — слишком велик был соблазн пересчитать +/- каждого баскетболиста безотносительно того, с кем он играл. Потому публике были представлены две эволюции этого показателя: RAPM и RPM. RAPM означал Regularized Adjusted Plus-Minus (в переводе: Отрегулированный откорректированный плюс-минус) и с помощью «метода регуляризации Тихонова» исправлял главный недостаток своего предшественника — требование огромной выборки. Однако и это был не конец превращений.

Подключив Джеремайаса Энгельманна, работавшего в аналитическом отделе Финикс Санс, ESPN сделали следующий шаг в эволюции модифицированной статистики. В апреле 2014 года сайт представил новый показатель, получивший название RPM — Real Plus-Minus, или, в переводе на русский, «Реальный плюс-минус». Построенный на основе предшественника RAPM и дополненный формулами Энгельманна, новый критерий обещает еще лучшую репрезентативность, способную корректно оценить (и, главное, предсказать) полезность игрока даже по небольшой выборке. Так, вот здесь все желающие могут проследить за рейтингами игроков в текущем чемпионате, которые обновляются каждый день, испытывая при этом ощутимые изменения (кроме, разумеется, первой строчки, где безраздельно царит Стеф Карри).

Стеф Карри пока что лучший игрок чемпионата по всем "углубленным" критериям, фото Getty Images
Стеф Карри пока что лучший игрок чемпионата по всем «продвинутым» критериям, фото Getty Images

Другим отличием новых критериев по сравнению с PER является их «закрытость». Если формула, которая считала рейтинг эффективности, предложенный Холлинджером, доступна каждому желающему, то узнать RPM можно только с сайта ESPN и только в готовом виде. Главным компонентом такой секретности является эксклюзивность показателя: ESPN заплатили за его разработку человеку, который раньше занимался подобным для клубов НБА, и не собираются делиться этой информацией со всем миром. Другим компонентом является, конечно, сложность вычисления, для которого необходимы не только секретные алгоритмы, но и входные данные, которые невозможно получить обывателю.

По сути, как PER в свое время свел все показатели бокс-скора к одному числу для более легкой оценки общего вклада игрока, так и RPM сейчас делает подобное, но уже с показателями +/- и on/off (на паркете/на скамейке), игнорируя традиционную статистику.

На данный момент RPM, несмотря на все свои абстракции, является показателем, который ближе всех, из тех, что предлагаются на данный момент, походит на желанное Число. Он не идеален, а его отдаленность от привычных показателей и закрытость не способствуют возникновению доверия к нему людей, привыкших полагаться на очки и подборы в качестве основных критериев оценки эффективности.

Тем не менее, попытка свести все многообразие баскетбола к одному числу всегда будет приводить к упрощению и обобщению, и RPM — не хуже любой другой подобной попытки. И тот факт, что, согласно его показателям, Клэй Томпсон является седьмым среди игроков своей команды, уступая Карри, Грину, Эзели, Игуодале, Богуту и Барнсу, лишь доказывает если не тщетность, то как минимум ограниченность таких попыток.

Главное, это помнить, что полная картина состоит из множества мазков, и, насколько бы ни был совершенным один из них (а RPM, несмотря на все старания, далек от такого эпитета), он всего лишь один из многих, рисующих полотно баскетбола.

Никита Тищенко, Sport Arena

Добавить комментарий
Сейчас обсуждают
Войдите, используя аккаунт
социальных сетей:
Или аккаунт Sportarena
Регистрация на Sportarena
Восстановление пароля на Sportarena
Спасибо за регистрацию!

На ваш e-mail отправлено письмо с логином и паролем чтобы вы их не забыли.
Мы отправили письмо на ваш e-mail с логином и паролем. Проверьте свой почтовый ящик, пожалуйста.
Внимание

Изображение
Выбрать файл
Добавить цитату
Внимание

Вы уверены, что хотите удалить этот комментарий?

Внимание

Вы уверены, что хотите удалить все комментарии пользователя?

Внимание

Вы уверены, что хотите отклонить комментарий пользователя?

Внимание

Вы уверены, что хотите переместить комментарий пользователя в спам?

Внимание

Вы уверены, что хотите переместить комментарий пользователя в корзину?