El mítico entrenador alemán Otto Rehhagel alguna vez acuño una frase de esas que hacen historia. Dijo Rehhagel: “el dinero no mete los goles”. Con esa máxima se mofaba de los elevados precios pagados por algunos clubs para adquirir futbolistas de renombre. Y para demostrar que lo que importaba era la calidad del equipo en su conjunto y no las individualidades, transformó en 2004 a la modesta selección de futbol griega en el campeón de Europa. Desde entonces rara vez se le ve en Alemania, debe habitar el Olimpo.
Por eso, el dinero quizás no anote goles, pero la computadora sí que lo hace. Me refiero al hecho de que diversas casas de “football analytics” han creado un nuevo concepto para poder cuantificar las oportunidades creadas por un equipo durante un encuentro, aunque no hayan caído goles. Se trata del concepto de los “goles esperados”, o xG, como se dice, el acrónimo de las palabras inglesas “expected goal”.
El dinero quizás no anote goles, pero la computadora sí que lo hace.
Es fácil explicar que significa que un equipo haya tenido 3.5 goles esperados en un partido, aunque solo haya anotado 1. Obviamente, los goles anotados son aquellos que suben al marcador. Pero a veces un jugador se encuentra frente a la portería, en el límite del área, y en las últimas cien oportunidades que han tenido jugadores precisamente desde esa posición, el 70% ha anotado un gol. Si en esta ocasión el jugador vuela el disparo, anota cero goles, pero la estadística registra que ha acumulado 0.7 xG. Si el mismo jugador vuelve a intervenir desde la esquina del área penal, desde donde el 20% de los disparos son gol, acumula entonces ya 0.7+0.2 xG. Si así termina el partido, sin que anote, se puede decir que tuvo 0.9 xG y cero goles realmente anotados.
Esos es todo. Si un jugador termina un partido con 3.5 xG y ninguno anotado, quiere decir que desperdició grandes oportunidades. Si termina con 1.5 xG y tres goles anotados, eso quiere decir que su desempeño fue mucho mejor al esperado dada la calidad de las oportunidades que tuvo. El jugador “se creció”.
Un ejemplo extremo sería un jugador que desde la media cancha anota un gol. Desde esa distancia se esperaría que el gol solo entrara el 1% de las veces. Pero ese jugador ha transformado una oportunidad de 0.01 goles en 1.0 goles. Excede las expectativas por mucho.
Este cálculo se ha hecho para Lionel Messi y Cristiano Ronaldo, los dos mejores jugadores de los últimos 15 años, para juegos de liga. Entre las temporadas 14/15 y 22/23 Messi tuvo 219.91 xG y 253 goles efectivos. Cristiano Ronaldo tuvo 229.38 xG y 234 goles efectivos. Las estadísticas son similares y, sin embargo, muestran que Messi aprovecha mejor que Cristiano las oportunidades que obtiene. Anota desde posiciones en las que otros jugadores rara vez hacen un gol.
El problema en todo esto es que para calcular los goles esperados hay que tener computadoras que vayan rastreando a los jugadores individualmente sobre el terreno de juego y que registren los disparos hacia gol (o los “casi disparos”, si el jugador llega una centésima de segundo tarde a la pelota). A cada disparo o gran oportunidad se le asigna un valor xG obtenido de la base de datos de todos los partidos en donde se ha dado una jugada desde esa posición. Solo hay que cuadricular el campo de juego y anotar en cada cuadro (de 2 por 2 metros, por ejemplo) cuantos disparos a gol son exitosos. Ese porcentaje es el valor xG asociado con una posición en el campo.
Así se hacía al principio del desarrollo de la técnica xG. De hecho las anotaciones se hacían después de los partidos, viendo videos y capturando anotaciones manuales. Las primeras compañías que desarrollaron este mercado de datos contrataban estudiantes para revisar los videos de los juegos, anotar los tiros a gol y la posición, y crear la base de datos. Con ella se podía después de un juego hacer el cálculo de xGs, también manualmente, para vender esta información a los diarios y revistas, o a los equipos mismos.
Fig. 1: Un experimento en la computadora con diferentes parámetros para un tiro a gol1
El valor de xG de algunos jugadores le servía a los scouts para identificar jugadores en equipos de los niveles inferiores que sobrepasaban expectativas, como en el caso mencionado de Lionel Messi. Fue el inicio en el futbol de lo que en beisbol siempre ha tenido mucha tradición, data analytics que es ahora soccermetrics. Uno de los pioneros en ese campo fue el equipo inglés Brentford que de esta manera logro ascender hasta la Premier League y pudo siempre comprar jugadores subvaluados para venderlos más caros después de haberlos desarrollado. La historia de este equipo y su exitoso uso de la ciencia de datos ha quedado documentada2.
El equipo inglés Brentford abrió camino al éxito aplicando ciencia de datos en el futbol.
Actualmente ya los cálculos XG se hacen en tiempo real, utilizando visión computacional (véase el experimento en la Fig. 1). Además, se considera ya no solo la posición en el campo sino otros parámetros, como explica la compañía Opta en sus documentos3. Opta ha acumulado más de un millón de tiros a gol y utiliza las siguientes variables para clasificarlos:
- Distancia a gol
- Ángulo al gol
- Posición del portero, para calcular si tiene oportunidad de detener el tiro
- La visibilidad del marco desde la perspectiva del anotador, tomando en cuenta la posición de otros jugadores
- La presión que recibe el jugador de los defensas
- Tipo de tiro; con el pie, la cabeza, de volea, etc.
- Contexto (e.g., juego abierto, contrataque, tiro directo, tiro de esquina).
- Tipo de asistencia (pelota filtrada, pase de un lateral, etc.)
La calidad del cálculo xG depende de manera crucial de la cantidad de información recopilada y de la calidad de los datos recabados en tiempo real. Si la visión computacional proporciona errores con gran margen de error, o incompletos, sufre el cálculo de los goles esperados. Aunque la verdad es que es muy difícil darse cuenta, porque las compañías como Opta proporcionan al final un número xG que es difícil de certificar de manera independiente.
Es por eso que compañías más pobres de data analytics hacen algo más sencillo: tienen expertos observando los juegos y cada vez que hay un tiro a gol, ellos mismos califican el tiro asignándole una probabilidad de anotación. Es decir, si yo soy el experto, después de ver un tiro a gol, decido por mi cuenta si era una oportunidad de 50%, de 80% o de 99%. Lo tecleo en una hoja de cálculo et voila, al final del juego mi startup de data analytics puede competir con Opta proporcionando xGs por jugador y por equipo completo. Y si lo quiero hacer más preciso y verosímil, contrato 20 personas para hacer lo mismo durante el juego y poder calcular los promedios de sus evaluaciones.
Pero obviamente el sagrado Grial de todo esto es que la computadora se sumerja por sí misma en el juego, propulsada por las botas aladas de la IA, y simule lo que está ocurriendo en la computadora. Jugadores virtuales se desplazan entonces sobre el campo de juego de la pantalla y disparan a gol anticipando los movimientos de la defensa, del arquero, es decir toda la coreografía del ballet defensivo. Y cuando la computadora se replica y juega la misma situación cien veces, en las cuales anota 60, entonces sabremos que la oportunidad era de 0.6 xGs, pero que otra vez el jugador más caro del equipo acaba de fallar. Termina con 0 goles anotados, pero es coronado por la computadora con 0.6 xGs.
Y como la computadora no se cansa de jugar, lo mismo puede hacer para calcular “asistencias esperadas” (llamadas xA), que son los pases previos a un disparo que termina en gol. O para el portero puede calcular “atajos esperados” o para un defensa “tarjetas amarillas esperadas”, etc. El único límite es la imaginación de las compañías de soccermetrics.
Quizás algún día ocurra como con el ajedrez. Una computadora podría dar por terminado un juego de ajedrez entre humanos después del doceavo movimiento, porque ya sabría que no hay ningún camino que impida que las piezas negras puedan evitar la derrota, si las blancas juegan de manera óptima. Así en futbol: el VAR anunciará en el minuto 15 que, dado lo ya visto hoy, mil simulaciones del juego dan por vencedor al Barcelona sobre el Real Madrid, por 3.1 contra 2.3 xGs. Y el público aplaudirá satisfecho.
- H.P.H. Eggels, Expected goals in soccer: explaining match results using predictive analytics, Master Thesis, TU Eindhoven, 2016. ↩︎
- J. Tippett, The Expected Goals Philosophy: A Game-Changing Way of Analysing Football, Independently published, 2019. ↩︎
- Opta, “Expected Goals Explainer”, https://theanalyst.com/articles/what-is-expected-goals-xg. ↩︎