Carreras y Porcentaje de Victorias III: Exponentes para la fórmula de Expectativa Pitagórica.

Este post no intenta proporcionar una explicación teórica de lo que es la expectativa pitagórica, sino los trabajos de exploración que he iniciado para entenderla.


En mis intentos de entender como las carreras( anotados y recibidas ) de un equipo pueden explicar( o en su defecto, predecir ) su porcentaje de victorias, decidí probar la forma simplificada de la Expectativa Pitagórica de Bill James sobre los datos que poseo para las temporadas 2015 a 2018 de la Liga de Béisbol Profesional de la República Dominicana(LIDOM).

Expectativa Pitagórica de Bill James

En un principio Bill James propuso que el exponente al cual deberían estar elevadas las carreras debería estar próximo a 2. Para comprobar si esto es cierto vamos a analizar el comportamiento de la raíz del error cuadrático medio(RMSE) del porcentaje de victorias(W/L) con respecto a las carreras(RS/RA) para diferentes exponentes. De este modo, fijando el rango del exponente 0 a 2 obtenemos el siguiente gráfico y comprobamos que el exponente que mejor predice el porcentaje de victorias para este conjunto de datos es 1.743:

Webp.net-gifmaker

Expectativa Pitagórica de David Smyth

Tiempo después David Smyth propuso que el exponente al que deberían estar elevadas las carreras debería ser:
Screen Shot 2019-12-24 at 11.18.09 AM.png

Al mismo tiempo Smyth sugirió que n debería ser igual a .287. Para comprobar lo que dice Smyth fijamos el rango de esta variable de 0 a 0.35. Graficamos los resultados y comprobamos que el exponente que mejor predice el porcentaje de victorias para este conjunto de datos es de 0.281:

Webp.net-gifmaker (2)

Asi, comprobamos los exponentes propuestos por ambos autores.

Deja un comentario