Carreras y Porcentaje de Victorias I: Correlaciones.

Este post no intenta proporcionar una explicación teórica de lo que es la expectativa pitagórica, sino los trabajos de exploración que he iniciado para entenderla.


Todos damos por sentado que existe alguna relación entre las carreras( anotadas y permitidas ) y el porcentaje de victoria (W%). Despues de todo, las carreras son la moneda con la que se compran las victorias. No obstante, desconocemos que relación guardan( si es que guardan alguna).

En este post analizo la correlación ( es decir, la fuerza y la dirección lineal ) que existe entre las carreras y el porcentaje de victorias. Para hacer esto utilicé los datos de las temporadas 2015 a 2018 de la LIDOM. Estos datos tienen el acumulado de las carreras y el porcentaje de victoria para cada partido llevado a cabo en estas temporadas. Las variables que empleé para este ejercicio son:

  1. Carreras Permitidas ( RA )
  2. Carreras Anotadas ( RS )
  3. Diferencia de Carreras ( RS – RA )
  4. Carreras Anotadas sobre Carreras Permitidas ( RS / RA )
  5. Proporcion de Carreras Anotadas sobre el Total de Carreras ( RS / ( RS + RA ) ).

Observando el coeficiente de correlación y  la distribución de estas métricas con respecto al W% obtuve el siguiente gráfico. Tal y como se puede observar, la métrica que presenta la relación lineal mas fuerte con el W% es  RS / ( RS + RA ). Un punto importante a destacar es que RA y RS por si solas no tienen relación lineal alguna con W%. Sin embargo cuando se combinan( y mas aun, cuando se normalizan) es que se puede ver un incremento en la relación lineal entre RSRA y W%.

Rplot03

Otro aspecto que me parece importante senalar de este gráfico es la curvatura que presentan las ultimas dos métricas. Si bien la curvatura de la penúltima parece ser mas pronunciada, su coeficiente de correlación no es muy diferente al de la ultima. En fin, intentare ver si puedo hacer un modelo de regresión lineal capaz de predecir el W% basado en estas dos últimas métricas.

Deja un comentario