Expectativa de Carrera I: Calculando la Matriz de Expectativa de Carrera.

Introducción

En esta serie de posts vamos a aprender a calcular desde la matriz de expectativa de carrera hasta el wOBA. Para llevar estos cálculos, aplicaremos un enfoque parecido al que utilizo por Tom Tango en su libro The Book y usaremos ademas distintos conjuntos de datos que he creado para la diferentes ligas de beisbol invernales. Así mismo, debo recalcar que en esta serie de posts nos enfocaremos en aprender los conceptos por medio de programación y no por medio de la teoría.

Play by play dataset

He creado un conjunto de datos que contiene información jugada a jugada para cada partido llevado a cabo en distintas temporadas de distintas ligas invernales. El dataset es en su gran mayoría preciso, sin embargo, no descarto que existan jugadas atípicas para las cuales guarde información incorrecta. No obstante, tales jugadas no deberían afectar nuestros cálculos en gran medida.

El conjunto de datos tiene múltiples variables que explican el entorno en el que se llevó a cabo una jugada. Entre tales variables estas podemos destacar:

  • El numero de outs registrados antes de la jugada.
  • El numero de outs efectuados durante la jugada.
  • El numero de outs efectuados después de la jugada.
  • Los corredores en base al iniciar la jugada.
  • Los corredores en base al terminar la jugada.
  • Las carreras anotadas antes de la jugada.
  • Las carreras anotadas durante la jugada.
  • Las carreras anotadas después de la jugada.
  • Las carreras anotadas durante la mitad inning.

Matriz de Expectativa de Carrera en Python

En esta ocasión vamos a calcular la Matriz Expectativa de Carrera para la temporada 2018-2019 de la LIDOM. Para calcular dicha matriz vamos a utilizar pandas, un paquete de Python que facilita la manipulación y análisis de datos, así que si no lo has descargado, por favor hazlo antes de correr el siguiente código.

Ahora bien, si ya descargaste el código y no entiendes mucho de programación, no te preocupes acá te explico linea por línea lo que hace esta lógica: en la línea 1 importamos pandas y en la línea 3 leemos el dataset que creé; en las líneas 14 a 27 hacemos el procesamiento para obtener la expectativa de carrera; en la 15 obtenemos las carreras al final del inning para cada registro del conjunto de datos; en la 16 agrupamos el dataset por cada situación base-out; en la 17 contamos el numero de veces que ocurrió cada situación y el numero de carreras que entraron después de ocurridas y hasta el final del inning; en la línea 21 simplemente dividimos la suma total de carreras de cada base-out entre sus ocurrencias; las 22 a 26 no tienen importancia por ahora; por último la linea 29 imprime la expectativa de carrera:

Tal y como puedes notar, la matriz de expectativa de carrera no se encuentra en el formato y orden en el que la mayoría de autores acostumbran a presentarla. Sin embargo la dejaré así ya que desde el punto de vista computacional es más fácil calcular el wOBA si la dejamos así.

2 comentarios en “Expectativa de Carrera I: Calculando la Matriz de Expectativa de Carrera.

Deja un comentario