Retrosheet I : Descargando Data.

Retrosheet

El análisis moderno del béisbol se ha vuelto cada vez más sofisticado en la última década y una serie de nuevas categorías estadísticas se han vuelto de uso común entre locutores y escritores. Todos estos nuevos métodos requieren datos detallados jugada a jugada para los partidos actuales y varias organizaciones recopilan activamente esta información. A muchos fanáticos les gustaría comparar el rendimiento de los jugadores modernos con los de principios de este siglo, pero no han podido hacerlo ya que los datos nunca se han recopilado y organizado de manera sistemática. Por lo tanto, una organización, llamada Retrosheet, fue fundada en 1989 con el propósito de computarizar los detalles juego por juego de tantos partidos de ligas mayores anteriores a 1984 como sea posible.

El trabajo de Retrosheet tiene tres aspectos distintos. Primero está la recopilación de las cuentas del juego, que se han obtenido de varias fuentes. La mayor parte de la colección proviene de los equipos de las Grandes Ligas, que les han permitido hacer copias de sus cuentas jugada por jugada. Varios cronistas deportivos (la mayoría de ellos jubilados) han permitido que se hagan copias de sus boxscores. Además, los aficionados han donado copias de los juegos que anotaron en el parque o en sus propios boxscore en casa. La segunda actividad es la traducción de estos boxscores a un sistema unificado y moderno, lo cual es esencial ya que existe una extraordinaria variedad de sistemas de puntuación que se han utilizado. La actividad final es la digitalización.

Retrosheet ha tenido mucho éxito en la recopilación de datos de partidos con más de 100.000 actualmente disponibles. Un grupo de unos 100 voluntarios participa activamente en las operaciones de la organización. Sin embargo, la tarea que tienen por delante es enorme y siempre están buscando más voluntarios; cualquier ofrecimiento de ayuda es muy apreciado. Se invita a los fanáticos del béisbol interesados ​​en este esfuerzo histórico a ofrecer su ayuda voluntaria en la traducción y los esfuerzos de entrada, así como a poner a disposición copias de las cuentas de juegos que puedan tener.

El objetivo final de Retrosheet es hacer que esta información básica de juego por juego esté disponible públicamente para todos los investigadores interesados. La distribución de los datos jugada por jugada se realizará a través de este sitio web. 

Descargar Data de Retrosheet

Si deseas descargar data de Retrosheet aquí te dejo el script que es capaz de hacerlo. Para utilizarlo simplemente descárgalo en tu sistema operativo Linux favorito y ejecútalo tal y como se encuentra a continuación. El script descargará por separado archivos de temporada regular(archivos eve) y ficheros de post-temporada(archivos post).

Script:

#! /bin/bash
# Temporadas
from_season=${1}
to_season=${2}
# Constantes para descargar y procesar archivos de Rtrosheet
retrosheet_url="https://www.retrosheet.org/events/"
season_type_files="eve post"
# Para cada season
for s in $(seq ${from_season} ${to_season})
do
echo "Procesando temporada ${s}"
# Para cada season type
for t in ${season_type_files}
do
echo -e "\tProcesando ${t}"
echo -e "\t\tDescargando archivos"
wget ${retrosheet_url}${s}${t}.zip &> /dev/null
echo -e "\t\tDescomprimiendo archivos"
unzip ${s}${t}.zip &> /dev/null
echo -e "\t\tEjecutando Chadwick para Eventos"
cwevent -q -n -f 0-96 -x 0-60 -y ${s} ${s}*EV* > ${s}_${t}_events.csv 2> /dev/null
echo -e "\t\tEjecutando Chadwick para Partidos"
cwgame -q -n -f 0-83 -x 0-94 -y ${s} ${s}*EV* > ${s}_${t}_games.csv 2> /dev/null
echo -e "\t\tEjecutando Chadwick para Sustituciones"
cwsub -q -n -f 0-9 -y ${s} ${s}*EV* > ${s}_${t}_subs.csv 2> /dev/null
echo -e "\t\tLimpiando Archivos"
rm *EV*
rm *ROS*
rm *TEAM*
rm *.zip
done
done
view raw script.sh hosted with ❤ by GitHub

Ejecucion de Script:

./script.sh añoInicial añoFinal
./script.sh 1969 2019
view raw correrScript.txt hosted with ❤ by GitHub

Salida del script:

Procesando temporada 1969
Procesando eve
Descargando archivos
Descomprimiendo archivos
Ejecutando Chadwick para Eventos
Ejecutando Chadwick para Partidos
Ejecutando Chadwick para Sustituciones
Limpiando Directorio
Procesando post
Descargando archivos
Descomprimiendo archivos
Ejecutando Chadwick para Eventos
Ejecutando Chadwick para Partidos
Ejecutando Chadwick para Sustituciones
Limpiando Directorio
Procesando temporada 1970
Procesando eve
Descargando archivos
Descomprimiendo archivos
Ejecutando Chadwick para Eventos
Ejecutando Chadwick para Partidos
Ejecutando Chadwick para Sustituciones
Limpiando Directorio
Procesando post
Descargando archivos
Descomprimiendo archivos
Ejecutando Chadwick para Eventos
Ejecutando Chadwick para Partidos
Ejecutando Chadwick para Sustituciones
Limpiando Directorio
view raw salida.log hosted with ❤ by GitHub

Deja un comentario