Show Notes: 1×02 El trabajo del Sabermetrico

Extracto

En este episodio doy mi opinión acerca de cuales deben ser las labores que desarrolla un Sabermetrico y cómo perfil empata con el del Científico e Ingeniero de Datos. Así mismo, doy mi opinión acerca de cómo deben estar conformados los equipos de analítica, por medio de un ejemplo de la vida real.

Otros Recursos

Script

La Labor del Sabermetrico 

Basado en mi experiencia, yo creo que el sabermetrico debe además de tener conocimiento acerca del contexto en el que se está trabajando ( es decir, béisbol )  debe tener bases ya sea científicas ( específicamente tener conocimientos sólidos en investigación y análisis cuantitativo ) y/o tecnológicas( específicamente en programación y procesamiento de datos ).

A qué me refiero a que el analista debe tener conocimiento del contexto. Bueno pues que, debe conocer al menos un poco acerca del juego o que debe tener una idea de cómo medir jugadores. O se imaginan un sabermetrico que intente medir la habilidad de bateo de un jugador con goles o rebotes o hoyos en uno. No tiene sentido. 

Sin embargo, un sabermetrico no solo debe conocer el juego, sino que también estar al dia de lo que ocurre tal vez de cambios en el reglamento, transacciones, rosters, en fin, el sabermetrico debe tener cierto conocimiento de lo que está ocurriendo dentro y fuera del juego.  Ami me gusta pensar que durante una temporada, ni el juego ni el rival es el mismo que fue el dia de ayer.

Además, considero que el sabermetrico debe saber llevar a cabo sus investigaciones o experimentos de manera apropiada. Es decir, el sabermetrico debe saber formular una hipótesis, recolectar datos, realizar e idear nuevas maneras hacer mediciones, llevar a cabo algunas pruebas, sacar conclusiones y  saber comunicar sus resultados o hacer recomendaciones. 

Personalmente, creo que los sabermetricos no deben ser visto como personas que que comen y cagan zurran números, sino como personas que siguen un proceso creativo-científico a fin de de comprender y explicar un fenómeno o supuesto del Béisbol. De hecho, desde mi punto de vista, el objetivo de la Sabermetrico no es el de derivar fórmulas incomprensibles o generar reportes con cientos de miles de números. El principal trabajo del sabermetrico es dar explicaciones, hacer conclusiones, o dar recomendaciones de una manera fácil y digerible  a personas que no están a su mismo nivel de conocimiento analitco, por ejemplo managers, jugadores, gerentes, periodistas que se yo.

No quiero que se mal entienda, obviamente el trabajo del sabermetrico conlleva realizar tareas que requieran conocimiento profundo análisis cuantitativo, eso es seguro. Sin análisis numérico probablemente no podríamos sacar conclusiones o dar recomendaciones fiables. Sin embargo la parte del análisis cuantitativo, en mi humilde opinión, debe ser vista, si como una herramienta importante, pero también como una herramienta que nos ayudará a alcanzar un propósito: Interpretar, describir, justificar, o aclarar un asunto.

Bien, ahora desde el punto de vista tecnológico o computacional o incluso ingenieril creo que el sabermetrico debe saber utilizar la gama de herramientas tecnológicas que nos permitan realizar más y mejores investigaciones. Con esto me refiero a bases de datos donde podamos alojar y acceder datos relacionados a lo que deseamos analizar. También a utilizar distintos lenguajes de programación que nos faciliten comprender aspectos de un conjunto de datos ( ya sea por análisis estadístico, visualizaciones, predicciones ) e incluso cuestiones como simulaciones.

Por otro lado también debemos entender que la tecnología nos permite automatizar trabajos manuales que por lo regular son tediosos y propensos a errores humanos para concentrarnos en lo que realmente importa: Desarrollar más y mejores explicaciones.

Dicho lo anterior creo que la labor del sabermetrico es parecida a lo que se conoce en e el ramo tecnológico a como un científico de datos ( en inglés data scientist ) o ingeniero de datos ( data engineer ).

El Científico de Datos

Un científico de datos es alguien que sabe cómo adquirir conocimiento a través de la interpretación de datos, por medio de métodos herramientas estadísticas, de matemáticas aplicada,  de ingeniería de software etc. Es una persona que pasa gran parte de su tiempo limpiando y analizando datos, realizando experimentos, creando visualizaciones, modelos y algoritmos que puedan explicar un tema. Es una persona que es crucial en el proceso de decisiones basadas en información.

Además, el científico de datos se comunica en un lenguaje claro para que, incluso sus colegas ( que pueden no estar inmersos en la data ) puedan comprender lo que está ocurriendo en cierto tema, de acuerdo a la información que se tenga a la mano.

El Ingeniero de Datos.

Un ingeniero de datos es alguien que crea canales por los cuales un sistema puede ingerir información. Es decir, son ingenieros de software, que diariamente diseñan, construyen e integran datos que provienen de diferentes fuentes a fin de tener un sistema de fácil acceso del cual se puedan obtener los conocimientos analiticos que se deseen. De la misma manera que el Científico de datos, el Ingeniero, pasa gran parte de su tiempo limpiando, analizando datos y visualizando datos, con el objetivo de tener una fuente de información fiable y para implementar proyectos de analitica que tengan un enfoque de gestión de datos.

Científico de Datos vs Ingeniero de Datos:

Los Científicos e Ingenieros de datos tienen mucho en común en cuanto a habilidades y responsabilidades se refiere.  La principal diferencia diría yo es que los ingenieros de datos se centran en construir infraestructura para la gestión de datos. En contraste, los científicos de datos se centran en las matemáticas avanzadas y el análisis estadístico para llevar a cabo investigaciones sobre los datos gestionados por el ingeniero de datos.

Los equipos de Analitica

De una manera personal yo puedo decir que me considero analista, sin embargo, siento que mi área de expertise se encuentra en el lado computacional. Específicamente en el procesamiento de datos y todo lo que conlleva. De hecho yo trabajo como Ingeniero de de datos para sobrevivir. 

En el mundo de la Sabermetría, yo me centro en la gestión de datos de béisbol, reportando errores en los datos a la MLB, calculando métricas, y haciendo análisis básicos acerca de diferentes aspectos de béisbol. 

Por cierto algo que me parece curioso, es que yo personalmente, jamás  he visto una posicion de analitica en la MLB que diga que buscan Sabermetrico. Por lo lo general lo que buscan son perfiles de Ingeniería y Ciencia de Datos. Obviamente piden algún tipo de conocimiento beisbolistico y enlistan la palabras sabermetría en la descripción del trabajo. Pero lo que realmente buscan es una persona que pueda ya sea realizar análisis cuantitativo  o con conocimiento en manejo de grandes volúmenes de datos

Ahora bien, estas habilidades se complementan una a la otra y siendo sinceros no podemos esperar a que un analista realice todas estas funciones. Desde mi punto de vista es demasiado difícil sino imposible el encontrar talento que sea experto en estas dos áreas. Un sabermetrico debido a su formación personal y/o profesional puede tener mayor expertise en un área que en la otra. 

Si fuesemos crear un equipo de analitica para un equipo de beisbol ( y supongo que asi hacen los equipos de MLB ) lo conformariamos por personas que tengan ya sea un perfil relacionado al área numérica, tecnológica y obviamente de béisbol. Explicare porque con un ejemplo de la vida real:

Supongamos que un investigador está considerando en crear una nueva métrica que piensa que puede medir x habilidad que métricas actuales no hacen. Ahora supongamos que tal analista tiene una idea general de qué datos utilizar y no tiene conocimientos técnicos muy profundos. Hace un diseño general de cómo luciría una métrica y solicita retroalimentación a otros analistas. Un analista con conocimientos técnicos de gestión de datos podría mejorar el trabajo del primer analista al sugerir datos que el sabe que están disponibles y que no están contemplados por el diseño inicial.

Ahora bien supongamos que se lleva a cabo la investigación inicial y se observa que ha dado frutos. Muy probablemente el equipo de analistas va a querer que tal métrica se calcule partido con partido o temporada a temporada, de manera automática para que en un futuro sea más sencillo evaluar jugadores.

Desde mi punto de vista formar equipos o departamento de analitica en donde lo que prolifera son la diversidad de habilidades, desde mi punto de vista resolverá más y mejores retos. Esto ya que el abordar un problema desde diferentes perspectivas puede dar mejores resultados.

Por último me gustaría decir que no porque tu seas un investigador no significa que no deba aprender a extraer o limpiar datos o no significa que no deba saber programar. O que un analista tecnológico no deba saber conceptos basicos de estadistica. Como platique las habilidades de DE y DS difieren mucho pero también empatan. Por esto creo que los miembros de un departamento de analitica deben siempre tener en mente la auto superación y desarrollar sus  habilidades científicas, tecnológicas y de trabajo.

Deja un comentario