Curso de Sabermetrics

Bienvenido al curso de sabermetrics que iremos desarrollando en «Pitcheos Salvajes«.  La Sabermetría tuvo unos inicios difíciles, como cualquier revolución en cualquier ámbito.  Fueron unos locos que empezaron a escribir sobre números y béisbol, pero pocos los escuchaban, hasta que todo explotó el año de los Athletics y Moneyball, antes eran los scouts de la vieja escuela los que con las estadísticas básicas y el «ojo clínico» de estos.  Se consideraba que el béisbol era un arte antes que una ciencia.  Algunos se regían por patrones como la buena presencia en el plato, ser más alto o más bajo, el tipo de swing…  Y todo puede tener su valor, y seguro que alguno tiene, pero conocer los resultados de ese swing es mejor para el equipo que ver la belleza del mismo.  Si uno quiere entender en un par de horas lo que significa todo este movimiento para el deporte no puede perderse la película de «Moneyball.»

El curso de Sabermetrics empezará por los conceptos básicos para ir poco a poco adentrándonos en las estadísticas más complejas, espero que lo disfrutéis, y cualquier duda que tengáis no dudéis en preguntarla.  Intentaremos aportar algo de luz a la ciencia que modernizó Bill James, y que se explica en diferentes webs como Fangraphs o Baseball Prospectus.  Para ver números de la MLB no hay mejor web que Baseball Reference.

Capítulos del Curso de Sabermetrics

1.- Sabermetrics, ¿qué es? : Introducción al mundo de las Sabermetrics.

2.-Estadísticas Ofensivas Tradicionales: BA (Media de Bateo), TB (Bases Totales), SLG (Slugging), OBP (On Base Percentage) y %SB (Porcentaje de Bases Robadas).

3.-Estadísticas Defensivas Tradicionales: ERA (Earned Run Average), WPCT (Porcentaje de Victorias), IPS (Innings Pitcheados desde el Inicio), Ratio K/BB (Ratio Strikeouts/Base por Bolas) y DP por Temporada (número de Dobles Eliminaciones por Temporada)

4.- Épocas del béisbol, no todas son iguales. Sabermetrics: No en todas las épocas del béisbol se ha jugado igual.  No son lo mismo las Grandes Ligas de 1920 que la liga actual.  Muchas cosas han cambiado, los jugadores no son iguales, la manera de jugar es diferente, los campos no son los mismos… Lo que buscamos es una herramienta para comparar jugadores de diferentes épocas, para intentar discernir cual tuvo mejores números durante su época.  Sólo lo podemos hacer de forma numérica, porque entrar en otros campos ya es un ejercicio de ficción.

5.- Park Factors, influencia de los estadiosNo todos los estadios de béisbol son iguales, cada uno tiene unas características propias que lo convierten en único.  No es lo mismo batear en el Yankee Stadium, 112 Home Runs en 2017 que en AT&T Park de San Francisco, 86 Home Runs en el mismo año.  O en el estadio de los Colorado Rockies, Coors Field, mejor estadio para los bateadores según la media de los últimos 5 años, que, en el Citi Field de los Mets, mejor estadio para los pitchers con la media de los últimos 5 años.  Y para ver la influencia de este aspecto tan particular en el juego tenemos una estadística, los Park Factors (la influencia de los estadios en las estadísticas del jugador).  Es fácil entender que es más sencillo batear en Colorado que en el campo de los Mets, pero queremos cuantificar esta dificultad, y es lo que intentaremos hacer aquí.

6.- Carreras Creadas.  Runs Created: Nuevo capítulo del curso de sabermetrics donde abordamos el concepto de Carreras Creadas (Runs Created en inglés, (RC)) fue desarrollado por Bill James.  El objetivo es saber el número de carreras que crea un jugador, independientemente de la producción de sus compañeros de equipo.

La primera fórmula que creo Bill James tenía en cuenta los hits que conseguía el jugador, las bases por bolas, los At Bats y las Bases Totales (TB).  Recordemos, las bases totales es una fórmula que nos da la importancia de cada hit que consigue cada bateador, el single vale 1, el doble vale el doble, el triple vale el triple y el Home Run el cuádruple.

7.- Win Shares, victorias que da un jugador: Capítulo del curso de Sabermetrics hablando de Win Shares, una estadística que intenta mostrarnos en un número la contribución del jugador a las victorias del equipo, porque en definitiva lo que cuenta es el número de partidos que gana el equipo, todo lo demás es residual, porque el juego va de eso, de ganar, no de lograr un MVP, no de llenar el estadio, no de conseguir más dinero, ni mejores contratos, ni de ser los más listos, esto va de conseguir la victoria final, llevarse las Series Mundiales, y esto lo consigue uno de treinta.

8.- Marginal Runs, Carreras Marginales: Junto al concepto de Win SharesBill James creó un nuevo concepto conocido como Marginal Runs -Carreras Marginales-, otra forma de predecir el récord de carreras del equipo, basado en el número de carreras conseguidas superior a la media y el número de carreras recibidas inferior a la media.  Las carreras las divide en dos categorías.

9.- Linear Weight, el peso de cada Jugada: En 1920, Ferdinand Cole Lane, empezó a estudiar el peso de cada uno de los Hits en la consecución de carreras en un partido de béisbol, lo llamó Linear Weight, el peso de cada jugada, y nos define la influencia de cada jugada en la consecución de carreras, y como sabemos el conseguir carreras nos da victorias.  “El béisbol piensa de forma prehistórica.  Tu objetivo no debería ser comprar jugadores. Tu objetivo debe ser comprar victorias. Para comprar victorias, debes comprar carreras.” (Moneyball).

El concepto es sencillo, ¿que probabilidades me da llegar a primera base de conseguir una carrera?  ¿Y si llego a segunda? ¿Y una base por bolas?  Por ejemplo, se vio que cuando los un equipo consigue un hit y llega a primera base, un 47% de las veces el equipo consigue una carrera. Sabiendo que una carrera vale 1, llegar a primera base tendrá un valor de 0,47 carreras. Cuando un jugador consigue un doble, en un 78% de las ocasiones se consigue una carrera, por tanto, un hit a segunda base tiene un valor de 0,78.  Y, ¿cuanto valdrá un Home Run?  Lo lógico sería pensar que 1, pero no, su valor es de 1,4.  El motivo, muchas veces un Vuelacercas se consigue con jugadores en base, por lo que nos da más de una carrera.  Explicamos este concepto en nuestro curso de Sabermetrics.

 

*Y si quieres practicar aquí hay algunos Problemas de Sabermetrics.

 

curso de sabermetrics moneyball brad pitt jonah hill