Las Sabermetrics han cambiado la forma que tenemos de entender el juego, y si uno no se adentra en este mundo difícilmente podrá comprender el béisbol.
Si buscamos la definición de Sabermetrics en Wikipedia encontraremos:
«Es el análisis empírico del béisbol, especialmente basado en las estadísticas recogidas durante los partidos. Los sabermétricos recogen y recopilan los datos relevantes que se producen durante un partido para responder preguntas específicas. El término deriva del acrónimo SABR (Society for American Baseball Research), fundada en 1971. La palabra Sabermetrics fue acuñada por Bill James, que es uno de los pioneros en este campo, y es considerado la cara visible del movimiento.»
Primer paso, recoger los datos durante los partidos. Con cada jugador que aparece en el plato ocurre algo: eliminado por strike, base por bolas, bola golpeada y corredor eliminado, Hit y llega a primera base, Home Run… Durante el turno del bateador también hay diferentes opciones: base robada, pitcheo salvaje… Y se combinan varias acciones, un hit, el jugador llega a primera base, error del Outfielder derecho, el jugador de segunda pasa a tercera y el de tercera anota. Si vas para matrícula hasta puedes anotar el tipo de lanzamiento del pitcher, y si es bola, hit o Strike. Pues toda esa información la tenemos, de todos los partidos de la MLB, durante toda su historia, sí, tenemos la información de más de 100 años de historia de las Mayores. Los datos que se iban recogiendo, por ejemplo, al principio no se recogía el número de Bases por Bolas intencionadas, sólo se recogían las Bases por Bolas, pero la mayoría de estadísticas están, por eso podemos comparar lo que hacía Babe Ruth con lo que ahora hace Mike Trout. Y todo eso lo tenemos en dos páginas imprescindibles para cualquiera que se interese por el mundo de las Sabermetrics:
–Baseball Reference: Compendio de todas las estadísticas de la historia de este deporte, la página es gratuita, pero su parte más interesante es de pago, «Play Index«, en esta sección puedes preguntar lo que quieras sobre jugadores y equipos. ¿Que equipo del Siglo XXI ha conseguido anotar más Home Runs en partidos consecutivos? Los Rangers en el 2002, durante 27 partidos consecutivos consiguieron Vuelacercas, ganaron 17 partidos y perdieron 10. ¿En qué temporada un jugador ha conseguido más carreras en el Siglo XXI? Jeff Bagwell con 152 en el año 2000.
–Fangraphs: Estadísticas de todos los jugadores y partidos, totalmente gratuita -hay la opción de colaborar con 20 dólares al año para mantener la página-. Tiene artículos y también un gran apartado de estadística, «Fangraphs Stats«. A diferencia de la anterior también nos da las proyecciones de los jugadores para la temporada siguiente. ¿Qué jugador ha conseguido más carreras en el Siglo XXI? Albert Pujols con 1720. Ambas páginas cuentan con estadísticas avanzadas.
Guardáis estas dos páginas en favoritos y ya podemos continuar.
Ahora ya tenemos los datos. Pero como vemos en las páginas no nos hablan sólo de carreras o Home Runs conseguidos, también aparecen otras anotaciones: AVG, OBP, K%… Y todo esto, ¿qué es? Pues no es nada más que la combinación de todos los datos que recogemos durante el partido. Y esto es lo que explicaremos durante esta serie en la que hablaremos del increíble mundo de las Sabermetrics, de calcular las estadísticas más sencillas a las más complejas.
Porque estas combinaciones de factores no están elegidos al azar, todos responden a alguna pregunta, porque lo más importante -y lo complejo- del Universo de Sabermetrics es saber hacer las preguntas correctas, no consiste en ir sumando, dividiendo o multiplicando números, debemos saber lo que buscamos y el saber interpretar lo que tenemos. En eso consiste el arte del Sabermetrics.
Todas las franquicias tienen los mismos datos de los jugadores, en un partido ocurre lo que ocurre, todo está escrito, entonces, ¿porqué un equipo sabe que tiene que fichar a Chris Sale y otros no lo ven como una acción prioritaria? Todos tienen los mismos números, pero la manera de combinarlos es lo que marca la diferencia. La diferencia estriba, no en tener los datos -están a disposición de todos-, si no saber cómo sacarles un gran rendimiento. Y eso, ¿cómo se hace? Haciendo las preguntas correctas, y a partir de eso buscar la respuesta, nunca al revés, nunca.
En este vídeo de «Moneyball» explican este concepto de forma magistral. Comprar Victorias, Comprar Carreras, Piensan de Forma Medieval, No aciertan con las Preguntas que Hacen, Eres un Marciano, Una Ecuación, Predecir Rendimiento de Jugadores, Reducirlo a un solo Número, Valor que nadie más es capaz de ver, Prejuicios y Supuestos Defectos, Todo el Mundo los Infravalora.
Pongamos un ejemplo sencillo, tenemos dos jugadores de AAA, uno ha bateado esta temporada 20 Home Runs y otro 10. Si pensamos en términos absolutos, parece que el primer jugador es mejor, ha conseguido el doble de Home Runs, pero eso no nos sirve en béisbol, debemos preguntarnos como ha llegado hasta allí. Si vemos que el primer jugador sólo batea bolas rápidas y el segundo batea todo tipo de bolas, sabemos que con el primero tenemos un problema, cualquier otro tipo de lanzamiento no lo bateará, y cuando se encuentre con mejores pitchers no dará el nivel, mientras que el otro no tiene tanto poder, pero sabe ver todo tipo de bolas. La clave es preguntarse porque ocurren las cosas, y el paso siguiente es saber lo que tiene más probabilidades de ocurrir, no lo que ocurrirá exactamente, porque eso no lo sabe nadie.
Decálogo de Sabermetrics
–Realizar la pregunta correcta, la respuesta es cuantitativa o cualitativa.
–Tener todos los datos posibles, en las webs que os he mostrado está prácticamente todo, hay algunas más específicas sobre pitchers y sus lanzamientos o bateadores y donde batean mejor, pero ya hablaremos de ellas en otro artículo.
–Usar todas las fórmulas sabermétricas posibles para evaluar un jugador o un equipo, no todo se reduce a un solo número. Y para comparar es mejor porcentajes que números reales. El Average de un jugador es de .220 y el de otro .300, con un número similar de partidos es mejor hablar de que el segundo es un 36% en este apartado que 0.70 puntos, el concepto de porcentaje es más fácil de entender.
–No comparar manzanas con peras. Si comparamos un pitcher que juega la mayoría de sus partidos en un campo malo para los pitchers no es lo mismo que otro que juega en campos sencillos para pitchers. La dificultad muchas veces estriba en diferenciar las manzanas de las peras.
–Diferenciar lo conseguido de lo que va a conseguir el jugador. No una gran temporada significa que la siguiente sea buena, intervienen muchos otros factores.
–Regresión a la Media, no olvidar este concepto jamás. Las alteraciones de la media, tanto por arriba como por abajo, siempre vuelven a la normalidad.
–Tener en cuenta factores no sabermétricos para las evaluaciones, no se jugaba igual en los años 20 que en los 70.
–Siempre se pueden encontrar nuevas fórmulas, la mente abierta, siempre pueden descubrir nuevas estadísticas que nos pueden ser útiles.
–Sabermetrics no es sólo matemáticas, es aplicarlas para conocer mejor el juego.