miércoles, 27 de junio de 2007

Comparar, comparar y comparar

Los sabermetrics son ideas surgidas del sentido común.

Tradicionalmente el béisbol ha establecido como una regla de comparación que el buen bateador es aquel cuyo promedio es igual o superior a .300 sin mayor explicación del porque de este valor. La idea de esta comparación es correcta mas la forma es inadecuada.

Comparar es una forma de buscar mejorar y esa es una de las premisas del “benchmark” pero para ello debemos comparar con cosas iguales o parecidas a lo que queremos evaluar surgidas sobre valores reales. En sabermetrics abundan los conceptos basados en comparaciones.

El OPS nació a principios de la década de los 80 cuando John Thorn y Peter Palmer propusieron establecer una valor que expresara en un solo numero al porcentaje de embasado y al slugging, por lo que decidieron simplemente sumarlos. Su intención era expresar de alguna forma el “calibre” de un bateador ya que la suma de ambos promedios formaba rangos perfectamente demarcadles en forma parecida a como se hace individualmente con ellos..

Sin embargo el siguiente paso estaba en comparar el valor del OPS de cada jugador con el valor del OPS de resto de los jugadores, o sea la media de la Liga.

Así nació la idea del OPS+, que es el valor resultante de sumar la diferencia porcentual individual de cada componente del OPS con respecto a la media de cada una de estas dos estadísticas de la Liga y pretende servir de rango comparativo con la suma de los promedios de la Liga, los cuales son representados con el valor 100.

Un jugador con 100 OPS+ es básicamente un jugador average, ni mejor ni peor que el promedio de la Liga pues la suma de las diferencias porcentuales de su OBP y su SLG es básicamente 0.

Si crear carreras depende de estar en base mas tiempo y alcanzar mas bases con las conexiones entonces al comparar estos promedios con la media de la Liga que equivales a decir el promedio del resto de los jugadores que al menos tuvo una aparición al plato, pues entonces tendremos una idea del rendimiento de un jugador a nivel individual en comparación al resto de los jugadores de esa Liga.

Como siempre la invalorable pagina Baseball-Refernce.com presenta este calculo hecho en cada ficha de los jugadores, en una columna llamada OPS+, el cual ya esta ajustado al efecto del parque en que juega como homefield el equipo del jugador de manera de eliminar distorsiones tipo Coors Field.

Veamos un caso práctico de cómo se calcula:

Babe Ruth en su carrera tuvo un porcentaje de embasado de .474 mientras la media de la liga en las 22 temporadas en que el Babe jugó fue de .353, por lo que su promedio de embasado fue 34% mejor que el de la liga.

Por otra parte su slugging de por vida fue de .690 mientras la media de la liga fue de .400, lo cual significo que Ruth fue 73% mejor que la liga. La suma de ambos porcentajes da un valor de 107 el cual sumado al valor de un jugador promedio de la Liga (100) resulta en un valor de 207 OPS+.

Ruth es el OPS+ mas alto de la historia y el único superior al doble del al valor de un jugador promedio de la Liga. En otras palabras Ruth valía por dos jugadores!

Cuando se analiza un jugador se suele tomar el valor del OPS+ como una prueba inequívoca de verdadero valor y puesto que el número se mueve en escalas cuyo límite hasta el sol de hoy es Babe Ruth, es fácil demarcar los rangos más altos como una prueba de la grandeza del jugador.

Solo ocho jugadores han tenido un valor de OPS+ igual o mayor a 170 : Ted Williams (190), Barry Bonds (182), Lou Gerigh (179), Rogers Hornsby (172), Dan Brouthers y Joe Jackson (170) además del Babe. Hasta el año pasado Albert Pujols pertenecía a este club pero su actuación en la presente campaña al momento en que escribo esto lo ha disminuido en 1 punto y se encuentra en 169.

El OPS y el OPS+ son valores que pueden tomarse ciertamente para medir la calidad del jugador mas tienen dos limitaciones: intrínsecas a las formulas originales del obp y el slg: las cuales son que no incluyen el efecto de las bases robadas ni tampoco reflejan un ajuste por la diferencia de épocas en que jugó el pelotero.

La primera limitación solo es aplicable cuando la cantidad de bases robadas y la tasa de efectividad del corredor son altos y no terminan anulándose, ya que teóricamente cada base robada agrega una base alcanzada adicional a la cantidad de bases que se toman para el slugging pero cada out robando resta una vez en base al total usado en el calculo del porcentaje de embasado del bateador .

La segunda limitante es algo mas difusa y solo se vuelve un problema cuando dos épocas tuvieron condiciones de juego muy distintas. En ciertas épocas los bateadores han tenido facilidades para desarrollar mejores números ofensivos, tal como la década de los años 30 y 90 del siglo 20 mientras que en otras épocas, como los años 60 o la época de la bola muerta a principios del siglo 20 eran los lanzadores quienes se veían favorecidos. Igualmente desde la integración de color las Ligas subieron la calidad de la competencia por lo que existe cierto handicap en los OPS+ de jugadores de la segunda mitad del siglo 20 en adelante al compararlos con los de los primeros 70 u 80 años de historia.

Para normalizar hay que usar un resultante del número de carreras del año comparado con el número de carreras del año a comparar. Sin embargo muchas veces la normalización se suele obviar debido a que seria una constante variación al comparar varios jugadores a la vez, dejándose indicado que el OPS+ de jugadores de años de baja producción ofensiva, como los años 60 con jugadores tienen un aval en ese sentido sobre el OPS+ de jugadores de épocas de alta ofensiva, como la década de los 90.

Sin embargo para comparaciones de jugadores en una misma temporada el OPS+ es una gran herramienta.

En años recientes un señor llamado Lee Sinnins ha perfeccionado el propósito con el que se creo el valor OPS+ llevándolo a la formula de las carreras creadas, incluyendo ya el efecto neto de los robos de base. Sinnins creo una medida llamada Carreras Creadas por encima del promedio de la Liga ( o RCAA en función de las siglas en ingles, Runs Created Above Average) al cual le da valor 0. Así si un jugador que tenga 20 RCAA tiene mayor valor ofensivo que otro que solo tenga 10 RCAA.

Sinnins lleva la cuenta histórica de cada jugador que ha pasado por las mayores ( adivinen quien tiene el mayor valor de RCAA) y diariamente envía un email con el titulo de “Around The Majors” en el cual refleja los lideres de la temporada de ese renglón. Igualmente Sinnins creo un valor similar para medir a los pitchers llamadas Carreras Salvadas sobre el average de la liga (RSAA, Runs saved above average).

El VORP, Valor sobre un Jugador de Reemplazo (Value Over Reeplacement Player), es un valor expresado en carreras creadas aportadas por un jugador medido contra el rendimiento promedio de un jugador de una posición específica de liga menor si este tuviese que reemplazarlo al mínimo costo posible. Actualmente es muy usada debido a sus implicaciones económicas. Si la superestrella del equipo se lesiona y hay que reemplazarlo, el Vorp indicara que tantas carreras sobre un posible reemplazo de ligas menores tiene el jugador lesionado para esa posición específica.

Esta medición es calculada normalmente por la gente del site Baseball- Prospectus, quienes llevan los cálculos para cada posición y temporada.

En fin, una de las ideas de los sabermetrics es la comparación, pero comparar con sentido común usando promedios históricos de la liga y dándole un valor con el cual se puede hacer una evaluación mas justa del pelotero.

Por cierto si alguien me explica lo de batear .300 como benchmark tradicional para el average de bateo se lo agradecería.

No hay comentarios.: