miércoles, 27 de junio de 2007

Comparar, comparar y comparar

Los sabermetrics son ideas surgidas del sentido común.

Tradicionalmente el béisbol ha establecido como una regla de comparación que el buen bateador es aquel cuyo promedio es igual o superior a .300 sin mayor explicación del porque de este valor. La idea de esta comparación es correcta mas la forma es inadecuada.

Comparar es una forma de buscar mejorar y esa es una de las premisas del “benchmark” pero para ello debemos comparar con cosas iguales o parecidas a lo que queremos evaluar surgidas sobre valores reales. En sabermetrics abundan los conceptos basados en comparaciones.

El OPS nació a principios de la década de los 80 cuando John Thorn y Peter Palmer propusieron establecer una valor que expresara en un solo numero al porcentaje de embasado y al slugging, por lo que decidieron simplemente sumarlos. Su intención era expresar de alguna forma el “calibre” de un bateador ya que la suma de ambos promedios formaba rangos perfectamente demarcadles en forma parecida a como se hace individualmente con ellos..

Sin embargo el siguiente paso estaba en comparar el valor del OPS de cada jugador con el valor del OPS de resto de los jugadores, o sea la media de la Liga.

Así nació la idea del OPS+, que es el valor resultante de sumar la diferencia porcentual individual de cada componente del OPS con respecto a la media de cada una de estas dos estadísticas de la Liga y pretende servir de rango comparativo con la suma de los promedios de la Liga, los cuales son representados con el valor 100.

Un jugador con 100 OPS+ es básicamente un jugador average, ni mejor ni peor que el promedio de la Liga pues la suma de las diferencias porcentuales de su OBP y su SLG es básicamente 0.

Si crear carreras depende de estar en base mas tiempo y alcanzar mas bases con las conexiones entonces al comparar estos promedios con la media de la Liga que equivales a decir el promedio del resto de los jugadores que al menos tuvo una aparición al plato, pues entonces tendremos una idea del rendimiento de un jugador a nivel individual en comparación al resto de los jugadores de esa Liga.

Como siempre la invalorable pagina Baseball-Refernce.com presenta este calculo hecho en cada ficha de los jugadores, en una columna llamada OPS+, el cual ya esta ajustado al efecto del parque en que juega como homefield el equipo del jugador de manera de eliminar distorsiones tipo Coors Field.

Veamos un caso práctico de cómo se calcula:

Babe Ruth en su carrera tuvo un porcentaje de embasado de .474 mientras la media de la liga en las 22 temporadas en que el Babe jugó fue de .353, por lo que su promedio de embasado fue 34% mejor que el de la liga.

Por otra parte su slugging de por vida fue de .690 mientras la media de la liga fue de .400, lo cual significo que Ruth fue 73% mejor que la liga. La suma de ambos porcentajes da un valor de 107 el cual sumado al valor de un jugador promedio de la Liga (100) resulta en un valor de 207 OPS+.

Ruth es el OPS+ mas alto de la historia y el único superior al doble del al valor de un jugador promedio de la Liga. En otras palabras Ruth valía por dos jugadores!

Cuando se analiza un jugador se suele tomar el valor del OPS+ como una prueba inequívoca de verdadero valor y puesto que el número se mueve en escalas cuyo límite hasta el sol de hoy es Babe Ruth, es fácil demarcar los rangos más altos como una prueba de la grandeza del jugador.

Solo ocho jugadores han tenido un valor de OPS+ igual o mayor a 170 : Ted Williams (190), Barry Bonds (182), Lou Gerigh (179), Rogers Hornsby (172), Dan Brouthers y Joe Jackson (170) además del Babe. Hasta el año pasado Albert Pujols pertenecía a este club pero su actuación en la presente campaña al momento en que escribo esto lo ha disminuido en 1 punto y se encuentra en 169.

El OPS y el OPS+ son valores que pueden tomarse ciertamente para medir la calidad del jugador mas tienen dos limitaciones: intrínsecas a las formulas originales del obp y el slg: las cuales son que no incluyen el efecto de las bases robadas ni tampoco reflejan un ajuste por la diferencia de épocas en que jugó el pelotero.

La primera limitación solo es aplicable cuando la cantidad de bases robadas y la tasa de efectividad del corredor son altos y no terminan anulándose, ya que teóricamente cada base robada agrega una base alcanzada adicional a la cantidad de bases que se toman para el slugging pero cada out robando resta una vez en base al total usado en el calculo del porcentaje de embasado del bateador .

La segunda limitante es algo mas difusa y solo se vuelve un problema cuando dos épocas tuvieron condiciones de juego muy distintas. En ciertas épocas los bateadores han tenido facilidades para desarrollar mejores números ofensivos, tal como la década de los años 30 y 90 del siglo 20 mientras que en otras épocas, como los años 60 o la época de la bola muerta a principios del siglo 20 eran los lanzadores quienes se veían favorecidos. Igualmente desde la integración de color las Ligas subieron la calidad de la competencia por lo que existe cierto handicap en los OPS+ de jugadores de la segunda mitad del siglo 20 en adelante al compararlos con los de los primeros 70 u 80 años de historia.

Para normalizar hay que usar un resultante del número de carreras del año comparado con el número de carreras del año a comparar. Sin embargo muchas veces la normalización se suele obviar debido a que seria una constante variación al comparar varios jugadores a la vez, dejándose indicado que el OPS+ de jugadores de años de baja producción ofensiva, como los años 60 con jugadores tienen un aval en ese sentido sobre el OPS+ de jugadores de épocas de alta ofensiva, como la década de los 90.

Sin embargo para comparaciones de jugadores en una misma temporada el OPS+ es una gran herramienta.

En años recientes un señor llamado Lee Sinnins ha perfeccionado el propósito con el que se creo el valor OPS+ llevándolo a la formula de las carreras creadas, incluyendo ya el efecto neto de los robos de base. Sinnins creo una medida llamada Carreras Creadas por encima del promedio de la Liga ( o RCAA en función de las siglas en ingles, Runs Created Above Average) al cual le da valor 0. Así si un jugador que tenga 20 RCAA tiene mayor valor ofensivo que otro que solo tenga 10 RCAA.

Sinnins lleva la cuenta histórica de cada jugador que ha pasado por las mayores ( adivinen quien tiene el mayor valor de RCAA) y diariamente envía un email con el titulo de “Around The Majors” en el cual refleja los lideres de la temporada de ese renglón. Igualmente Sinnins creo un valor similar para medir a los pitchers llamadas Carreras Salvadas sobre el average de la liga (RSAA, Runs saved above average).

El VORP, Valor sobre un Jugador de Reemplazo (Value Over Reeplacement Player), es un valor expresado en carreras creadas aportadas por un jugador medido contra el rendimiento promedio de un jugador de una posición específica de liga menor si este tuviese que reemplazarlo al mínimo costo posible. Actualmente es muy usada debido a sus implicaciones económicas. Si la superestrella del equipo se lesiona y hay que reemplazarlo, el Vorp indicara que tantas carreras sobre un posible reemplazo de ligas menores tiene el jugador lesionado para esa posición específica.

Esta medición es calculada normalmente por la gente del site Baseball- Prospectus, quienes llevan los cálculos para cada posición y temporada.

En fin, una de las ideas de los sabermetrics es la comparación, pero comparar con sentido común usando promedios históricos de la liga y dándole un valor con el cual se puede hacer una evaluación mas justa del pelotero.

Por cierto si alguien me explica lo de batear .300 como benchmark tradicional para el average de bateo se lo agradecería.

lunes, 25 de junio de 2007

SOXPAWS

Rapidito les presento el roster del equipo que comienza mañana una nueva liga en Simnasium que va sobre jugadores que pasaron mas años de sus carreras en una franquicia, que en mi caso son los Medias Rojas de Boston.
El nombre SOXPAWS es un juego de palabras porque el equipo que draftee resulto estar compuesto en su mayoría de jugadores zurdos.
En mi división están los NY Yankees (Dave Mendoza), los Cardenales de San Luis y los Gigantes de NY/San Francisco y se pueden imaginar los jugadores que están en esas franquicias.
Creo que voy a divertirme un buen rato los próximos tres meses.
Aquí esta mi equipo:

SOXPAWS

The hold period is now over. You are free to make changes to your roster.

The first pitch is scheduled on Monday June 25, 12:00 AM PDT. Open the Draft Matrix

You can review your current team roster:

Position Players

POS

Player

Salary

C

Gedman, RichL

$1,923,000

C

Nixon, RussL

$402,000

1B, LF, RF

Harris, JoeR

$6,918,000

1B

Todt, PhilL

$350,000

2B

Andrews, MikeR

$3,299,000

2B, 3B, SS

Lepcio, TedR

$680,000

3B, 1B

Boggs, WadeL

$15,233,000

3B, 2B, SS

Kennedy, JohnR

$350,000

SS

Cronin, JoeR

$10,981,000

SS, 3B

Hoffman, GlennR

$350,000

LF, CF, RF

Stephens, GeneL

$350,000

LF

Williams, TedL

$22,144,000

LF, 1B, CF

Yastrzemski, CarlL

$15,484,000

CF, RF

Lynn, FredL

$12,314,000

RF, LF

Carbo, BernieL

$5,618,000


Suspense Mode is: Off
Want some suspense for your first game?
Turn Suspense Mode On

Pitchers

POS

Player

Salary

SP

Arrojo, RolandoR

$3,201,000

SP

Nixon, WillardR

$2,053,000

SP

Ojeda, BobL

$7,863,000

SP

Rainey, ChuckR

$383,000

SP

Young, CyR

$15,013,000

RP

Bolton, TomL

$805,000

RP

Bowsfield, TedL

$865,000

RP

Fornieles, MikeR

$1,622,000

RP

Heffner, BobR

$350,000

CL

Campbell, BillR

$4,198,000

Inactive-Injury Reserve

POS

Player

Salary

CF, 1B, LF, RF

Metkovich, CatfishL

$471,000

SP

Rhodes, GordonR

$350,000

C

Tillman, BobR

$350,000

*Note: You did not get all your picks:

- Your pick in round 25 (Marcum, Johnny) was not available. Instead, your other picks were moved up one round, and you got the closest player available (Wilcox, Milt) at the end of your draft..

*Note: When your picks are not available, they are moved to the end of your list. Therefore, the round numbers will not match to what you initially had set.

domingo, 24 de junio de 2007

Ideas, no Formulas.

Ideas, no formulas.

Existe la idea que los Sabermetrics son estadísticas. Esa concepción esta basada en una cantidad de nuevas estadísticas que han visto la luz por parte de los “sabermetricians” para explicar sus ideas.

Pero la verdad, verdadera la llamaría yo, es que los Sabermetrics son ideas y conceptos sobre el juego del béisbol en la búsqueda de la estadística más fundamental de todas: la victoria.

Y como las estadísticas tradicionales están limitadas a ciertos parámetros tradicionales que no ayudan a discernir bien porque se gana o se pierde, es que nuevas estadísticas han surgido.

El average de bateo, las carreras impulsadas, las bases robadas, las victorias y derrotas de los pitcher son estadísticas tradicionales que brillan en todos los periodicos y medios “tradicionales” pero cuyo valor para analizar el porque se gana o se pierde es muy limitado y casi sin significación en la victoria.

Ningún average de bateo da la medida de cuan bueno o malo es un bateador para ser o no mas veces out; solo da la medida de cuan bueno o malo es cuando pone la bola en play o es ponchado.

Las carreras impulsadas son una medida parcial de la habilidad individual para conectar con oportunidad por un bateador pues que ella ocurra esta mas en funcion de la oportunidad de encontrar corredores en circulación por parte del bateador cuando conecta de hit.

Un bateador puede acumular 45 jonrones y 75 extrabases y todavía no impulsar 100 carreras en una temporada simplemente porque cuando hacia sus conexiones no encontraba corredores en las bases. Pregúntele a Barry Bonds por su temporada del 2003.

Para los sbaermetrics las carreras no se anotan ni se impulsan individualmente si no se crean como un esfuerzo colectivo. De allí que se halla creado un forma de medir las carreras creadas individualmente como contribución al total de carreras anotadas por todo el equipo..

Para los Sabermetrics los bateadores no son valiosos en función de las veces que conecten de hit en sus turnos “legales” si no por las veces que son puestos out o no en todas las apariciones al plato como bateadores.

No es lo mismo un turno legal que una aparición al plato porque por un convencionalismo del siglo 19 las bases por bolas, y los pelotazos nunca fueron reconocidos como una habilidad de los bateadores si no como una deficiencia de los lanzadores.

Es por ello que el average de bateo es una estadística con información limitada para medir realmente las habilidades ofensivas de un bateador mientras que el porcentaje de embasado, que incluye tanto las veces en que un bateador se embasa conectando un hit como cuando se embasa por un boleto o un pelotazo o conecta un sacrifly, resulta ser la principal medida de contribución de un bateador a crear carrera para su equipo evitando ser out.

El porcentaje de embasado incluye lo que quiere medirse con el average de bateo pero abarca integralmente todo el universo de apariciones al plato del bateador, cosa que no hace el average de bateo

Para los Sabermetrics el average de bateo no es útil para medir la calidad de lo hits que un bateador conecta porque en su formula todos los hits son considerados sencillos.

Para los Sabermetrics es importante saber que tipo de hits conecta un bateador, sean sencillos o extrabases, y es por eso que se usa el slugging, que no es otra cosa que la misma formula de average de bateo pero dándole a cada hit el valor de las bases alcanzadas con el: 1 para sencillos, 2 para los dobles,3para los triples y 4 para los cuadrangulares.

Un bateador que conecte 30 sencillos en 100 turnos bateara .300 de average al igual que un bateador que conecte 20 sencillos , 5 dobles y 5 cuadrangulares en los mismos 100 turnos legales.

Mientras que el average de bateo ha igualado a ambos bateadores, el slugging nos dice que el primer bateador tiene un slugging de .300 (bingo, igual a su average) mientras el segundo tendrá un slugging de .500, lo que son doscientos puntos más de valor en sus conexiones.

El average de bateo es una estadística que en los Sabermetrics limita el análisis para saber cual es la característica del bateador: poco contacto o mucho contacto.

Pero más allá de eso como estadística su información es muy limitada y es por ello que en los Sabermetrics es considerada una información de segundo plano..

Los Sabermetrics se dieron cuenta que la única forma de crear carreras por un equipo era la combinación del porcentaje de embasado y el slugging de sus bateadores.

Mientras mas veces se embasen y mientras más bases se alcancen con sus conexiones, más carreras anotaran como equipo. Quien las anota y quien las impulsa es una resultante de la posición en el lineup de los bateadores con mejores habilidades para embasarse y los bateadores con mayor fuerza para conectar extrabases.

Estas ideas tan simples son el punto de partida de las ideas de los Sabermetrics dentro del contexto en el que se juega el béisbol. Porque el contexto también influye: los parques asi como si el bateador o el pitcher es zurdo o derecho.

Por ejemplo el béisbol es el único deporte de conjunto donde las medidas de las canchas no son iguales para todos los equipos. Un parque de pelota donde no halla muchas zonas de foul que hagan que flys de foul se puedan convertir en out de forma mas seguida o que sus cercas tengan una distancia mas corta del home haciendo mas fácil conseguir un extrabase o un cuadrangular favorecerá a un bateador mas que un parque con características contrarias.

Todo este tipo de análisis que se hace de la ofensiva se aplica también en cuanto a los lanzadores y también en cuanto a la defensa.

Y dentro de un contexto global surgen conceptos tan novedosos como los WinShares de Bill James o el Vorp o el Warp de Baseball Prospectus, que describen la contribución ofensiva, defensiva y de pitcheo como un todo de un jugador a las victorias de su equipo.

Estas ideas llevadas a un plano conceptual integral son llamadas Sabermetrics.

Por eso cuando escuchen hablar de Sabermetrics no se refieran a ellas como nuevas estadísticas, no, refiéranse a ellas como nuevas ideas y conceptos de cómo jugar mejor y mas eficientemente el juego, expresadas y soportadas a través del análisis de todas aquellas estadísticas, tradicionales o no, que permiten explicar mejor el porque ocurren las cosas dentro de este deporte.

Tan simple como eso.

sábado, 23 de junio de 2007

Vizquel puede ir en el canal lento a Cooperstown

Escuche en la radio que Omar Vizquel les habría dicho a periodistas locales del área de la bahía de San Francisco que estaba trabajando fuertemente en su mecánica de bateo con el fin de poder superar el largísimo slump ofensivo en el que esta sumergido esta temporada (.224 avg-..277 obp-.283 slg en 263 turnos en 66 juegos) que sin duda pone en peligro su continuidad tanto en los Gigantes de San francisco como en el béisbol tomando en cuenta su edad y que este es el ultimo año de su contrato con ellos. Esos números también pudiesen mostrar el declive ofensivo propio de la edad del campocorto...

Si Omar es obligado a retirarse después de una penosa temporada ofensiva, sus chances para una futura elección al Salón de la Fama sufrirían un retroceso.

Y es que el problema es que Vizquel necesita consolidar su carrera en cuanto a números ofensivos y no quedar a merced de la posible consideración que tengan sobre sus cualidades defensivas los escritores electores. La época en que un campocorto era considerado únicamente por su defensiva, tiempos de Luis Aparicio y Ozzie Smith, quedo en el pasado y no ayuda al nuestro el haber sido contemporáneo de la mejor generación de jugadores ofensivos en esa posición.

Definitivamente por más meritos defensivos que se reúna si no se consolida una buena carrera a nivel ofensivo los argumentos no serán 100% sustentables.

Y esto lo digo porque Vizquel enfrenta un problema adicional que bien podría trabajar en su contra en cuanto a la vigencia en la memoria ge los votantes de sus hazañas defensivas.

¿Cuanto tiempo va a permanecer Vizquel en la boleta de votación tomando votos suficientes para permanecer en ella pero sin ser elegido? Luis Aparicio tardo 11 años en ser elegido y atravesó un problema similar al que va a enfrentar el nuestro.

Ese problema es la presencia en la boleta de elección de una cantidad impresionante de candidatos de primer orden y sobre los que no existe duda de su lugar en Cooperstown una vez se hallan retirado. En este momento y dándole una vuelta a los rosters de grandes ligas encuentro por lo menos 14 nombres de jugadores que no deberían tardar mas de dos o tres temporadas en decir adiós a sus carreras y sentarse a esperar cinco años para entrar al templo de los inmortales. Veamos la lista (al lado del nombre se encuentra la edad, numero de temporadas, posible año de retiro y posible primer año en la boleta de elccion):

ROGER CLEMENS 44 24 2008 2014
MIKE PIAZZA 38 16 2008 2014
SAMMY SOSA 38 18 2008 2014
TOM GLAVINE 41 21 2008 2014
GRAIG BIGGIO 41 20 2008 2014
BARRY BONDS 42 22 2008 2014
FRANK THOMAS 39 18 2009 2015
GREG MADDUX 41 22 2009 2015
TREVOR HOFFMAN 39 15 2009 2015
RANDY JOHNSON 43 20 2009 2015
MARIANO RIVERA 37 13 2010 2016
IVAN RODRIGUEZ 35 17 2010 2016
PEDRO MARTINEZ 34 15 2010 2016
KEN GRIFFEY JR. 37 19 2010 2016

En el renglón de lanzadores dudo que, fuera de las primeras escogencias a Cooperstown se halla presentado alguna vez alguna coyuntura tan impresionante en cuanto al lugar histórico de los candidatos: Clemens, Maddux y Johnson son considerados en la mayoría de las listas entre los mejores 10 lanzadores de la historia. Casi un tercio de los premios Cy Young entregados en la historia se aglutinan en estos tres nombres. Incluyan a Glavine y Martinez y seria el mejor quinteto de abridores elegido en un lapso tan corto. Si añaden a Mariano Rivera y Trevor Hoffman, pareciera que tendrían que separar a los lanzadores de los jugadores de posición en las boletas para poder elegir alguno de estos.

Y ese es el problema, que la lista de jugadores de posición tiene tanta calidad implícita que es difícil saber si alguien se atrevería a omitir algún nombre en una primera boleta: Bonds, Piazza, Griffey Jr., Thomas y Biggio son la crema de sus respectivas posiciones a nivel histórico.

Y fíjense que no incluí otros nombres con suficientes meritos para obtener la placa en un primer intento pero que cuyos meritos no son comparables a los de la primera lista:

Mike Mussina, Curt Schilling, John Smoltz, Jeff Kent, Gary Sheffield son nombres que perfectamente pueden integrarse en corto tiempo a la boleta y complicar mas el asunto para Vizquel.

¿Cuanto pueden tardar los escritores de en exaltar a la mayoría de estos jugadores, más si tomamos en cuenta que casos como el de Roger Clemens, considerado por muchos (incluyéndome a mí ) como uno de los dos mejores lanzadores de toda la historia de las grandes ligas pudiese ser una exaltación única ese año?

Desde 1980 solamente en tres elecciones han sido elegidos tres jugadores al mismo tiempo por la asociación de escritores. En el supuesto de que esto ocurriera durante cuatro años consecutivos aun se necesitaría un quinto año para elegir a los otros dos jugadores del primer grupo Algo Improbable que suceda.

Si esto se toma de siete a ocho años al grupo se estarían uniendo nuevos nombres como Chipper Jones y Manny Ramírez por mencionar solo a aquellos que representan candidaturas que ya cuentan con suficientes meritos suficientes para ser elegidos si decidieran retirase hoy. Y nombres como Ichiro Suzuki, Vladimir Guerrero y Derek Jeter pudiesen asomar sus narices también.

Sin duda que Omar Vizquel tiene meritos para argumentar a su favor en cuanto a su derecho a estar en Cooperstown pero la competencia en las boletas que afrontara puede limitarlo a ser testigo de excepción de los reconocimientos a ese largo grupo de jugadores.

Cuanto tiempo permanecerán sus marcas defensivas y sobre todo la memoria de ser el mejor campocorto defensivo de su generación en la memoria de los electores. Estamos hablando de un lapso de casi quince años después de su retiro.

Ojala y se recupere esta temporada y pueda continuar su carrera por al menos dos años mas para consolidar sus números ofensivos. Los va a necesitar.