Alfredo García y Andrés Barge (Sportyy)

Estás aquí Home » Alfredo García y Andrés Barge (Sportyy)

07 de, enero Dani (4)

Alfredo García y Andrés Barge

Alfredo García (izda) y Andres Barge (dcha.) son socios de sportyy. Junto con el que escribe, han desarrollado un modelo matemático de predicción para partidos de Tenis. Ambos son profesores universitarios, Doctores en Economía y expertos en modelos cuantitativos. El objetivo de la entrevista es dar luz sobre los modelos matemáticos de predicción en el mundo de las apuestas deportivas. Debido a mi participación en sportyy esta entrevista no puede considerarse independiente.

¿Cuál fue vuestro primer contacto con el mundo de las apuestas?

AB: Llevo apostando desde siempre. Antes de que existiese internet, apostaba habitualmente con amigos. Mi primer contacto con el mundo on-line fue en 2004, a través de bookies tradicionales que se publicitaban mucho. Poco después, descubrí Betfair y ya empecé a tomármelo más en serio.

AG: Hace tiempo que apuesto. Antes de la explosión del sector de apuestas deportivas on-line apostaba (porque eso es lo que hacía básicamente) en bolsa. Realizaba movimientos intradía buscando sorpresas importantes. Algo así como apostar a super-dogs. Después, al ser un gran aficionado al baloncesto, mi comienzo en apuestas deportivas se ligó a la magnífica generación de la selección española.

¿Cuál es vuestro método para encontrar cuotas con valor y seleccionar picks?

AB: El punto de partida es que el ser humano tiene sesgos en su percepción. Este hecho está bien documentado en la literatura científica. Por lo tanto, la estimación subjetiva de probabilidades realizada por los apostadores no será necesariamente correcta. La idea es encontrar modelos estadísticos que permitan predecir las probabilidades de cada suceso en base a datos objetivos y comparar dichas probabilidades con las probabilidades implícitas en las cuotas.

AG: Si sólo has visto un jugador jugar una vez y lo hizo a un gran nivel ¿serás capaz de aislar eso de tu mente y estimar correctamente su probabilidad de victoria en el siguiente partido?  Además,  ¿serás capaz de analizar un partido con precisión después de perder 10 apuestas consecutivas? Los modelos carecen de sentimientos y esto es lo que buscamos para seleccionar nuestro picks.

¿En qué consisten estos modelos estadísticos?

AB y AG: Los modelos estadísticos utilizan toda la información del pasado. Es decir, tratan de contestar a la siguiente pregunta: ¿Qué suele suceder en el pasado en situaciones similares a las del partido que estoy analizando? Evidentemente, nunca habrá dos situaciones idénticas, pero sí muchos partidos muy similares. En los modelos que utilizamos en sportyy se tienen en cuenta un gran número de variables como el ranking, el nivel de forma, el comportamiento típico cuando es favorito o cuando es “dog”, las superficies en que se desenvuelve mejor, el comportamiento ante jugadores zurdos o grandes sacadores, así como las pautas regulares en los distintos torneos o rondas.  Una parte importante del modelo es también la elaboración de rankings propios, ya que el ranking ATP no es demasiado representativo del potencial concreto de cada jugador.

¿Por qué nos podemos fiar de los modelos estadísticos?

AB: La mayor ventaja de los modelos estadísticos es que pueden ser testados a posteriori, lo que es imposible de llevar a cabo con la estimación de probabilidades subjetivas. Es decir, se puede ver qué hubiera dicho el modelo para cada uno de los partidos que ya se han jugado, obviamente, utilizando sólo la información previa a ese partido.

AG: Hay un hecho irrefutable, que es la capacidad que tienen los ordenadores para almacenar y analizar un volumen enorme de datos. Tengo un amigo que me dice: “no creo que jugar en casa sea una variable relevante en tenis” y yo le digo “lo es sólo en determinados tipos de torneo, para determinadas nacionalidades y cuando la diferencia entre los jugadores no es excesivamente grande”. Para hacer una afirmación como ésta nos basamos en modelos complejos que analizan una base de datos con decenas de miles de partidos. Obviamente esta variable no genera un yield del 10%, pero la acumulación de multitud de relaciones como la del ejemplo puede conducir a yields elevados. Obviamente, no es suficiente con que las probabilidades del modelo sean más afinadas que las del mercado. También tenemos que batir el overround de los bookmakers.

¿Cuáles son los pros y contras de usar un modelo matemático para seleccionar picks?

AB y AG: En primer lugar, nuestro modelo matemático no solo selecciona picks, sino que va más allá. Calcula la probabilidad de victoria de cada jugador en un partido. A partir de ahí y con la base de datos históricos de cuotas, el modelo: 1) selecciona los picks, 2) encuentra el bookie (sólo los serios…) con mejores cuotas , 3) optimiza la cantidad a apostar (el stake) en función del bankroll, y 4) calcula la cuota mínima a la que, dada la estimación que genera el modelo, esa apuesta tiene valor. Todo esto es realmente difícil de concebir por alguien que no use un método estadístico potente. Otro punto positivo es la capacidad para valorar objetivamente (con un número) el efecto de determinadas variables o sus efectos cruzados. En el lado negativo, es aún difícil que un modelo incorpore los comentarios que los jugadores realizan sobre sus sensaciones antes de un partido, las lesiones… Parte de esa información, que puede ser relevante para algunos partidos, se pierde. Esta es la mayor desventaja, es muy complicado captar información subjetiva.

¿Cuál es el grado de incertidumbre en relación con los resultados?

AB: Es importante distinguir la tendencia de la varianza. La clave para que haya una tendencia positiva es que las pautas observadas en el pasado se repitan en el futuro. Es decir, que los sesgos de percepción de los apostantes sean relativamente estables. Analizando un amplio número de años parece que, efectivamente, estos sesgos presentan bastante estabilidad. Por otro lado, está el tema de la varianza. En el mundo de las apuestas la varianza es muy elevada, como demuestra el siguiente análisis, en el que se ve claramente que el mismo modelo puede generar resultados muy distintos en función exclusivamente del azar. En este sentido, una ventaja adicional de los modelos estadísticos es que permiten estimar las probabilidades de que se presente un drawdown determinado.

AG: Los modelos estadísticos tienen dos fuentes principales de incertidumbre. La primera está relacionada con la aleatoriedad. Efectivamente, por bueno que sea un tipster el azar puede derribarlo de un plumazo. Este tipo de incertidumbre se elimina con el número de apuestas: el efecto sobre el yield del azar en 5,000 apuestas es muy inferior al equivalente en 100 apuestas. Por ello en sportyy siempre insistimos que la inversión en apuestas se trata de una inversión a largo plazo. La segunda fuente de incertidumbre se denomina incertidumbre paramétrica y viene dada por el hecho de que la estimación del efecto de una variable no coincida con su ‘verdadero’ valor. En un sencillo ejemplo, si se estima que Nadal mejora en 10 puntos porcentuales la probabilidad de ganar cuando juega en tierra, las preguntas podrían ser ¿es ese su ‘verdadero’ valor? ¿es este valor constante durante toda la muestra? El tamaño y la calidad de la base de datos reduce sensiblemente la incertidumbre paramétrica, pero al igual que la aleatoriedad nunca es posible hacerla desaparecer.

Los resultados del modelo en los 3 primeros meses de vida no son buenos.  A fecha 7 de enero de 2014, un yield del -2.2% en 330 apuestas en la versión Premium PRO y del -7.5% en 145 apuestas en la versión Premium. ¿Cuál creéis que es la razón?

AG: Es cierto, los resultados desde el lanzamiento han sido bastante peores de lo esperado. En lo siguiente voy a hablar de la versión Premium PRO que tiene más apuestas y resultados algo mejores. En cualquier caso, la diferencia actual entre ambos productos es circunstancial y, dados como están construidos ambos productos, lo habitual es que la versión Premium sea menos volátil que la PRO (en rachas negativas pierda menos y en rachas positivas también gane menos). Pese a los resultados estamos convencidos de que cerca de 300 apuestas son aún pocas para determinar una tendencia. Tenemos planeado lanzar unos 1100-1200 picks al año (en la versión PRO). En ese sentido llevamos menos del 30% de los picks anuales. Nuestro stake medio es del 1.54% y la cuota media de 2.57 con lo que de ganar a perder una apuesta, la diferencia del bankroll ronda los 4 puntos. Desde este punto de vista estamos a pocas apuestas del break even. Por otro lado, analizando los números de los últimos meses, el beneficio en dogs ha estado en línea con lo previsto, habiendo sido los picks a favoritos los que han lastrado los resultados. Pese a que esto ha afectado muy negativamente a los beneficios, no nos parece alarmante ya que no esperamos que este comportamiento de los favoritos fuera de lo normal se mantenga mucho más en el tiempo.

AB: La clave del mal resultado ha estado en el comportamiento de los favoritos. Podría deberse a un cambio de tendencia en el comportamiento del mercado a la hora de valorar a los favoritos o, simplemente, al azar. Si la causa es la primera, el modelo se autoajustará rápidamente. Como es lógico cuando sucede un hecho novedoso, el modelo pasa por una breve mala racha, pero enseguida “aprende” de lo sucedido y lo incorpora a la hora de tomar decisiones. Si se debe simplemente al azar, las aguas pronto volverán a su cauce, aunque probablemente perderemos algunas oportunidades de ganancia futura en las apuestas a favoritos.

 ¿Habéis introducido mejoras en los últimos 2 meses? ¿El modelo evoluciona con el paso del tiempo?

AB y AG: Sí a ambas cosas. El modelo evoluciona con el paso del tiempo en dos sentidos. En primer lugar porque continuamos incorporando variables y haciendo mejoras en nuestra metodología. Por ejemplo, recientemente hemos adquirido una base de datos mucho más extensa. Como ya dije anteriormente, la cantidad y calidad de los datos reduce la incertidumbre y esperamos que esto se traduzca en mejores resultados. Por otro lado, el modelo se adapta a los últimos resultados automáticamente. Esto es, los malos resultados de los favoritos en los últimos meses influirán en las decisiones del modelo para el futuro.

 ¿Qué riesgo hay de que los factores que analizáis en el pasado y en los que se basa el modelo no se repitan en el futuro?

AB y AG: Este riesgo siempre existe, simplemente hay que calibrarlo y ser consciente de ello. Es como conducir un coche, el riesgo de tener un accidente siempre existe y no debemos olvidarlo. Pero de algún modo lo podemos calibrar. Hemos testado la estabilidad de los efectos de las variables en el tiempo en periodos anuales y bianuales, y ésta se mantiene. Por ejemplo,  el mercado ha cotizado excesivamente la incertidumbre antes del Open de Australia  ¿quiere esto decir que será así siempre? La respuesta es tan sencilla como contundente: nadie puede asegurarlo. Pero como explicamos antes, cuando sucede un hecho novedoso, el modelo pasa por una breve mala racha, pero enseguida “aprende” de lo sucedido y lo incorpora a la hora de tomar decisiones.

¿Cuál es vuestro método de staking? ¿Algún consejo para los apostadores?

AB y AG: A la hora de decidir el stake (cuánto apostar) nos basamos en el método Kelly. El stake sugerido por el método Kelly varía en función de la cuota (a mayor cuota menor probabilidad de acierto y menor stake y viceversa) y del valor de la apuesta u “overlay”. El overlay compara la probabilidad que nuestro modelo asigna al evento con la probabilidad implícita de la cuota. El método Kelly es muy interesante desde el punto de vista teórico, pero aplicado en su versión pura (Full Kelly) es demasiado arriesgado porque sugiere apostar porcentajes de bankroll demasiado altos. En sportyy aplicamos una modificación del método Kelly con el fin de realizar una gestión más conservadora del bankroll, ya que nos preocupa mucho minimizar el impacto de las malas rachas en el bankroll, así como la probabilidad de bancarrota. Aunque muchos tipsters son reacios a hablar de esto, la mayoría de los sistemas tradicionales de gestión del stake son muy sensibles a las malas rachas. Y, como sabemos bien, el puro azar es generador de malas (y buenas) rachas. Preferimos reducir beneficios a cambio de reducir las probabilidades de bancarrota. Desconfía de tipsters que recomiendan stakes medios cercanos o superiores al 5%. Pueden ser grandes expertos pero te pueden llevar a la bancarrota.

4 Responses to Alfredo García y Andrés Barge (Sportyy)

  1. #Matthew
    The picks currently come with the best odds at that time in a serious bookie, the minimum odds at which the model thinks there is still value and the optimal stake. Some days we send 10 picks and there is no time to explain each of them. However, we upload information and explanations in our section TennisLab periodically.

  2. Thanks for the insight. Given the highly statistical angle to your selections, do your picks still come with an explanation or reasonings for them or is it just pick, stake and odds?

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Pyckio.com

Sobre Tipsters’ Minds

En "Tipsters’ minds" Daniel Mateos, de sportyy.com, entrevista a Tipsters Profesionales de todo el mundo. Conocerás de primera mano las experiencias y opiniones sobre una profesión poco conocida.

Formamos parte de pyckio , un nuevo proyecto en el que buscaremos a los mejores tipsters del mundo y les ofrecereremos la posibilidad de convertirse en profesionales.

¡Gana 200€ gratis con Sportium!