Estimaciones de Fermi: cómo razonar cuando no tienes datos (y evitar el disparate)

A continuación se expondrá en detalle un método que se propone en el libro Superforecasting: The Art and Science of Prediction para descomponer un problema en partes más estimables.

Uno de los retos más frecuentes en análisis es enfrentarse a preguntas sin datos directos. En lugar de improvisar o bloquearse, hay una técnica sorprendentemente útil para avanzar con lógica: la estimación de Fermi.

Esta técnica, popularizada por el físico Enrico Fermi, se basa en dividir un problema complejo en partes más pequeñas y estimar cada una de ellas con números razonables. Pero más allá del cálculo, lo importante es el proceso: establecer límites exteriores (el resultado más amplio razonable) e interiores (el resultado más ajustado posible) del problema, y ser consciente del número que usamos como punto de partida, ya que este actuará como ancla para el resto de nuestras suposiciones.

Seguir leyendo «Estimaciones de Fermi: cómo razonar cuando no tienes datos (y evitar el disparate)»

Priors bayesianas (3/3): Distribuciones continuas para modelar creencias que fluyen

En las dos entradas anteriores presentamos el concepto de prior bayesiana y cómo construirla usando distribuciones discretas. Sin embargo, no todo en la vida se cuenta con números enteros. A veces, lo que queremos modelar fluye de forma continua: proporciones, medias, tiempos, tasas…
En este último capítulo de la serie, exploramos las distribuciones continuas más útiles para construir priors cuando las variables no se cuentan, sino que se miden.

¿Qué es una distribución continua?

Una distribución de probabilidad continua describe el comportamiento de una variable que puede tomar cualquier valor dentro de un intervalo, incluso infinitos valores posibles.

Por ejemplo: La proporción de pacientes que se recuperan de una enfermedad, el tiempo de espera en una consulta médica o el ingreso mensual medio de una familia.

Seguir leyendo «Priors bayesianas (3/3): Distribuciones continuas para modelar creencias que fluyen»

Priors bayesianas (2/3): Cómo usar distribuciones discretas para modelar nuestras creencias

En la primera entrega de esta serie vimos qué es una prior: una forma de expresar con números lo que creemos antes de observar datos. Hoy daremos un paso más y veremos cómo podemos construir esas priors utilizando distribuciones de probabilidad discretas cuando el análisis preliminar nos indica que el fenómeno que queremos predecir se comporta así.

Porque sí, hasta nuestras corazonadas pueden adoptar una forma matemática.

¿Qué es una distribución de probabilidad discreta?

Una distribución de probabilidad discreta es una herramienta matemática que asigna probabilidades a valores enteros concretos. Es útil para describir fenómenos contables como:

  • ¿Cuántas veces encestaré si lanzo 10 veces?
  • ¿Cuántos clientes vendrán hoy?
  • ¿Cuánto tardaré en tener un acierto?

Estas distribuciones no trabajan con valores continuos como 3,1416 o 7,82, sino con 0, 1, 2, 3…

Seguir leyendo «Priors bayesianas (2/3): Cómo usar distribuciones discretas para modelar nuestras creencias»

Priors bayesianas (1/3):¿Qué es una prior?

Imagina esto:
Estás buscando setas en un bosque. Nunca has estado allí, pero alguien te ha dicho que las mejores suelen crecer bajo robles. Aunque aún no has visto ninguna, ya sabes por dónde empezar a buscar. Eso que sabes antes de empezar a observar es tu conocimiento previo… o lo que en estadística bayesiana llamamos una distribución a priori, o simplemente: una prior.

¿Qué es una prior?

En el mundo de la inferencia bayesiana, una prior es nuestra forma de representar, con números, lo que creemos que puede pasar antes de ver los datos.

Es como una apuesta informada: antes de lanzar una moneda, quizás sospechas que está trucada porque el borde está desgastado. Eso afecta tu expectativa antes incluso de verla caer.

Cuando usamos el Teorema de Bayes, la prior se combina con los datos observados (a través de la verosimilitud) para actualizar nuestras creencias. El resultado es lo que llamamos la distribución posterior.

Seguir leyendo «Priors bayesianas (1/3):¿Qué es una prior?»

Reseña del libro la señal y el ruido

Introducción

La señal y el ruido, publicado en 2012, fue escrito por Nate Silver un estadístico y escritor especialista en predicciones. El autor es fundador del blog FiveThirtyEight donde se hacen predicciones de temas tan diferentes como deportes y contiendas electorales. Su amor hacia la estadística le hizo escribir el libro que nos ocupa. En él se nos explica, de una forma sorprendentemente entretenida, porqué nos resulta tan difícil predecir eventos futuros y nos propone un método para minimizar los elementos que hacen que erremos nuestro pronóstico (lo que él llama ruido) y maximizar los elementos que lo hacen más acertado (lo que él llama señales). Seguir leyendo «Reseña del libro la señal y el ruido»