Los cuatro cuadrantes de Taleb: una brújula para saber cuándo no debemos predecir

Este post forma parte de la serie dedicada a explorar las ideas esenciales de El Cisne Negro, de Nassim Taleb, cuyo objetivo es mejorar nuestra capacidad predictiva entendiendo, precisamente, cuándo la predicción funciona… y cuándo no.*

Cuando intentamos anticipar el futuro, solemos asumir que las herramientas estadísticas funcionan igual en todas partes. Pero Taleb nos recuerda que no vivimos en un único tipo de mundo. Hay entornos donde los datos se comportan de manera estable y predecible, y otros donde un solo suceso extremo puede cambiarlo todo. Para orientarnos entre estos dos mundos propone un mapa simple pero poderoso: los cuatro cuadrantes de la incertidumbre.

Este mapa cruza dos ejes fundamentales:

  1. el tipo de decisión que queremos tomar (simple o compleja), y
  2. la naturaleza del entorno (Mediocristán o Extremistán).

A continuación, exploramos cada uno de estos cuadrantes de forma clara y práctica.

Seguir leyendo «Los cuatro cuadrantes de Taleb: una brújula para saber cuándo no debemos predecir»

Mediocristán vs Extremistán: dos mundos que deciden si tu modelo predictivo acierta o falla

Este post inaugura una nueva serie del blog dedicada a explorar ideas esenciales de El Cisne Negro de Nassim Taleb. Igual que hicimos con otros libros clave, iremos desgranando conceptos y reflexionando sobre ideas que nos ayudarán a aprender a predecir mejor.

Y no hay mejor punto de partida que uno de los pilares del pensamiento de Taleb: la diferencia radical entre Mediocristán y Extremistán.

Dos mundos, dos tipos de aleatoriedad

Taleb distingue entre dos “países probabilísticos” que se parecen tanto entre sí como un estanque tranquilo respecto a un tsunami.

  • Mediocristán, donde reina la aleatoriedad suave, “domesticada”, con variaciones pequeñas.
  • Extremistán, donde domina la aleatoriedad salvaje, con eventos capaces de romper cualquier estadística.

La idea es simple: algunos fenómenos del mundo real no pueden crecer más allá de ciertos límites físicos (por ejemplo, cuánto mide una persona). Otros, en cambio, pueden escalar sin límite conocido (por ejemplo, cuánto dinero puede generar un libro o un software).

Y esa diferencia lo cambia TODO: cómo modelamos, cómo interpretamos los datos, qué tan seguros podemos estar… y cuán vulnerables somos a un Cisne Negro.

Seguir leyendo «Mediocristán vs Extremistán: dos mundos que deciden si tu modelo predictivo acierta o falla»

Intentar ver el mundo como una libélula: múltiples perspectivas para mejores predicciones

A continuación, seguimos explorando ideas del libro «Superforecasting: The Art and Science of Prediction» que considero muy relevantes para todo aquel que quiera mejorar su capacidad de predecir. En el momento de explorar la idea de ver el mundo como una libélula, es decir, abordar un problema des de todas las perspectivas posibles.

Las libélulas tienen una forma extraordinaria de ver el mundo. Sus ojos están compuestos por miles de lentes individuales, cada una captando una porción distinta del entorno. El resultado no es una imagen fragmentada, sino una visión integrada y más rica. ¿Y si aplicáramos ese mismo principio a cómo pensamos sobre el futuro?

El sesgo de nuestra única perspectiva

Uno de los mayores retos al hacer predicciones es que solemos ver el mundo desde un solo ángulo: el nuestro. Nuestra experiencia, nuestras creencias y nuestras emociones actúan como filtros que limitan lo que vemos —y lo que somos capaces de anticipar.

Seguir leyendo «Intentar ver el mundo como una libélula: múltiples perspectivas para mejores predicciones»

Estimaciones de Fermi: cómo razonar cuando no tienes datos (y evitar el disparate)

A continuación se expondrá en detalle un método que se propone en el libro Superforecasting: The Art and Science of Prediction para descomponer un problema en partes más estimables.

Uno de los retos más frecuentes en análisis es enfrentarse a preguntas sin datos directos. En lugar de improvisar o bloquearse, hay una técnica sorprendentemente útil para avanzar con lógica: la estimación de Fermi.

Esta técnica, popularizada por el físico Enrico Fermi, se basa en dividir un problema complejo en partes más pequeñas y estimar cada una de ellas con números razonables. Pero más allá del cálculo, lo importante es el proceso: establecer límites exteriores (el resultado más amplio razonable) e interiores (el resultado más ajustado posible) del problema, y ser consciente del número que usamos como punto de partida, ya que este actuará como ancla para el resto de nuestras suposiciones.

Seguir leyendo «Estimaciones de Fermi: cómo razonar cuando no tienes datos (y evitar el disparate)»

Priors bayesianas (2/3): Cómo usar distribuciones discretas para modelar nuestras creencias

En la primera entrega de esta serie vimos qué es una prior: una forma de expresar con números lo que creemos antes de observar datos. Hoy daremos un paso más y veremos cómo podemos construir esas priors utilizando distribuciones de probabilidad discretas cuando el análisis preliminar nos indica que el fenómeno que queremos predecir se comporta así.

Porque sí, hasta nuestras corazonadas pueden adoptar una forma matemática.

¿Qué es una distribución de probabilidad discreta?

Una distribución de probabilidad discreta es una herramienta matemática que asigna probabilidades a valores enteros concretos. Es útil para describir fenómenos contables como:

  • ¿Cuántas veces encestaré si lanzo 10 veces?
  • ¿Cuántos clientes vendrán hoy?
  • ¿Cuánto tardaré en tener un acierto?

Estas distribuciones no trabajan con valores continuos como 3,1416 o 7,82, sino con 0, 1, 2, 3…

Seguir leyendo «Priors bayesianas (2/3): Cómo usar distribuciones discretas para modelar nuestras creencias»

Bayes: de los milagros a los algoritmos

El mundo en que nació Thomas Bayes era un lugar mucho más borroso de lo que creemos. Corría el siglo XVIII, soplaban vientos de Ilustración y la mayoría de las mentes brillantes de la época creían que la verdad absoluta estaba al alcance del hombre moderno. Mediante la razón, grandes pensadores se afanaban en elaborar leyes y ecuaciones deterministas que pretendían revelar el funcionamiento del universo, como si fuera un reloj suizo. La incertidumbre, esa plaga moderna, apenas comenzaba a abrirse paso.

Bayes, un clérigo presbiteriano de mirada invisible, nunca fue un gran protagonista. No tuvo el carisma de Newton ni la osadía de Laplace. Vivía en la sombra, en bibliotecas polvorientas, escribiendo silenciosamente sobre teología, moral y con una especial fascinación por las matemáticas.

Fue en ese clima donde, hacia 1750, concibió una idea que cambiaría el mundo. Una idea que, como muchas de las grandes revoluciones, fue ignorada durante décadas: que no había que esperar infinitas repeticiones de un evento para saber qué tan probable era, que podíamos estimar la incertidumbre con la información que ya teníamos. Que podíamos, en suma, inferir hacia adelante.

Seguir leyendo «Bayes: de los milagros a los algoritmos»

Economías de Sudamérica: Proyecto de BI en Tableau

En esta entrada veremos un proyecto de Business Intelligence presentado recientemente en un bootcamp de Data Analytics que estoy cursando actualmente en Ironhack BCN. Para la elaboración de este proyecto, Sergio Irazusta (compañero del curso) y yo hemos utilizado:

  • Herramientas de ETL en lenguaje de programación de Python (Jupyter Notebook) y de bases de datos relacionales (Excel y Postgresql)
  • Tableau para la visualización interactiva de la información.
Seguir leyendo «Economías de Sudamérica: Proyecto de BI en Tableau»

Pandemia COVID-19: la visualización y el análisis de los datos con Power BI

Albert Camus escribió en su novela la peste: “El mal que existe en el mundo proviene casi siempre de la ignorancia, y la buena voluntad sin clarividencia puede ocasionar tantos desastres como la maldad.” Vivimos unos tiempos extraños donde el mal del mundo se ha manifestado en forma de pandemia global y la ignorancia de las élites gobernantes de muchos países no ha hecho más que agravar los efectos de la enfermedad. El año 2020 será largamente recordado como el año en que la economía mundial se paralizó a causa de la propagación del coronavirus COVID-19 en grande parte del mundo. Seguir leyendo «Pandemia COVID-19: la visualización y el análisis de los datos con Power BI»

Business Intelligence para detectar la desigualdad laboral (ejemplo práctico)

En esta entrada desarrollaremos un ejemplo práctico de solución de comunicación con business intelligence para la política de RRHH de un Hospital. Conviene decir que, para nuestro ejemplo, volveremos a hablar del Hospital Santa Elena, un ente ficticio, y los datos aquí utilizados no son reales.

El caso

Recientemente ha aparecido un artículo dónde se acusa a los hospitales públicos de promover la desigualdad salarial entre trabajadores por razón de género y de no premiar, como es debido, la experiencia de sus profesionales. Además, se advierte que debido a las políticas de ajuste presupuestario de los últimos 2 años los profesionales con mayor potencial se están yendo a trabajar a hospitales privados, donde se les ofrecen unas mejores condiciones laborales. Ante estas informaciones el sindicato general de trabajados de hospitales públicos (SGTHP) ha lanzado las siguientes preguntas a la Dirección de Personal del Hospital Santa Elena (DPHSE):

  • ¿Realmente se ha producido una pérdida de talento en el hospital estos dos últimos años?
  • ¿Se cumple la lógica de que a mayor experiencia laboral (edad) mayor nivel retributivo?
  • ¿Existe desigualdad salarial por razón de sexo?
  • ¿La estructura salarial y de edad es igual en todos los colectivos?

Seguir leyendo «Business Intelligence para detectar la desigualdad laboral (ejemplo práctico)»

Diseño de procesos ETL con mapas mentales

En este post quiero compartir un método que llevo usando desde hace un cierto tiempo para representar procesos ETL de una forma muy gráfica. Este método consiste básicamente en representar todos los elementos y pasos que componen un ETL mediante un mapa mental. Para crear estos mapas mentales utilizo un programa gratuito en nube llamado MindMup 2.0. Seguir leyendo «Diseño de procesos ETL con mapas mentales»