Predecir nuevas maternidades mensuales: un proyecto de regresión lineal múltiple paso a paso

En predicción cuantitativa, el primer reto no suele ser elegir un algoritmo complicado, sino formular bien el problema. Antes de entrenar un modelo, hay que decidir qué queremos predecir, cómo vamos a medirlo y qué información puede ayudarnos a anticiparlo.

Con esa idea he preparado un nuevo proyecto en GitHub aplicado a un problema de gestión de personal hospitalario: la predicción mensual de nuevas bajas maternales equivalentes de trabajadoras de un hospital. La pregunta es concreta: ¿podemos estimar cuántas nuevas bajas maternales equivalentes se producirán cada mes entre las trabajadoras de un hospital usando datos agregados sobre plantilla, estabilidad contractual, estructura familiar aproximada y riesgo durante el embarazo?

El objetivo no es predecir decisiones individuales ni explicar la maternidad como fenómeno personal. El proyecto se centra en algo más práctico: construir una estimación mensual agregada que pueda ayudar a planificar sustituciones, prever carga organizativa y reducir parte de la incertidumbre en la gestión de personal.

Seguir leyendo «Predecir nuevas maternidades mensuales: un proyecto de regresión lineal múltiple paso a paso»

Tres predicciones para 2026 (revisión primer trimestre)

A comienzos de año planteé tres predicciones para 2026 siguiendo un enfoque explícitamente probabilístico: no tanto para acertar una cifra concreta, sino para dejar claro el razonamiento detrás de cada escenario. Como se prometió entonces, el objetivo no era solo predecir, sino también revisar.

Tras el cierre del primer trimestre, ya disponemos de nueva información relevante —tanto en el ámbito macroeconómico como en el mercado inmobiliario y en el contexto político— que justifica actualizar esas previsiones. En las siguientes secciones reviso cada una de las tres predicciones iniciales, ajustando la tasa base, los motores y los frenos para reflejar mejor el estado actual del mundo.

Seguir leyendo «Tres predicciones para 2026 (revisión primer trimestre)»

Del absentismo a la contratación temporal: un proyecto de regresión lineal simple paso a paso

A menudo se habla de predicción cuantitativa como si fuera un terreno reservado a modelos complejos, librerías sofisticadas y sistemas difíciles de explicar. Pero no siempre hace falta empezar por ahí. De hecho, muchas veces creo que ocurre lo contrario: para entender bien qué significa predecir con datos, conviene empezar por un modelo pequeño, transparente y fácil de interpretar.

Por eso he querido compartir en GitHub un proyecto completo construido alrededor de una pregunta muy concreta: cómo estimar cuántos días de contratos temporales de cobertura pueden generarse cuando aumenta el absentismo laboral por incapacidad temporal (IT). No he preparado este repositorio para presentar un gran sistema productivo ni una solución definitiva. Lo he hecho para mostrar, de forma reproducible, cómo puede utilizarse una regresión lineal simple como método de predicción cuantitativa.

La idea del proyecto no es solo enseñar una ecuación. Es enseñar un recorrido. Cómo se parte de una pregunta real, cómo se traduce esa pregunta a variables medibles, cómo se preparan los datos, cómo se comprueba si la relación tiene sentido y cómo se convierte finalmente el modelo en una pequeña aplicación utilizable. En el fondo, lo que me interesaba compartir no era solo el resultado, sino el proceso.

Seguir leyendo «Del absentismo a la contratación temporal: un proyecto de regresión lineal simple paso a paso»

Tres predicciones para 2026: un ejercicio explícito de incertidumbre

Hablar del futuro suele llevarnos a dos extremos igual de poco útiles: la seguridad impostada (“esto va a pasar”) o la renuncia total (“nadie puede saber nada”). Entre ambos hay un espacio mucho más interesante: el de las predicciones probabilísticas, aquellas que no eliminan la incertidumbre, pero la hacen visible y discutible.

Este post plantea tres predicciones evaluables para 2026 en España. Son tres pronósticos sobre eventos que, a mi juicio, se sitúan en una zona “Ricitos de Oro”: lo bastante complejos como para no ser triviales, pero con información suficiente como para permitir un análisis razonado, y con decisiones reales en juego. Además, son especialmente relevantes en mi entorno.

No están pensadas para impresionar por su precisión puntual, sino para dejar constancia del razonamiento que hay detrás: qué factores considero importantes, cuáles pesan más y, sobre todo, qué tipo de evidencia me haría cambiar de opinión.

El compromiso es doble:
• Las predicciones se revisarán trimestralmente, recalibrando las probabilidades.
• A final de año se evaluará no solo el resultado, sino también la calidad del proceso seguido.

Seguir leyendo «Tres predicciones para 2026: un ejercicio explícito de incertidumbre»

Los cuatro cuadrantes de Taleb: una brújula para saber cuándo no debemos predecir

Este post forma parte de la serie dedicada a explorar las ideas esenciales de El Cisne Negro, de Nassim Taleb, cuyo objetivo es mejorar nuestra capacidad predictiva entendiendo, precisamente, cuándo la predicción funciona… y cuándo no.*

Cuando intentamos anticipar el futuro, solemos asumir que las herramientas estadísticas funcionan igual en todas partes. Pero Taleb nos recuerda que no vivimos en un único tipo de mundo. Hay entornos donde los datos se comportan de manera estable y predecible, y otros donde un solo suceso extremo puede cambiarlo todo. Para orientarnos entre estos dos mundos propone un mapa simple pero poderoso: los cuatro cuadrantes de la incertidumbre.

Este mapa cruza dos ejes fundamentales:

  1. el tipo de decisión que queremos tomar (simple o compleja), y
  2. la naturaleza del entorno (Mediocristán o Extremistán).

A continuación, exploramos cada uno de estos cuadrantes de forma clara y práctica.

Seguir leyendo «Los cuatro cuadrantes de Taleb: una brújula para saber cuándo no debemos predecir»

Mediocristán vs Extremistán: dos mundos que deciden si tu modelo predictivo acierta o falla

Este post inaugura una nueva serie del blog dedicada a explorar ideas esenciales de El Cisne Negro de Nassim Taleb. Igual que hicimos con otros libros clave, iremos desgranando conceptos y reflexionando sobre ideas que nos ayudarán a aprender a predecir mejor.

Y no hay mejor punto de partida que uno de los pilares del pensamiento de Taleb: la diferencia radical entre Mediocristán y Extremistán.

Dos mundos, dos tipos de aleatoriedad

Taleb distingue entre dos “países probabilísticos” que se parecen tanto entre sí como un estanque tranquilo respecto a un tsunami.

  • Mediocristán, donde reina la aleatoriedad suave, “domesticada”, con variaciones pequeñas.
  • Extremistán, donde domina la aleatoriedad salvaje, con eventos capaces de romper cualquier estadística.

La idea es simple: algunos fenómenos del mundo real no pueden crecer más allá de ciertos límites físicos (por ejemplo, cuánto mide una persona). Otros, en cambio, pueden escalar sin límite conocido (por ejemplo, cuánto dinero puede generar un libro o un software).

Y esa diferencia lo cambia TODO: cómo modelamos, cómo interpretamos los datos, qué tan seguros podemos estar… y cuán vulnerables somos a un Cisne Negro.

Seguir leyendo «Mediocristán vs Extremistán: dos mundos que deciden si tu modelo predictivo acierta o falla»

Intentar ver el mundo como una libélula: múltiples perspectivas para mejores predicciones

A continuación, seguimos explorando ideas del libro «Superforecasting: The Art and Science of Prediction» que considero muy relevantes para todo aquel que quiera mejorar su capacidad de predecir. En el momento de explorar la idea de ver el mundo como una libélula, es decir, abordar un problema des de todas las perspectivas posibles.

Las libélulas tienen una forma extraordinaria de ver el mundo. Sus ojos están compuestos por miles de lentes individuales, cada una captando una porción distinta del entorno. El resultado no es una imagen fragmentada, sino una visión integrada y más rica. ¿Y si aplicáramos ese mismo principio a cómo pensamos sobre el futuro?

El sesgo de nuestra única perspectiva

Uno de los mayores retos al hacer predicciones es que solemos ver el mundo desde un solo ángulo: el nuestro. Nuestra experiencia, nuestras creencias y nuestras emociones actúan como filtros que limitan lo que vemos —y lo que somos capaces de anticipar.

Seguir leyendo «Intentar ver el mundo como una libélula: múltiples perspectivas para mejores predicciones»

Estimaciones de Fermi: cómo razonar cuando no tienes datos (y evitar el disparate)

A continuación se expondrá en detalle un método que se propone en el libro Superforecasting: The Art and Science of Prediction para descomponer un problema en partes más estimables.

Uno de los retos más frecuentes en análisis es enfrentarse a preguntas sin datos directos. En lugar de improvisar o bloquearse, hay una técnica sorprendentemente útil para avanzar con lógica: la estimación de Fermi.

Esta técnica, popularizada por el físico Enrico Fermi, se basa en dividir un problema complejo en partes más pequeñas y estimar cada una de ellas con números razonables. Pero más allá del cálculo, lo importante es el proceso: establecer límites exteriores (el resultado más amplio razonable) e interiores (el resultado más ajustado posible) del problema, y ser consciente del número que usamos como punto de partida, ya que este actuará como ancla para el resto de nuestras suposiciones.

Seguir leyendo «Estimaciones de Fermi: cómo razonar cuando no tienes datos (y evitar el disparate)»

Priors bayesianas (2/3): Cómo usar distribuciones discretas para modelar nuestras creencias

En la primera entrega de esta serie vimos qué es una prior: una forma de expresar con números lo que creemos antes de observar datos. Hoy daremos un paso más y veremos cómo podemos construir esas priors utilizando distribuciones de probabilidad discretas cuando el análisis preliminar nos indica que el fenómeno que queremos predecir se comporta así.

Porque sí, hasta nuestras corazonadas pueden adoptar una forma matemática.

¿Qué es una distribución de probabilidad discreta?

Una distribución de probabilidad discreta es una herramienta matemática que asigna probabilidades a valores enteros concretos. Es útil para describir fenómenos contables como:

  • ¿Cuántas veces encestaré si lanzo 10 veces?
  • ¿Cuántos clientes vendrán hoy?
  • ¿Cuánto tardaré en tener un acierto?

Estas distribuciones no trabajan con valores continuos como 3,1416 o 7,82, sino con 0, 1, 2, 3…

Seguir leyendo «Priors bayesianas (2/3): Cómo usar distribuciones discretas para modelar nuestras creencias»

Bayes: de los milagros a los algoritmos

El mundo en que nació Thomas Bayes era un lugar mucho más borroso de lo que creemos. Corría el siglo XVIII, soplaban vientos de Ilustración y la mayoría de las mentes brillantes de la época creían que la verdad absoluta estaba al alcance del hombre moderno. Mediante la razón, grandes pensadores se afanaban en elaborar leyes y ecuaciones deterministas que pretendían revelar el funcionamiento del universo, como si fuera un reloj suizo. La incertidumbre, esa plaga moderna, apenas comenzaba a abrirse paso.

Bayes, un clérigo presbiteriano de mirada invisible, nunca fue un gran protagonista. No tuvo el carisma de Newton ni la osadía de Laplace. Vivía en la sombra, en bibliotecas polvorientas, escribiendo silenciosamente sobre teología, moral y con una especial fascinación por las matemáticas.

Fue en ese clima donde, hacia 1750, concibió una idea que cambiaría el mundo. Una idea que, como muchas de las grandes revoluciones, fue ignorada durante décadas: que no había que esperar infinitas repeticiones de un evento para saber qué tan probable era, que podíamos estimar la incertidumbre con la información que ya teníamos. Que podíamos, en suma, inferir hacia adelante.

Seguir leyendo «Bayes: de los milagros a los algoritmos»