Predecir nuevas maternidades mensuales: un proyecto de regresión lineal múltiple paso a paso

En predicción cuantitativa, el primer reto no suele ser elegir un algoritmo complicado, sino formular bien el problema. Antes de entrenar un modelo, hay que decidir qué queremos predecir, cómo vamos a medirlo y qué información puede ayudarnos a anticiparlo.

Con esa idea he preparado un nuevo proyecto en GitHub aplicado a un problema de gestión de personal hospitalario: la predicción mensual de nuevas bajas maternales equivalentes de trabajadoras de un hospital. La pregunta es concreta: ¿podemos estimar cuántas nuevas bajas maternales equivalentes se producirán cada mes entre las trabajadoras de un hospital usando datos agregados sobre plantilla, estabilidad contractual, estructura familiar aproximada y riesgo durante el embarazo?

El objetivo no es predecir decisiones individuales ni explicar la maternidad como fenómeno personal. El proyecto se centra en algo más práctico: construir una estimación mensual agregada que pueda ayudar a planificar sustituciones, prever carga organizativa y reducir parte de la incertidumbre en la gestión de personal.

Seguir leyendo «Predecir nuevas maternidades mensuales: un proyecto de regresión lineal múltiple paso a paso»

La regresión lineal múltiple: cuando la realidad depende de varias causas

3D scatter plot with blue data points and a semi-transparent fitted regression plane

En muchos fenómenos reales, una sola variable no basta para explicar lo que ocurre. El precio de una vivienda no depende únicamente de sus metros cuadrados, sino también de su ubicación, su antigüedad o su estado de conservación. El rendimiento académico no se relaciona sólo con las horas de estudio, sino también con el descanso, el contexto familiar o la dificultad de la materia.

La pregunta que aparece entonces es una extensión natural de la que ya planteaba la regresión lineal simple: si una variable puede ayudarnos a predecir otra, ¿qué ocurre cuando intervienen varias al mismo tiempo?

Uno de los modelos más importantes para abordar esta situación es la regresión lineal múltiple. Su idea central sigue siendo sencilla, pero su alcance es mucho mayor: permite estimar cómo se relaciona una variable con varias explicaciones simultáneas y construir predicciones más ricas y realistas.

Seguir leyendo «La regresión lineal múltiple: cuando la realidad depende de varias causas»

Ernst Bloch y la predicción: el “todavía-no” del futuro

Cuando pensamos en predicción, lo habitual es imaginar datos, modelos y probabilidades. Intentos de reducir la incertidumbre para tomar mejores decisiones. Pero hay una cuestión más profunda: ¿de dónde nace realmente esa necesidad de anticipar el futuro?

El filósofo Ernst Bloch ofrece una respuesta sugerente: el ser humano no vive solo en el presente, sino proyectado constantemente hacia lo que aún no existe. Antes de calcular escenarios, ya imaginamos posibilidades. Antes de construir modelos, ya vivimos orientados hacia el futuro.

Seguir leyendo «Ernst Bloch y la predicción: el “todavía-no” del futuro»

Pensar antes de predecir: una guía práctica con el AI canvas

Cuando se habla de inteligencia artificial, muchas veces se empieza por el modelo. Pero antes de elegir una técnica conviene hacerse una pregunta más importante: qué decisión queremos mejorar.

Para eso resulta útil el AI canvas, una herramienta explicada en el libro Máquinas predictivas. Su función es muy simple: ayudar a ordenar un caso de uso de IA antes de construirlo. En lugar de quedarse en una idea vaga como “aquí podríamos usar IA”, obliga a concretar qué queremos predecir, para qué serviría esa predicción, qué datos harían falta y cómo sabríamos si el sistema funciona bien.

Seguir leyendo «Pensar antes de predecir: una guía práctica con el AI canvas»

AlphaGo: ¿predicción… o pensamiento divino?

En 2016 ocurrió algo que, durante décadas, muchos expertos consideraban improbable: una máquina fue capaz de derrotar a uno de los mejores jugadores del mundo en un juego que simbolizaba la intuición humana.

El sistema era AlphaGo, desarrollado por DeepMind, y su oponente era el campeón surcoreano Lee Sedol.

A primera vista, podría parecer simplemente otro avance tecnológico. Pero lo que ocurrió en aquellas partidas fue algo más profundo: por primera vez, una máquina no solo competía con un humano en un terreno complejo, sino que lo hacía de una forma que desafiaba nuestra propia manera de pensar.

Seguir leyendo «AlphaGo: ¿predicción… o pensamiento divino?»

Del absentismo a la contratación temporal: un proyecto de regresión lineal simple paso a paso

A menudo se habla de predicción cuantitativa como si fuera un terreno reservado a modelos complejos, librerías sofisticadas y sistemas difíciles de explicar. Pero no siempre hace falta empezar por ahí. De hecho, muchas veces creo que ocurre lo contrario: para entender bien qué significa predecir con datos, conviene empezar por un modelo pequeño, transparente y fácil de interpretar.

Por eso he querido compartir en GitHub un proyecto completo construido alrededor de una pregunta muy concreta: cómo estimar cuántos días de contratos temporales de cobertura pueden generarse cuando aumenta el absentismo laboral por incapacidad temporal (IT). No he preparado este repositorio para presentar un gran sistema productivo ni una solución definitiva. Lo he hecho para mostrar, de forma reproducible, cómo puede utilizarse una regresión lineal simple como método de predicción cuantitativa.

La idea del proyecto no es solo enseñar una ecuación. Es enseñar un recorrido. Cómo se parte de una pregunta real, cómo se traduce esa pregunta a variables medibles, cómo se preparan los datos, cómo se comprueba si la relación tiene sentido y cómo se convierte finalmente el modelo en una pequeña aplicación utilizable. En el fondo, lo que me interesaba compartir no era solo el resultado, sino el proceso.

Seguir leyendo «Del absentismo a la contratación temporal: un proyecto de regresión lineal simple paso a paso»

La regresión lineal simple: el primer puente entre datos y predicción

En muchos contextos cotidianos observamos relaciones entre variables: más horas de estudio suelen asociarse con mejores notas, viviendas más grandes suelen tener precios más altos, y más entrenamiento suele mejorar el rendimiento deportivo.

La pregunta que surge de forma natural es sencilla pero profunda: ¿podemos cuantificar estas relaciones para anticipar lo que ocurrirá en el futuro?

Uno de los modelos más simples y elegantes para responder a esta pregunta es la regresión lineal simple. A pesar de su aparente sencillez, este modelo constituye uno de los pilares fundamentales de la predicción cuantitativa.

Seguir leyendo «La regresión lineal simple: el primer puente entre datos y predicción»

De la pregunta a la predicción: cómo se construye un modelo cuantitativo

Cuando se habla de inteligencia artificial o aprendizaje automático, muchas veces se piensa inmediatamente en algoritmos complejos. Sin embargo, en la práctica los modelos son solo una pequeña parte del trabajo.

La predicción cuantitativa no consiste simplemente en “aplicar un algoritmo”. Consiste en recorrer un proceso estructurado que transforma datos en conocimiento útil para tomar decisiones.

Ese proceso es lo que en ciencia de datos se conoce como el ciclo de vida de un proyecto de Machine Learning.

Aunque los modelos puedan ser muy diferentes —desde una simple regresión hasta sistemas avanzados de deep learning—, casi todos los proyectos siguen una lógica muy similar.

En términos generales, este recorrido puede resumirse en seis etapas:

  1. Definir el objetivo
  2. Adquirir los datos
  3. Explorar la información
  4. Preparar el dataset
  5. Construir el modelo
  6. Desplegar y monitorizar

En este post veremos brevemente qué ocurre en cada una de estas fases. En futuras publicaciones iré mostrando proyectos reales que siguen exactamente esta misma estructura. Estos nos servirán de ejemplo de los modelos de predicción cuantitativa más utilizados

Seguir leyendo «De la pregunta a la predicción: cómo se construye un modelo cuantitativo»

El Método Delphi: cuando la predicción cualitativa se vuelve estructurada

En un post anterior clasificábamos los métodos de previsión en dos grandes familias: cuantitativos y cualitativos. Dentro de los cualitativos podemos distinguir aquellos basados en juicio individual (opinión experta, analogías históricas, escenarios narrativos) y aquellos que intentan estructurar el juicio colectivo para reducir sesgos. El método Delphi pertene a esta segunda categoria.

No es predicción basada en datos en sentido estricto porque no parte de series temporales ni modelos matemático pero tampo es simple intuición. Es, probablemente, el intento más sofisticado del siglo XX de convertir el juicio experto en una herramienta sistemática de predicción.

Este método nació además en un contexto donde equivocarse podía significar una guerra nuclear.

Seguir leyendo «El Método Delphi: cuando la predicción cualitativa se vuelve estructurada»

Predicción cuantitativa por simulación: cuando proyectar no basta y necesitamos recrear el sistema

En el post anterior vimos cómo la predicción cuantitativa analítica parte de una estructura estimada y la proyecta hacia el futuro. Funciona especialmente bien cuando el fenómeno es relativamente estable y las relaciones pueden formalizarse mediante una ecuación o función. Pero no todos los sistemas se comportan así.

Hay contextos donde:

  • Las interacciones entre elementos generan dinámicas emergentes.
  • La incertidumbre es central y acumulativa.
  • Los resultados no dependen de una única trayectoria, sino de muchas posibles.
  • El comportamiento futuro depende de decisiones que se retroalimentan.

En estos casos, en lugar de resolver un modelo, necesitamos simular un sistema. Eso nos lleva a la segunda gran familia de la predicción cuantitativa: la predicción basada en simulación.

Seguir leyendo «Predicción cuantitativa por simulación: cuando proyectar no basta y necesitamos recrear el sistema»