Del absentismo a la contratación temporal: un proyecto de regresión lineal simple paso a paso

A menudo se habla de predicción cuantitativa como si fuera un terreno reservado a modelos complejos, librerías sofisticadas y sistemas difíciles de explicar. Pero no siempre hace falta empezar por ahí. De hecho, muchas veces creo que ocurre lo contrario: para entender bien qué significa predecir con datos, conviene empezar por un modelo pequeño, transparente y fácil de interpretar.

Por eso he querido compartir en GitHub un proyecto completo construido alrededor de una pregunta muy concreta: cómo estimar cuántos días de contratos temporales de cobertura pueden generarse cuando aumenta el absentismo laboral por incapacidad temporal (IT). No he preparado este repositorio para presentar un gran sistema productivo ni una solución definitiva. Lo he hecho para mostrar, de forma reproducible, cómo puede utilizarse una regresión lineal simple como método de predicción cuantitativa.

La idea del proyecto no es solo enseñar una ecuación. Es enseñar un recorrido. Cómo se parte de una pregunta real, cómo se traduce esa pregunta a variables medibles, cómo se preparan los datos, cómo se comprueba si la relación tiene sentido y cómo se convierte finalmente el modelo en una pequeña aplicación utilizable. En el fondo, lo que me interesaba compartir no era solo el resultado, sino el proceso.

Seguir leyendo «Del absentismo a la contratación temporal: un proyecto de regresión lineal simple paso a paso»

La regresión lineal simple: el primer puente entre datos y predicción

En muchos contextos cotidianos observamos relaciones entre variables: más horas de estudio suelen asociarse con mejores notas, viviendas más grandes suelen tener precios más altos, y más entrenamiento suele mejorar el rendimiento deportivo.

La pregunta que surge de forma natural es sencilla pero profunda: ¿podemos cuantificar estas relaciones para anticipar lo que ocurrirá en el futuro?

Uno de los modelos más simples y elegantes para responder a esta pregunta es la regresión lineal simple. A pesar de su aparente sencillez, este modelo constituye uno de los pilares fundamentales de la predicción cuantitativa.

Seguir leyendo «La regresión lineal simple: el primer puente entre datos y predicción»

Historia de la regresión: de la regla de tres al machine learning

Cuando hoy escuchamos palabras como machine learning o inteligencia artificial, es fácil imaginar algoritmos sofisticados trabajando sobre enormes bases de datos. Sin embargo, la idea fundamental detrás de muchos de estos modelos es mucho más antigua. En el fondo, todos intentan responder una pregunta sencilla: si una variable cambia, cómo cambia otra.

Responder a esa pregunta con números ha sido una preocupación constante durante siglos. Mucho antes de que existiera la estadística formal, científicos, comerciantes y astrónomos ya intentaban encontrar patrones que permitieran anticipar resultados.

La regresión moderna es el resultado de ese largo esfuerzo intelectual. Su historia no es una ruptura tecnológica reciente, sino una evolución gradual de ideas que comienzan con cálculos muy simples y terminan en los algoritmos de aprendizaje automático actuales.

1. Cuando predecir era hacer cuentas

Seguir leyendo «Historia de la regresión: de la regla de tres al machine learning»

De la pregunta a la predicción: cómo se construye un modelo cuantitivo

Cuando se habla de inteligencia artificial o aprendizaje automático, muchas veces se piensa inmediatamente en algoritmos complejos. Sin embargo, en la práctica los modelos son solo una pequeña parte del trabajo.

La predicción cuantitativa no consiste simplemente en “aplicar un algoritmo”. Consiste en recorrer un proceso estructurado que transforma datos en conocimiento útil para tomar decisiones.

Ese proceso es lo que en ciencia de datos se conoce como el ciclo de vida de un proyecto de Machine Learning.

Aunque los modelos puedan ser muy diferentes —desde una simple regresión hasta sistemas avanzados de deep learning—, casi todos los proyectos siguen una lógica muy similar.

En términos generales, este recorrido puede resumirse en seis etapas:

  1. Definir el objetivo
  2. Adquirir los datos
  3. Explorar la información
  4. Preparar el dataset
  5. Construir el modelo
  6. Desplegar y monitorizar

En este post veremos brevemente qué ocurre en cada una de estas fases. En futuras publicaciones iré mostrando proyectos reales que siguen exactamente esta misma estructura. Estos nos servirán de ejemplo de los modelos de predicción cuantitativa más utilizados

Seguir leyendo «De la pregunta a la predicción: cómo se construye un modelo cuantitivo»

Predicción cuantitativa analítica: cuándo usarla y cómo elegir modelo

En el post anterior vimos que la predicción no siempre empieza con datos y modelos: a veces lo más razonable es recurrir a estrategias cualitativas. Pero cuando el fenómeno es lo bastante estable, repetible y medible, la predicción cuantitativa ofrece algo muy valioso: un lenguaje común para comparar, evaluar y mejorar.

Ahora bien, dentro de la predicción cuantitativa conviene hacer una distinción fundamental porque no todos los modelos numéricos funcionan igual.

  • Algunos resuelven una estructura matemática estimada a partir de los datos y producen una predicción directa.
  • Otros, en cambio, recrean el sistema múltiples veces mediante simulación, generando dinámicas posibles y distribuciones emergentes.

Este post se centra en la primera familia: la predicción cuantitativa analítica.

Seguir leyendo «Predicción cuantitativa analítica: cuándo usarla y cómo elegir modelo»

La tasa base: el punto de partida de toda predicción sensata

Cuando intentamos predecir algo —el precio de la vivienda, la inflación, la probabilidad de aprobar unos presupuestos o incluso el absentismo laboral— solemos empezar por las historias: explicaciones plausibles, datos recientes, señales llamativas. El problema es que, muy a menudo, empezamos por el lugar equivocado.

Antes de añadir matices, escenarios o modelos sofisticados, hay una pregunta más simple y más incómoda que deberíamos hacernos siempre:

¿Qué suele pasar, de media, cuando no sabemos nada más?

Esa respuesta es lo que llamamos tasa base.

¿Qué es exactamente una tasa base?

La tasa base es la frecuencia histórica con la que ocurre un evento en una población o contexto comparable. No explica por qué ocurre algo, solo con qué frecuencia ocurre normalmente.

Ejemplos sencillos:

  • ¿Qué porcentaje de proyectos públicos se retrasa?
  • ¿Cuántos años, de media, la inflación supera el 3 %?
  • ¿Con qué frecuencia se prorrogan los presupuestos en sistemas parlamentarios fragmentados?

La tasa base no pretende ser brillante. Pretende ser estable y ahí está su fuerza.

Seguir leyendo «La tasa base: el punto de partida de toda predicción sensata»

Tres predicciones para 2026: un ejercicio explícito de incertidumbre

Hablar del futuro suele llevarnos a dos extremos igual de poco útiles: la seguridad impostada (“esto va a pasar”) o la renuncia total (“nadie puede saber nada”). Entre ambos hay un espacio mucho más interesante: el de las predicciones probabilísticas, aquellas que no eliminan la incertidumbre, pero la hacen visible y discutible.

Este post plantea tres predicciones evaluables para 2026 en España. Son tres pronósticos sobre eventos que, a mi juicio, se sitúan en una zona “Ricitos de Oro”: lo bastante complejos como para no ser triviales, pero con información suficiente como para permitir un análisis razonado, y con decisiones reales en juego. Además, son especialmente relevantes en mi entorno.

No están pensadas para impresionar por su precisión puntual, sino para dejar constancia del razonamiento que hay detrás: qué factores considero importantes, cuáles pesan más y, sobre todo, qué tipo de evidencia me haría cambiar de opinión.

El compromiso es doble:
• Las predicciones se revisarán trimestralmente, recalibrando las probabilidades.
• A final de año se evaluará no solo el resultado, sino también la calidad del proceso seguido.

Seguir leyendo «Tres predicciones para 2026: un ejercicio explícito de incertidumbre»

Por qué sobreestimamos los tiburones y subestimamos los cocos: el poder del sesgo de disponibilidad

Continuamos con esta serie de post donde exploramos las ideas clave del libro Pensar rápido, pensar despacio de Daniel Kahneman —una obra fundamental para entender cómo pensamos, decidimos… y, por extensión, cómo predecimos— y hoy hablaremos de uno de los sesgos más sutiles, pero también más poderosos: el sesgo de disponibilidad.

¿Qué es el sesgo de disponibilidad?

El sesgo de disponibilidad es la tendencia que tenemos a juzgar la probabilidad o frecuencia de un evento según la facilidad con la que recordamos ejemplos de él. En otras palabras: cuanto más fácilmente recordamos algo, más probable nos parece que sea.

No estimamos con datos, sino con nuestros recuerdos y éstos —como bien explica Kahneman— no son un registro fiel del mundo, sino un archivo sesgado por la emoción, la atención y los medios.

Un ejemplo clásico del libro

Kahneman y Tversky realizaron un experimento muy revelador: preguntaron a un grupo de personas si, en inglés, hay más palabras que empiecen por la letra K o más palabras que tengan la K como tercera letra.

La mayoría respondió que hay más palabras que empiezan por K, porque es más fácil recordar ejemplos como kite o king que pensar en palabras con K en la tercera posición (make, bake…). Sin embargo, la respuesta correcta era la contraria: hay más palabras con “K” en la tercera posición (¡3 veces más!).

El problema no es la falta de inteligencia, sino el mecanismo del Sistema 1, el pensamiento rápido e intuitivo: confunde “lo fácil de recordar” con “lo frecuente en el mundo”.

Seguir leyendo «Por qué sobreestimamos los tiburones y subestimamos los cocos: el poder del sesgo de disponibilidad»

Reseña del libro «Pensar rápido, pensar despacio»

Introducción

Pensar rápido, pensar despacio es un libro publicado en 2011 por el psicólogo Daniel Kahneman (Tel Aviv, 1934 – Nunningen, 2024), profesor emérito en la Universidad de Princeton y galardonado con el Premio Nobel de Economía en 2002, junto a Vernon Smith. Su mayor aportación, desarrollada junto con Amos Tversky, fue la Teoría de las perspectivas, que muestra cómo los individuos toman decisiones en contextos de incertidumbre alejándose de los principios de la probabilidad, recurriendo a atajos mentales o heurísticos.

En esta obra, Kahneman sintetiza décadas de investigación sobre cómo pensamos y decidimos, presentando de manera accesible la existencia de dos modos de pensamiento: el Sistema 1, rápido, automático e intuitivo; y el Sistema 2, lento, deliberado y analítico. La peculiaridad es que la mayor parte de las veces no somos conscientes de cuál de ellos domina nuestras decisiones.

El libro se organiza en tres grandes bloques: en el primero se explica el funcionamiento de los dos sistemas de pensamiento; en el segundo se analizan los sesgos y heurísticos que nos llevan a errores; y en el tercero se aborda cómo tomamos decisiones bajo incertidumbre, incluyendo la teoría de las perspectivas y la distinción entre el yo que experimenta y el yo que recuerda.

Seguir leyendo «Reseña del libro «Pensar rápido, pensar despacio»»

Cómo hacer un post-mortem de tus predicciones

Para concluir la serie de posts donde hemos analizado y reflexionado sobre conceptos e ideas del libro Superforecasting: The Art and Science of Prediction, en esta entrada hablaremos de la práctica del post-mortem: una herramienta que nos ayudará a mejorar nuestras futuras predicciones a partir de hacer las “autopsias” de nuestras predicciones pasadas.

Cuando lanzamos una predicción sobre el futuro, el tiempo se convierte en juez.
La fecha llega, el evento ocurre (o no) y ya no hay incertidumbre. Entonces aparece un momento crítico que a menudo pasamos por alto: el análisis post-mortem.

Un post-mortem es la autopsia de una predicción ya caducada. No se trata solo de comprobar si “acertamos” o “fallamos”, sino de contrastar nuestra estimación con el resultado real y, sobre todo, de sacar conclusiones que nos hagan mejores pronosticadores.

Seguir leyendo «Cómo hacer un post-mortem de tus predicciones»