De la pregunta a la predicción: cómo se construye un modelo cuantitivo

Cuando se habla de inteligencia artificial o aprendizaje automático, muchas veces se piensa inmediatamente en algoritmos complejos. Sin embargo, en la práctica los modelos son solo una pequeña parte del trabajo.

La predicción cuantitativa no consiste simplemente en “aplicar un algoritmo”. Consiste en recorrer un proceso estructurado que transforma datos en conocimiento útil para tomar decisiones.

Ese proceso es lo que en ciencia de datos se conoce como el ciclo de vida de un proyecto de Machine Learning.

Aunque los modelos puedan ser muy diferentes —desde una simple regresión hasta sistemas avanzados de deep learning—, casi todos los proyectos siguen una lógica muy similar.

En términos generales, este recorrido puede resumirse en seis etapas:

  1. Definir el objetivo
  2. Adquirir los datos
  3. Explorar la información
  4. Preparar el dataset
  5. Construir el modelo
  6. Desplegar y monitorizar

En este post veremos brevemente qué ocurre en cada una de estas fases. En futuras publicaciones iré mostrando proyectos reales que siguen exactamente esta misma estructura. Estos nos servirán de ejemplo de los modelos de predicción cuantitativa más utilizados

Seguir leyendo «De la pregunta a la predicción: cómo se construye un modelo cuantitivo»

Reseña del libro homo deus

Introducción

Homo Deus: Breve historia del mañana, publicado en 2015, fue escrito por el historiador Yuval Noah Harari. Este autor israelí se hizo mundialmente conocido gracias al éxito de su anterior obra titulada Sapiens: De animales a dioses, la cual fue traducida a treinta idiomas y vendió más de un millón de ejemplares.

En Homo Deus Harari revisa la historia de la humanidad desde un punto de vista evolutivo y especula con el futuro de nuestra especie teniendo en cuenta nuestro pasado y naturaleza. De esta forma el libro se divide en 3 secciones: Seguir leyendo «Reseña del libro homo deus»

Reseña del libro aprender con big data

Introducción

Aprender con big data, publicado en 2014, fue escrito por dos autores que son unos reconocidos expertos en el mundo de los datos masivos. Por un lado, tenemos a Viktor Mayer-Schönberger  que ha enseñado gobernanza de internet en prestigiosas universidades como Oxford y Harvard y, además, ha publicado 2 libros y numerosos artículos sobre big data. Por otro lado, tenemos a Kenneth Cukier que es un escritor y periodista en The Economist que también ha escrito junto a Viktor sobre el nuevo paradigma que representa los big data en nuestra sociedad. Seguir leyendo «Reseña del libro aprender con big data»

Reseña del libro la señal y el ruido

Introducción

La señal y el ruido, publicado en 2012, fue escrito por Nate Silver un estadístico y escritor especialista en predicciones. El autor es fundador del blog FiveThirtyEight donde se hacen predicciones de temas tan diferentes como deportes y contiendas electorales. Su amor hacia la estadística le hizo escribir el libro que nos ocupa. En él se nos explica, de una forma sorprendentemente entretenida, porqué nos resulta tan difícil predecir eventos futuros y nos propone un método para minimizar los elementos que hacen que erremos nuestro pronóstico (lo que él llama ruido) y maximizar los elementos que lo hacen más acertado (lo que él llama señales). Seguir leyendo «Reseña del libro la señal y el ruido»

Reseña del libro las bases de Big Data

Introducción

Las bases de Big Data, publicado en 2015, está escrito por Rafael Caballero Roldán y Enrique Martín Martín, ambos profesores de informática de la Universidad Complutense de Madrid, especializados en Big Data y Data Science. Este breve libro (apenas tiene 110 páginas) nos cuenta a que hace referencia el concepto “big data” y nos describe el funcionamiento de ciertas herramientas informáticas ideadas para trabajar en entornos de datos masivos.

Así mismo, el libro nos aporta un contexto, puesto que nos narra la historia de la gestión de datos. También nos detalla algunos ejemplos de grandes empresas que utilizan soluciones big data y nos hace un pronóstico de la nueva revolución tecnológica que, en mi opinión, será “el internet de las cosas”. Seguir leyendo «Reseña del libro las bases de Big Data»

Reseña del libro Small Data

Introducción

El autor, Martin Lindstrom, es un reconocido consultor de marketing que ha trabajado para las principales multinacionales del mundo. Este consultor danés demuestra una dedicación plena al estudio de la psicología del consumo de diferentes partes del mundo. Él mismo dice que pasa una media de 300 días al año viajando por su trabajo, que consiste en ayudar a las empresas que le contratan a relanzar un producto o una marca.

En este libro se nos describe su particular método para conseguir información valiosa y establecer hipótesis que puedan ayudar a diseñar políticas de marketing exitosas. Se nos explica su metodología mediante la narración de casos reales vividos en el desempeño de
su interesante oficio. Seguir leyendo «Reseña del libro Small Data»