1 Introducción

Este bookdown sirven como notas para el curso Aprendizaje Automático 1 impartido en el Grado de Estadística de la UAB

El objetivo de este material es familiarizar al alumno con diferentes métodos de aprendizaje automático (machine learning en inglés) desde un punto de vista aplicado haciendo énfasis a situaciones donde se dispone de grandes cantidades de datos.

Los contenidos incluyen los siguientes temas:

  • Breve introducción a Tidyverse
  • Introducción al aprendizaje automático
  • Regresión lineal y logística
  • Métodos de regularización
  • Pasos previos a la creación de un modelo predictivo y medidas de validación
  • Datos no balanceados
  • Métodos de aprendizaje automático
    • Arboles de clasificación
    • K-vecinos más cercanos
    • Árboles: clasificación, regresión, bagged - Random Forest - Boosting - XGBoost
  • La librería ‘caret’
  • La librería ‘H20’
  • Modelos no lineales
    • Splines
    • MARS
    • GAM

En el aula virtual de la asignatura (Moodle) se dispondrán de numerosas preguntas de autoevaluación para que el alumno pueda ver si adquiere los conocimientos descritos en cada sesión teórica, así como varias prácticas que permitirán formar al alumno en el análisis de datos mediante las principales técnicas de aprendizaje automático utilizando datos reales usando el software R.

Algunas partes de este material está inspirados en vignettes que se referencian en cada capítulo. Los ejemplos de regresión lineal se basan en el trabajo de Jeff Webb. Este material está licenciado bajo una Creative Commons Attribution 4.0 International License.