Cursos ONLINE

Curso en Acciones de procesamiento de datos: Spark

Impartido por Miguel Rodríguez Asensio, Lead Data Scientist en Iberdrola. MSc Big Data Analytics.
Inicio: 6 Febrero 2025
1 mes
4.8

Presentación del curso

Con este Curso en Acciones de procesamiento de datos continuaremos aprendiendo enfoques y técnicas de aprendizaje supervisado. Comenzaremos explorando los árboles de decisión y los Ensembles o combinaciones de múltiples modelos de clasificación, cuándo utilizarlos dentro del ciclo de vida de un proyecto Machine Learning, y cuales son sus ventajas. También exploraremos los bosques aleatorios o Random Forest.

Este curso forma parte del Master en Data Science y Big Data. Si quieres ampliar tu formación, consulta el programa completo.

Con este Curso en Acciones de procesamiento de datos continuaremos aprendiendo enfoques y técnicas de aprendizaje supervisado. Comenzaremos explorando los árboles de decisión y los Ensembles o combinaciones de múltiples modelos de clasificación, cuándo utilizarlos dentro del ciclo de vida de un proyecto Machine Learning, y cuales son sus ventajas. También exploraremos los bosques aleatorios o Random Forest.

Este curso forma parte del Master en Data Science y Big Data. Si quieres ampliar tu formación, consulta el programa completo.

¿Qué aprenderás en este curso?

Al finalizar el Curso en Acciones de procesamiento de datos serás perfectamente capaz de:

  • Saber elegir, entrenar y evaluar algoritmos basados en árboles de decisión para tareas de clasificación y regresión. 
  • Saber implementar modelos que combinen múltiples algoritmos de clasificación para lograr soluciones más robustas, bajo diferentes enfoques de combinación.

¿Para quién es este curso?

El Curso en Acciones de procesamiento de datos proporciona formación específicamente orientada a los siguientes perfiles:

  • Ingenieros que tengan por objetivo una actualización de sus conocimientos y el desarrollo de nuevas competencias dentro de la Inteligencia Artificial
  • Programadores que tengan por objetivo ampliar sus conocimientos y capacidades en el mundo de la ciencia de datos para su desarrollo profesional
  • Analistas de datos con experiencia que quieran dar el salto a los aspectos más profundos de la tecnología

El curso incluye:

  • 3 clases (1 mes)

  • 3 sprint semanales

  • Masterclass y/o tutorias

  • 1 proyecto

  • Diploma IEBS

  • Bolsa de empleo

Plan de estudios

Contenidos del curso:

  • Bienvenida y presentación
Tema 1: Clasificación con KNN, regresión logística y softmax

Temario

  • Introducción
    • Introducción al aprendizaje supervisado
  • Algoritmo KNN
    • Explicación algoritmo KNN
    • Laboratorio algoritmo KNN
  • Algoritmo de clasificación
    • Regresión logística y regresión softmax
    • Laboratorio regresión logística
    • (Opcional) Laboratorio regresión softmax
    • Algoritmos OvO y OvR y refinamiento de modelos
    • (Opcional) Laboratorio OvO y OvR
  • Procesamiento de datos
    • Preparación de los datos
    • Laboratorio Preprocesamiento de datos: parte 1
    • Laboratorio Preprocesamiento de datos: parte 2
  • Bonus: Introducción a Google Colab
    • Tutorial sobre cómo cargar notebooks en Google Colab
    • Primeros pasos con Google Colab
Tema 2: Regresión y clasificación con árboles de decisión

Temario

  • Árboles de decisión
    • Introducción y terminología
    • Control del entrenamiento del árbol
    • Algoritmos para la construcción de árboles de decisión
    • (Opcional) Criterios de selección de variables
    • Consideraciones adicionales
    • Árboles de decisión en Python
    • Laboratorio árboles de decisión
  • Regresión con árboles de decisión
    • Regresión con árboles de decisión
    • Laboratorio regresión
  • Conclusiones
    • Ventajas e inconvenientes
Tema 3: Combinación de clasificadores: ensembles y random forests

Temario

  • Métodos de ensembles
    • Introducción
  • Técnicas de Bagging
    • Bagging
    • Laboratorio Random Forest
  • Técnicas de Boosting
    • Algoritmo AdaBoost
    • Laboratorio AdaBoost
    • Algoritmo Gradient Boosting
    • Gradient Boosting en Python y otras variantes
    • Laboratorio Gradient Boosting
  • Estimaciones robustas
    • Validación cruzada

Experto

Miguel Rodríguez Asensio

Lead Data Scientist en Iberdrola. MSc Big Data Analytics.

Nuestros alumnos opinan

¿Por qué elegirnos?

Descubre lo que nos diferencia

95%Empleo

El 95% de nuestros alumnos está trabajando o emprende cuando finaliza sus estudios

Empleo
175kAlumnos

Somos la mayor comunidad de profesionales digitales del mundo

Comunidad
13Años

Expertos en formación online: más de 10 años liderando la innovación del elearning

Experiencia
95%Satisfacción

El 95% de nuestros alumnos consiguen mejorar su situación al finalizar sus estudios

Seguridad

Curso en Acciones de procesamiento de datos: Spark

U$S 510

  • Big data & IA
Inicio: 6 Febrero 2025
1 mes
Online
Ininterrumpido 24/7
Diploma de IEBS

Curso en Acciones de procesamiento de datos: Spark

U$S 510