Curso ONLINE

Curso en Acciones de procesamiento de datos: Hadoop

Impartido por Rafael Zambrano López, Head of Applied Science en Openbank
Inicio: 13 Febrero 2025
1 mes
4.8

Presentación del curso

En este Curso en Acciones de procesamiento de datos haremos una aproximación a diferentes alternativas de procesamiento de datos como la extracción de información de sitios web (web scraping), generación de conocimiento a partir de textos (text mining) y la visualización de datos como facilitador del descubrimiento de conclusiones y mejora en la toma de decisiones.

Este curso forma parte del Master en Data Science y Big Data. Si quieres ampliar tu formación, consulta el programa completo.

En este Curso en Acciones de procesamiento de datos haremos una aproximación a diferentes alternativas de procesamiento de datos como la extracción de información de sitios web (web scraping), generación de conocimiento a partir de textos (text mining) y la visualización de datos como facilitador del descubrimiento de conclusiones y mejora en la toma de decisiones.

Este curso forma parte del Master en Data Science y Big Data. Si quieres ampliar tu formación, consulta el programa completo.

¿Qué aprenderás en este curso?

Al finalizar el Curso en Acciones de procesamiento de datos serás perfectamente capaz de:

  • Saber obtener y procesar datos semi-estructurados y no estructurados obtenidos mediante web scraping y minería de texto.
  • Ser capaz de visualizar e interpretar la información que subyace a datos de variada complejidad.

¿Para quién es este curso?

El Curso en Acciones de procesamiento de datos proporciona formación específicamente orientada a los siguientes perfiles:

  • Ingenieros que tengan por objetivo una actualización de sus conocimientos y el desarrollo de nuevas competencias dentro de la Inteligencia Artificial
  • Programadores que tengan por objetivo ampliar sus conocimientos y capacidades en el mundo de la ciencia de datos para su desarrollo profesional
  • Analistas de datos con experiencia que quieran dar el salto a los aspectos más profundos de la tecnología

El curso incluye:

  • 3 clases (1 mes)

  • 3 sprint semanales

  • Masterclass y/o tutorias

  • 1 proyecto

  • Diploma IEBS

  • Bolsa de empleo

Plan de estudios

Contenidos del curso:

  • Bienvenida y presentación
Tema 1: Web Scrapping

Resumen

El web scraping consiste en el proceso automatizado de extracción de datos de sitios web, simulando el proceso de navegación de un usuario.

Permite resolver la necesidad de recoger información cuando no disponemos de una API, esta no es gratuita o está limitada, o bien no permite extraer todos los datos requeridos.

Diferenciamos en web scraping (extracción de datos de una o varias webs) y web spider (recorre enlaces en la web).

Podemos implementar estos procesos de extracción de datos con aplicaciones como Octoparse, UiPath RPA, Data Miner y Librerías / frameworks como BeutifulSoup, Scrapy o Jauntium.

Objetivos

  • ¿Qué es el web scraping?
  • Conceptos básicos de su funcionamiento: HTML y Parsing
  • ¿Es legal utilizar estas técnicas?
  • Herramientas de implementación: Aplicaciones y Librerías / Frameworks

Temario

  • Web Scrapping
    • Introducción y conceptos básicos
    • Aspectos legales, necesidades y desafíos del Web Scrapping
  • Implementación del Web Scraping
    • Clasificación e Implementación: Octoparse & Data Miner
    • Práctica con Data Miner
    • Implementación: Ui Path RPA & Microsoft Excel
    • Implementación: Python (I)
    • Implementación: Python (II)
Tema 2: Web Scraping

Resumen

En esta clase sobre web scraping, se abordan conceptos fundamentales relacionados con la obtención de datos de la web de manera automatizada.

Comenzamos con una introducción a la evolución de la web y su abundancia de datos, para luego explorar los procesos de crawling, scraping y parsing. También se discuten los riesgos y desventajas asociados con el web scraping.

En la parte práctica, se realizan ejemplos concretos de scraping, como la extracción de texto de un discurso, el seguimiento del valor de una criptomoneda y la extracción de tablas de una página web.

Objetivos

  • Comprender la evolución de la web y su importancia como fuente de datos. 
  • Familiarizarse con los conceptos clave de crawling, scraping y parsing en el contexto del web scraping.
  • Identificar los riesgos y desafíos asociados con la extracción de datos de la web de manera ética y legal. 
  • Adquirir habilidades prácticas para realizar scraping en la web, incluyendo la extracción de texto, seguimiento de datos dinámicos y extracción de tablas. 
  • Desarrollar la capacidad de aplicar los conocimientos adquiridos en la clase para obtener datos específicos de la web de manera efectiva y ética.

Temario

  • Introducción a la web
    • Scraping, crawling y parsing
  • Extracción de datos web
    • Acceso a páginas web con Python
  • Ejemplos prácticos
    • Obtención de la frecuencia de palabras de un discurso
    • Web scraping de bitcoin
    • Web scraping con pandas
  • Agente de usuario
    • Práctica mediante un ejemplo de la web transfermarkt
  • Web Scraping con Selenium
    • Práctica mediante un ejemplo de web scraping
  • Proyecto
    • Pasos a seguir: Fase II del proyecto
Tema 3: Servicios Web y APIs

Resumen

En esta clase sobre servicios web y APIs, exploramos conceptos esenciales relacionados con servicios web, API, el protocolo HTTP (métodos GET y POST), llamadas a APIs, seguridad y uso de APIs, así como APIs de inteligencia artificial.

Además, realizamos ejercicios prácticos llamando a diversas APIs, como la de calidad del aire, predicciones meteorológicas, la NASA y utilizamos la librería de Yahoo Finance en Python, que se basa en la API de Yahoo. 

Objetivos

  • Comprender los conceptos fundamentales de servicios web y APIs, incluyendo la diferencia entre un servicio web y una API. 
  • Familiarizarse con los principios de las APIs REST y el protocolo HTTP, con un enfoque en los métodos GET y POST. 
  • Aprender a realizar llamadas a APIs, procesar respuestas y aplicar conceptos de seguridad al interactuar con servicios web. 
  • Adquirir habilidades para trabajar con APIs en el entorno de programación de Python

Temario

  • Introducción a los servicios web y APIs
    • Conceptos de servicios web, API y protocolo HTTP
    • APIs de Inteligencia Artificial
  • Ejemplos prácticos
    • API para obtener la calidad del aire
    • API de previsión climática
    • API de la NASA
    • Librería de Yahoo Finance en Python
  • Proyecto
    • Pasos a seguir: Fase III del proyecto

Experto

Rafael Zambrano López

Head of Applied Science en Openbank

Nuestros alumnos opinan

Juan Manuel Hernández Espinosa, Senior Petroleum Economist & Data Scientist  
¡He disfrutado mucho este viaje! Un logro más, ahora es el momento de aplicar todos los aprendizajes y aprovecharlos en todos los aspectos profesionales!, Gracias IEBS Business School.
Roberto Esteves, Gerente General en Masapp  
Solamente pasaba para compartirles un pequeño éxito, haber terminado el postgrado en el IEBS Business School en "Data Science y Machine Learning", esto me sirve para poder seguir dando mejores capacitaciones.
Arantxa Martínez Capitán, Técnico BPO en Integra HCM  
En el Postgrado en Business Intelligence & BD he trabajado con herramientas como Alteryx, RapidMiner, MySQL y Microsoft Power BI. Con ellas he ido encajando piezas hasta crear el puzle completo mediante el desarrollo de casos prácticos reales.
Orlando Hernández Jiménez, Consultant, Data Scientist and Trainer in BI, ECM, BigData, ML & Blockchain  
Todos los objetivos claros en combinación con dedicación y esfuerzo, darán un extraordinario y satisfactorio resultado. Así que a seguir con los siguientes objetivos #iebs.

¿Por qué elegirnos?

Descubre lo que nos diferencia

95%Empleo

El 95% de nuestros alumnos está trabajando o emprende cuando finaliza sus estudios

Empleo
175kAlumnos

Somos la mayor comunidad de profesionales digitales del mundo

Comunidad
13Años

Expertos en formación online: más de 10 años liderando la innovación del elearning

Experiencia
95%Satisfacción

El 95% de nuestros alumnos consiguen mejorar su situación al finalizar sus estudios

Seguridad

Curso en Acciones de procesamiento de datos: Hadoop

U$S 510

  • Big data & IA
Inicio: 13 Febrero 2025
1 mes
Online
Ininterrumpido 24/7
Diploma de IEBS

Curso en Acciones de procesamiento de datos: Hadoop

U$S 510