En este Curso en Acciones de procesamiento de datos haremos una aproximación a diferentes alternativas de procesamiento de datos como la extracción de información de sitios web (web scraping), generación de conocimiento a partir de textos (text mining) y la visualización de datos como facilitador del descubrimiento de conclusiones y mejora en la toma de decisiones.
Este curso forma parte del Master en Data Science y Big Data. Si quieres ampliar tu formación, consulta el programa completo.
En este Curso en Acciones de procesamiento de datos haremos una aproximación a diferentes alternativas de procesamiento de datos como la extracción de información de sitios web (web scraping), generación de conocimiento a partir de textos (text mining) y la visualización de datos como facilitador del descubrimiento de conclusiones y mejora en la toma de decisiones.
Este curso forma parte del Master en Data Science y Big Data. Si quieres ampliar tu formación, consulta el programa completo.
Contenidos del curso:
El web scraping consiste en el proceso automatizado de extracción de datos de sitios web, simulando el proceso de navegación de un usuario.
Permite resolver la necesidad de recoger información cuando no disponemos de una API, esta no es gratuita o está limitada, o bien no permite extraer todos los datos requeridos.
Diferenciamos en web scraping (extracción de datos de una o varias webs) y web spider (recorre enlaces en la web).
Podemos implementar estos procesos de extracción de datos con aplicaciones como Octoparse, UiPath RPA, Data Miner y Librerías / frameworks como BeutifulSoup, Scrapy o Jauntium.
En esta clase sobre web scraping, se abordan conceptos fundamentales relacionados con la obtención de datos de la web de manera automatizada.
Comenzamos con una introducción a la evolución de la web y su abundancia de datos, para luego explorar los procesos de crawling, scraping y parsing. También se discuten los riesgos y desventajas asociados con el web scraping.
En la parte práctica, se realizan ejemplos concretos de scraping, como la extracción de texto de un discurso, el seguimiento del valor de una criptomoneda y la extracción de tablas de una página web.
En esta clase sobre servicios web y APIs, exploramos conceptos esenciales relacionados con servicios web, API, el protocolo HTTP (métodos GET y POST), llamadas a APIs, seguridad y uso de APIs, así como APIs de inteligencia artificial.
Además, realizamos ejercicios prácticos llamando a diversas APIs, como la de calidad del aire, predicciones meteorológicas, la NASA y utilizamos la librería de Yahoo Finance en Python, que se basa en la API de Yahoo.
El 95% de nuestros alumnos está trabajando o emprende cuando finaliza sus estudios
Somos la mayor comunidad de profesionales digitales del mundo
Expertos en formación online: más de 10 años liderando la innovación del elearning
El 95% de nuestros alumnos consiguen mejorar su situación al finalizar sus estudios
Curso en Acciones de procesamiento de datos: Hadoop
Curso en Acciones de procesamiento de datos: Hadoop