Curso Python para data science y big data esencial




Calcula los usuarios online de tu web o blog

Python está viviendo una segunda juventud como lenguaje de programación, ajustado codo con codo a una de las grandes necesidades de ésta década: el trabajo con grandes volúmenes de datos. En este curso, vas a aprender en primer lugar los fundamentos de Python para Data Science y visualización de datos, para posteriormente aplicarlos en el análisis de grandes volúmenes de datos usando el entorno Spark, una de las herramientas más populares del sector Big Data. El contenido del curso es práctico. Vamos a sentar las bases para que aprendas a desarrollar tu proyecto de datos, de principio a fin.


Bienvenida

Python para data science y big data esencial
52 s
  1. Introducción a Python para data science y big data

    Evaluación de las necesidades de big data
    4 min 58 s
    Instalar Jupyter Notebook
    5 min 16 s
    Instalar PySpark
    5 min 17 s
    Evaluar la eficiencia del código
    4 min 55 s
  2. Gestión de datos en Python

    Introducción al Pandas
    6 min 55 s
    Filtrar datos en Python
    5 min 37 s
    Transformaciones de la base de datos
    6 min 52 s
    Groupby: obtener información esencial
    7 min 7 s
    Tratar datos duplicados y perdidos
    5 min 29 s
    Introducción a la librería Numpy
    7 min 13 s
  3. Gestión de datos avanzada

    Correlaciones. Entender las relaciones entre las variables
    4 min 38 s
    Test de la Chi-Cuadrado
    7 min 37 s
    Análisis de datos extremos
    5 min 27 s
    Principios de las bases de datos relacionales
    3 min 39 s
    Transformar un dataframe en una base de datos relacional
    4 min 30 s
    Joins. Trabajar con bases de datos relacionales
    5 min 20 s
    Paralelizar loops en Python
    4 min
  4. Visualización de datos en Matplotlib

    Introducción al Matplotlib
    3 min 34 s
    Modificar elementos del gráfico en Matplotlib
    4 min 5 s
    Etiquetas y leyendas en Matplotlib
    5 min 25 s
    Gráficos para series temporales en Matplotlib
    4 min 58 s
    Histogramas y box plots en Matplotlib
    5 min 11 s
    Nubes de puntos y mapas de calor en Matplotlib
    6 min 38 s
    Introducción al Plotly. Visualización interactiva
    6 min 43 s
    Gráficos avanzados con Plotly
    7 min 31 s
    Visualización de Mapas con Plotly
    6 min 38 s
  5. Machine Learning esencial: Clustering

    Necesidades de Machine Learning: clustering y modelización
    4 min 51 s
    Preparar los datos para Machine Learning
    5 min 4 s
    K-Means, el algoritmo de clustering
    5 min 44 s
    El algoritmo hierarchical clustering
    5 min 39 s
  6. Machine Learning esencial. Modelización

    Regresión lineal
    7 min 57 s
    Regresión logística
    7 min 10 s
    Naives Bayes Classifier
    7 min 27 s
    Árboles de clasificación y regresión
    7 min 5 s
    Random forest
    4 min 59 s
    Support vector machine
    4 min 19 s
    K-Nearest Neighbours
    5 min 10 s
  7. Trabajar con PySpark

    Introducción a PySpark
    8 min 21 s
    Sintaxis en PySpark. Qué necesitamos saber
    4 min 1 s
    Qué son los RDD (Resilient Distributed Databases)
    4 min 27 s
    Funciones lambda
    5 min 11 s
    Dataframes en PySpark
    8 min 43 s
    Transformaciones básicas en PySpark
    5 min 16 s
    Acciones básicas en PySpark
    3 min 13 s
    Operaciones numéricas con RDD
    3 min 43 s
  8. PySpark avanzado

    Joins en PySpark
    3 min 10 s
    Acumuladores. Cómo detectar patrones en nuestros datos
    3 min 32 s
    Cómo construir funciones map
    3 min 48 s
    Cómo construir funciones reduce
    4 min 32 s
    Ejemplos básicos de MapReduce en PySpark
    5 min 18 s
  9. Desafío y solución: MapReduce

    Desafío: MapReduce aplicado con PySpark
    1 min 35 s
    Resolución de los ejercicios de MapReduce
    8 min 24 s
BOX | MP4 |720p | ESPAÑOL

NOTICE OF EXPIRED LINKS HERE