Análisis de datos con Python
Análisis de datos con Python
Tecnologías informáticas - Especialización
  • 40 horas
  • 8 semanas. 4-6 horas semanales
  • 60€ (estudiantes UCM) - 100€ (no UCM)
Matricúlate ahora

Descripción

El lenguaje Python juega un papel fundamental en el contexto de la analítica de datos y Big Data, ya que dispone de las herramientas para casi todos los aspectos relacionados con la computación científica. Hasta ahora, entre los lenguajes que más se usaban para realizar análisis y visualización de datos se encontraban Matlab y R. Sin embargo, en los últimos años Python se ha hecho muy popular entre los desarrolladores de aplicaciones y analistas de datos. Una de las razones es que Python es un lenguaje que se focaliza en tener una sintaxis limpia y fácil de leer. Posee librerías específicas que permiten realizar estadísticas de forma eficiente sin tener que escribir complicados algoritmos. Una ventaja sustancial de Python con respecto a otros lenguajes es que es posible diseñar la totalidad del desarrollo en el mismo lenguaje, ya que posee las librerías necesarias para hacer un análisis completo de los datos: NumPy / SciPy, matplotlib, pandas y statmodels.

El objetivo del curso es introducir al alumno en la programación científica en Python. En particular, se abordarán aquellas partes del lenguaje y aquellas librerías que resultan necesarias para resolver el amplio conjunto de problemas relacionados con el análisis estadístico y la visualización de datos.

Pulsa aquí para ver
una lección de ejemplo del curso

A quién va dirigido

Este curso va dirigido a todos aquellos estudiantes y profesionales que suelan trabajar con grandes cantidades de datos y que necesiten extraer información interesante de los mismos.

Requisitos

Es necesario tener unos conocimientos mínimos del lenguaje de programación Python. Es recomendable haber realizado el curso CFI de Introducción a la programación en Python antes de realizar este curso.

Contenidos

  1. Introducción a Python: Introducción al entorno de desarrollo Jupyter Notebook y sus principales características. Elementos básicos del lenguaje.
  2. Numerical Python: Presentación de la librería básica para la realización de cálculo científico NumPy. Presentación de la estructura de datos ndarray para la representación de datos multidimensionales. Creación de arrays. Tratamiento y proceso de colecciones de datos. Operaciones vectorizadas como un mecanismo de cómputo eficiente para este tipo de estructuras. Funciones universales y estadísticas. Entrada/salida.
  3. Las Series y los Datarames de Pandas: Presentación de la librería Pandas. Las estructuras de datos Series y DataFrames. Características y operaciones básicas asociadas a estas estructuras.
  4. Importación/exportación de datasets con Pandas: Lectura y escritura de ficheros de datos en diferentes formatos (.xlsx, .txt, .csv). Lectura y escritura de datos en formato no relacional como JSON y HTML. Conexión con Bases de datos relacionales (MySQL) y realización de consultas para la extracción de datos.
  5. Limpieza, procesamiento y análisis con Pandas: Limpieza y transformación de datos. Tratamiento de datos perdidos. Combinación de dataframes; operaciones merge y join. Estadística descriptiva en Pandas. Grupos y operaciones de agregación.

Software

En este curso se va a utilizar el software Anaconda con Python 3.

Matrículate Ahora