Análisis de datos con Python
Análisis de datos con Python
Tecnologías informáticas - Especialización
  • 40 horas
  • 8 semanas. 4-6 horas semanales
  • 90€ (UCM) o 100€ (no UCM)
Matricúlate ahora

Descripción

El lenguaje Python juega un papel fundamental en el contexto de la analítica de datos y Big Data, ya que dispone de las herramientas para casi todos los aspectos relacionados con la computación científica. Hasta ahora, entre los lenguajes que más se usaban para realizar análisis y visualización de datos se encontraban Matlab y R. Sin embargo, en los últimos años Python se ha hecho muy popular entre los desarrolladores de aplicaciones y analistas de datos. Una de las razones es que Python es un lenguaje que se focaliza en tener una sintaxis limpia y fácil de leer. Posee librerías específicas que permiten realizar estadísticas de forma eficiente sin tener que escribir complicados algoritmos. Una ventaja sustancial de Python con respecto a otros lenguajes es que es posible diseñar la totalidad del desarrollo en el mismo lenguaje, ya que posee las librerías necesarias para hacer un análisis completo de los datos: NumPy / SciPy, matplotlib, pandas y statmodels.

El objetivo del curso es introducir al alumno en la programación científica en Python. En particular, se abordarán aquellas partes del lenguaje y aquellas librerías que resultan necesarias para resolver el amplio conjunto de problemas relacionados con el análisis estadístico y la visualización de datos.

Pulsa aquí para ver
una lección de ejemplo del curso

A quién va dirigido

Este curso va dirigido a todos aquellos estudiantes y profesionales que suelan trabajar con grandes cantidades de datos y que necesiten extraer información interesante de los mismos.

Requisitos

Es necesario tener unos conocimientos mínimos del lenguaje de programación Python. Es recomendable haber realizado el curso CFI de Introducción a la programación en Python antes de realizar este curso.

Contenidos

  1. Introducción a Python. El entorno de desarrollo Jupyter Notebook. Uso y principales funcionalidades
  2. Numerical Python. Presentación de la librería básica para la realización de cálculo científico NumPy. Creación de arrays. Tratamiento y proceso de colecciones de datos. Operaciones vectorizadas. Funciones universales. Entrada/salida.
  3. Pandas. Presentación de la librería Pandas. Las estructuras de datos Series y DataFrames. Características y operaciones básicas asociadas a estas estructuras. Limpieza y transformación de datos. Tratamiento de datos perdidos. Combinación de dataframes; operaciones merge y join. Estadística descriptiva en Pandas. Grupos y operaciones de agregación. Carga y almacenamiento de datos.

Software

En este curso se va a utilizar el software Anaconda con Python 3. Este software estará instalado en las aulas del curso.

Matrículate Ahora