Brochure Python For Data Scientist
Brochure Python For Data Scientist
Bootcamp de Python
for Data Scientist
Presentación
El Bootcamp de Python for Data Scientist brinda la formación prácticas que necesitas para convertirte en un
experto en Ciencia de Datos con Python. Aprenderás desde los fundamentos del lenguaje de programación
hasta las técnicas más avanzadas para manipular, visualizar, analizar y predecir con grandes conjuntos de
datos.
Al finalizar el curso, el estudiante elabora una propuesta de analítica de datos mediante el lenguaje de
programación de Python, identificar patrones y tendencias utilizando diversos métodos de análisis y
estadística descriptiva e inferencial.
ENFOQUE 80% PRÁCTICO Laboratorio por cada módulo finalizado (15 laboratorios)
¿A quiénes va dirigido?
Estudiantes universitarios, profesionales y entusiastas que buscan adquirir o mejorar habilidades prácticas
en Ciencia de datos utilizando Python y sus principales librerías.
Requisitos
Ningún requisito previo.
Plan de Estudios 100 horas académicas (3.5 meses aprox)
MÓDULO 01
FUNDAMENTOS DE PYTHON I
Introducción a Python
Historia y Características de Python
Configuración de Google Colab
Tipos de Datos
Números, Flotantes, Booleanos, Cadenas de Texto
Conversión de Tipo de Datos
Variables
Definición y Asignación de Variables
Operadores Básicos
Aritméticos, Comparación, Lógicos, Asignación
Cadenas de Texto
Métodos Comunes en Strings
Indexación y Slicing
Estructuras de Datos I
Creación y Manipulación de las Estructuras de datos
Métodos Comunes de Listas y Tuplas
Indexación y Slicing
Laboratorio con Python I
MÓDULO 02
FUNDAMENTOS DE PYTHON II
Estructura de datos II
Creación y Manipulación de Diccionarios
Métodos Comunes de Diccionarios
Estructura de Control de Condicionales
Estructura ‘if’, ‘elif’, ‘else’
Operadores de Comparación y Lógicos
Estructura de Control de Repeticiones
Bucle ‘for’: Iteración sobre Secuencias
Bucle ‘while’: Ejecución Repetitiva hasta que cumpla una condición
Funciones
Definición y llamada de Funciones
Parámetros y Argumentos
Ámbito de Variables en Funciones (local y global)
Laboratorio con Python II
MÓDULO 03
MANEJO DE DATOS NUMÉRICOS CON NUMPY
Introducción a la Numpy
¿Qué es Numpy y por qué es importante para el Análisis de Datos?
Arrays Numpy
Creación de Arrays:
Operaciones con Arrays
Operaciones Aritméticas entre Arrays y Escalares
Broadcasting con Numpy
Funciones de Agregación y Estadísticas
Funciones: sum(), mean(), min(), max(), etc.
Manipulación Avanzada de Arrays
Reshape, Concatenación y División de Arrays
Procesamiento y Transformación de Datos Numéricos
Aplicación de Operaciones de Filtrado, Ordenamiento y Agrupamiento en
Datos Numéricos
Laboratorio con Numpy
MÓDULO 04
MANEJO DE DATOS EN TABLAS CON PANDAS
Introducción a Pandas
¿Qué es Pandas y por qué es importante en Análisis de Datos?
Estructuras de datos con Pandas
Series: Creación, Indexación y Operaciones Básicas
DataFrame: Creación, Indexación y Operaciones Básicas.
ETL (Extract, Transform, Load) con Pandas
Lectura de Datos desde Diferentes Fuentes: Archivos CSV, Excel, SQL.
Transformación de Datos para Adaptarlos al Análisis
Carga de Datos Transformados en una Base de Datos u otro Sistema de
Almacenamiento
Identificación y Tratamientos de Valores Faltantes
Uso de métodos como isnull(), fillna(), y dropna() para manejar valores
faltantes.
Eliminación de Duplicados
Identificación y eliminación de datos duplicados en un DataFrame.
Conversión de Tipos de Datos
Conversión de tipos de datos en columnas de un DataFrame.
Manipulación de Cadenas de Texto
Uso de métodos de cadena de texto en Pandas para limpiar y manipular
datos de texto
Aplicación de expresiones regulares para patrones más complejos de
limpieza de texto
Laboratorio con Pandas
MÓDULO 05
VISUALIZACIÓN DE DATOS CON MATPLOTLIB
Introducción a Matplotlib
¿Qué es Matplotlib y como se utiliza en el Análisis de Datos?
Creación de Gráficos Básicos: Líneas, Barras, Dispersión
Personalización de Gráficos: colores, etiquetas, leyendas
Personalización de Ejes, Etiquetas y Leyendas
Uso de Colores y Estilos para mejorar la Visualización
Gráficos especiales
Gráficos de Boxplots para visualizar la distribución de los datos
Exportación y Guardado de Gráficos
Guardar Gráficos en Diferentes Formatos (PNG, PDF, etc)
Laboratorio con Matplotlib
MÓDULO 06
VISUALIZACIÓN DE DATOS CON SEABORN
Ventajas de Seaborn sobre Matplotlib
Manejo de Datos con Seaborn
Utilización de hue, size, style
Gráficos estadísticos con Seaborn
Gráficos de Distribución: Histograma
Gráficos de Relación: scatterplots, pairplots
Gráficos Avanzados: violinplot, heatmap, jointplot
Personalización de Gráficos en Seaborn
Uso de Paletas de Colores
Añadir Detalles Estéticos a los Gráficos (rejillas, estilos)
Integración con Matplotlib
Laboratorio con Seaborn
MÓDULO 07
VISUALIZACIÓN DE DATOS CON PLOTLY
Introducción a Plotly
Creación de gráficos básicos
Gráficos Interactivos
Gráficos de líneas, barras y dispersión: Tipos y usos
Gráficos de dispersión: Análisis de relaciones entre variables
Gráficas Avanzadas
Boxplots: Análisis de Distribución y Outliers
Histogramas: Análisis de Distribución de Datos
Mapas y Geovisualización
Mapas Coropléticos y Mapas de Burbujas
Personalización y Temas
Estilos y Estilos de Gráficas: Personalización Avanzada
Anotaciones y Formas: Texto, Líneas y Formas en gráficos
Laboratorio con Plotly
MÓDULO 08
VISUALIZACIONES WEB CON STREAMLIT
Introducción a Streamlit
¿Qué es Streamlit y para que se utiliza?
Fundamentos de Streamlit
Estructura Básica de una aplicación Streamlit
Elementos Básicos de la Interfaz de Usuario
Títulos y Texto, Imágenes y Medios, Widgets de Entrada.
Integración de Datos
Cargar y Mostrar Datos: CSV, Excel, etc.
Mostrar Datos en Tablas: Dataframe, Table.
Visualización de Datos
Integración con Gráfico de Plotly, Matplotlib, Seaborn.
Interactividad con Callbacks
Uso de Eventos y Callbacks para actualizar gráficos y tablas en tiempo real
Laboratorio con StreamLit
MÓDULO 09
WEBSCRAPING CON BEAUTIFUL SOUP
Introducción al Web Scraping
Conceptos básicos
¿Qué es el web scraping y para qué se utiliza?
Estructura de HTML
Conceptos básicos de HTML: etiquetas, atributos y estructura
Análisis de una página web con el navegador
Fundamentos de Beautiful Soup
Creación de un Objeto en Beautiful Soup
Métodos Básicos de Vavegación
Extracción de Datos
Manejo de Datos Extraídos
Almacenamiento de Datos
Limpieza y Transformación de Datos
Laboratorio con Beautiful Soup
MÓDULO 10
ESTADÍSTICA GENERAL CON STATSMODELS
Introducción a Statsmodels
Capacidades de Stastsmodels en el Análisis Estadístico
Comparación con otras librerías (SciPy, Skicit-learn)
Fundamentos de Estadística Descriptiva
Medidas de Tendencia Central (media, mediana, moda)
Medidas de Dispersión (varianza, desviación estándar)
Inferencia Estadística
Intervalo de Confianza
Cálculo de Intervalos de Confianza para Medias y Proporciones
Pruebas de Hipótesis
Formulación y Prueba de Hipótesis
Regresión Lineal
Introducción a la Regresión Lineal Simple
Ajuste de un Modelo de Regresión Lineal
Uso de Gráficos de Diagnósticos y Pruebas Estadísticas
Laboratorio con StatsModels
MÓDULO 11
ANÁLISIS GEOESPACIAL CON GEOPANDAS
Introducción a GeoPandas y Análisis Espacial
¿Qué es GeoPandas?
Manipulación de Datos Geoespaciales
Carga y Visualización de Datos Geoespaciales
Manipulación de Geometrías
Análisis Espacial con GeoPandas
Análisis de Proximidad
Análisis de Superposición
Visualización Avanzada de Datos Geoespaciales
Personalización de Mapas
Creación de Mapas Temáticos y Mapas Interactivos
Laboratorio con GeoPandas
MÓDULO 12
OPTIMIZACIÓN DE MANEJO DE DATOS EN POLARS
Introducción a Polars y Rust
Descripción general de Polars
Ventajas de usar Polars
Manipulación de Datos con Polars
Carga y Visualización de Datos: CSV, JSON, etc
Visualización Básica de los Datos Cargados
Operaciones de Manipulación de Datos
Uso de Polars para Operaciones como Filtrado, Selección y Agregación.
Análisis de Datos con Polars
Análisis Estadístico
Operaciones Avanzados
Laboratorio con Polars
MÓDULO 13
ANÁLISIS DE BIG DATA CON PYSPARK
Introducción a PySpark
Descripción general de PySpark
Fundamentos de PySpark
Conceptos Básicos de Spark
Creación de RDDs y DataFrames
Manipulación de Datos: Transformación y Filtrado
Análisis de Datos con PySpark
Análisis Estadístico: Funciones de Agregación
Optimización de Rendimiento
Estrategias para Mejorar el Rendimiento de las Operaciones.
Laboratorio con PySpark
MÓDULO 14
BASES DE DATOS CON SQLITE
Introducción a SQLite
Motor de Base de Datos
Uso Básico de SQLite desde Python
Conexión a una Base de Datos SQLite
Creación de una Conexión y Objeto Cursos para Consultas
Creación de Tablas
Definición de Campos y Tipos de Datos para la Tabla
Manipulación de Datos con SQLite
Inserción de Datos
Consultas de Selección
Actualización y Eliminación de Datos
Actualización de Registros con el Método UPDATE
Eliminación de Registros con el Método DELETE
Consultas Avanzadas
Consultas Agregadas: Uso de Funciones (SUM, COUNT, AVG, etc)
Laboratorio con SQLite
MÓDULO 15-16
PROYECTO FINAL: DATASET DE KAGGLE
Etapas del Proyecto
Obtención y Limpieza de Datos
Análisis Exploratorio de Datos
Análisis Estadístico
Modelado Predictivo
Visualización de Datos
Aplicación Web Interactiva
Análisis Geoespacial
Procesamiento de Grandes Volúmenes de Datos
Almacenamiento y Consulta de Datos
Conclusiones
Habilidades técnicas
PASO 01
Realizar el pago y
enviar foto del PASO 02
comprobante o
voucher al WhatsApp
Solicitar el formulario
de inscripción PASO 03
Unirse a los grupos
de WhatsApp y
Classroom
Extranjero: 80 USD
Certificaciones
Nota:
Certificado + Proyecto de finalización incluidos en la inversión total
Para obtener el certificado necesita presentar el proyecto final.
Métodos de pago
Transferencia interbancaria.
Depósitos por agente o cajero
Pagos en Perú
@perupython
@perupython