Study Jam 4 - Data, ML & AI
Study Jam 4 - Data, ML & AI
Foundations Academy
Marzo 2024
Renuncia de responsabilidad
Gracias por su interés en usar el material de capacitación de Google Cloud. Nos complace poder brindarle este contenido (en adelante,
los “Recursos Didácticos”) y esperamos que le resulte útil.
Al usar los Recursos Didácticos, acepta regirse por los siguientes términos y condiciones, así como por las Condiciones del Servicio de
Google y la Política de Privacidad de Google. A menos que se indique lo contrario, los términos que se usan a continuación tendrán los
significados que se describen en las Condiciones del Servicio de Google.
1. Solo para Usos Educativos. Los Recursos Didácticos están diseñados para utilizarse solo en los cursos de capacitación que se
dictan en instituciones de educación superior o con acreditación regional. El contenido puede adaptarse, personalizarse,
modificarse y compartirse para fines educativos. Sin embargo, no puede distribuirse ni usarse de otro modo para fines
comerciales ni para obtener un beneficio comercial o una compensación económica de carácter privado.
1. Requisitos de atribución. Si distribuye, reproduce públicamente, exhibe, transmite o publica los Recursos Didácticos o sus
obras derivadas, o hace que estén disponibles de otro modo, deberá atribuir el material que utilice a los Recursos Didácticos,
pero no deberá hacerlo de forma que sugiera que Google, sus afiliados o sus proveedores de contenido externos lo respaldan
o aprueban que use dichos materiales. Si adapta, modifica o personaliza los Recursos Didácticos, deberá incluir el siguiente
texto en cada una de las diapositivas modificadas: “El contenido original que suministra Google LLC se modificó para los fines
de este curso sin su participación ni recomendación”.
1. Las descripciones de los productos, servicios, infraestructura y procesos de Google disponibles en los Recursos Didácticos se
incluyen solo para fines de aprendizaje y no constituyen una garantía, promesa ni declaración de exactitud por parte de Google.
Los precios, disponibilidad o funciones de los productos y servicios de Google Cloud que se describen en los Recursos
Didácticos pueden cambiar.
Introducción a La Nube
1.1 - Entonces, ¿qué es la nube? Explicar qué es la nube y por qué es un punto de inflexión tecnológico y empresarial
2.3 - Hay una API para eso Analizar las distintas opciones de servicio administrado de aplicaciones en la nube
3.1 - La nube es segura Explicar cómo se administra la seguridad de la nube en Google Cloud
3.2 - En qué ayudan las redes Demostrar cómo construir redes seguras en la nube
Skill Badges
Ya tiene los datos, pero
¿qué está haciendo con ellos?
27
12 años 4G
veces
2 microgramos El equivalente a un
de ADN día de videos
subidos a
< Action Safe
YouTube
Title Safe >
Descripción general de los servicios administrados
de macrodatos
Rápido y
escalable
CPU virtual/hora
Ecosistema de
Rentable
código abierto
Completamente
Integrado administrado
Escale
Reconfigure
Clústeres
Fuente de datos
Fuentes de datos Producción
Dataproc
Almacenamiento
Almacenamiento Cloud Storage
Fuente de datos Cloud Storage
Almacenamiento
Almacenamiento Desarrollo Cloud Bigtable
Cloud Bigtable Dataproc
Se agregan y cargan grandes Cloud Storage proporciona una Se ahorra dinero y se reduce
volúmenes de datos de varias opción de almacenamiento de la complejidad.
fuentes en bases de datos para bajo costo.
que puedan reunirse métricas, Un clúster efímero de Dataproc
y así realizar informes diarios, se puede crear en menos de
paneles de administración 2 minutos.
y análisis.
Los datos se procesan mediante
En la actualidad, se utiliza un el MapReduce existente.
clúster local exclusivo para
< Action Safealmacenar y procesar los
Los analistas están utilizando Se crean clústeres que escalan Se desbloquea la nube
una shell de Spark, pero están según la velocidad y mitigan sin complejidad técnica.
preocupados por el aumento las fallas. Los cálculos complejos se
del uso. Se puede usar una interfaz web, realizan en segundos, no horas.
No están seguros de cómo el SDK de Cloud o una shell de
escalar su clúster, que se ejecuta Spark nativa mediante SSH.
en modo independiente.
Se usan las bibliotecas de Spark y MLlib pueden instalarse Los recursos pueden
aprendizaje automático de Spark en cualquier clúster de Dataproc. concentrarse en los datos,
(MLlib) para ejecutar los Pueden aplicarse no en la creación y administración
algoritmos de clasificación en personalizaciones a los clústeres de clústeres.
grandes conjuntos de datos. por medio de acciones de La integración con Google Cloud
Se depende de máquinas en la inicialización. desbloquea nuevas
nube para instalar y personalizar Se usa Cloud Monitoring para características de Spark.
Spark. supervisar flujos de trabajo.
< Action Safe
Integrado
< Action Safe
Transformación
Fuente Receptor
Transformación A: PCollection
nombres que de nombres
comiencen con "A" con "A"
Lectura PCollection
de filas
de BigQuery
BigQuery
Transformación B: PCollection
nombres que de nombres
comiencen con "B" con "B"
< Action Safe
Transformación A: PCollection
nombres que de nombres
comiencen con "A" con "A"
BigQuery
Transformación B: PCollection
nombres que de nombres
comiencen con "B" con "B"
< Action Safe
PCollection de nombres
y direcciones
PCollection de nombres
y números de pedido
¿Prefiere un enfoque
práctico/DevOps para las
X operaciones o un enfoque sin
intervenciones/sin
servidores?
¿Depende de DevOps
paquetes/herramientas
específicos en el ecosistema
de Apache Hadoop/Spark?
✓
< Action Safe
Dataproc
Title Safe >
BigQuery, el almacén de
datos empresarial de
Google
< Action Safe
Almacén
Data mart Data lake Tablas y vistas Permisos
de datos
BigQuery BigQuery organiza BigQuery define Funciona de la Cloud IAM otorga
reemplaza la las tablas de datos esquemas y envía misma manera que permisos para
configuración de en unidades consultas en un almacén de realizar acciones
< Action Safe
hardware típica del llamadas conjuntos directamente en datos tradicional. específicas.
Title Safe >
almacén de datos. de datos. fuentes de datos
externas.
BigQuery es un almacén de datos moderno que
cambia el modo tradicional de almacenamiento
1
Ejecute iniciativas de AA sin
mover los datos de
BigQuery.
2
Realice iteraciones en
modelos en SQL dentro de
BigQuery para aumentar la
velocidad de desarrollo.
3
Automatice las tareas
comunes de AA y el ajuste
< Action Safe
de hiperparámetros.
Title Safe >
BigQuery es un servicio completamente administrado
Administración de
X X Actualizaciones
almacenamiento
X Recuperación
Tendrá más horas de
ante fallas
< Action Safe
trabajo reales, ya que no
deberá preocuparse por
tareas comunes.
Title Safe >
Cómo cargar datos en BigQuery
Herramienta Cloud
gsutil Storage
Consulta de datos
Hay varias formas de conectarse a BigQuery y
analizar los datos
A. Dataproc
B. Dataflow
C. BigQuery
D. Cloud Bigtable
A. Dataproc
B. Dataflow
C. BigQuery
D. Cloud Bigtable
Skill Badges
Deje que las máquinas
hagan el trabajo
Para
Para
acá
allá
IMPUESTOS
buenas dañadas
Modelo
Algoritmo
entrenado
Entradas
< Action Safe
Buen
estado
Modelo
entrenado
Imagen nueva
Piezas
dañadas
< Action Safe
Clase 1
Modelo ResNet
Imagen
entrenado
Clase 2
Modelo
Algoritmo
ResNet
estándar
entrenado
Modelo
Algoritmo
ResNet
estándar
< Action Safe
Modelo de Modelo de
imagen imagen
(entrenado) (entrenado)
Piezas en buen
Piezas dañadas
estado
Inteligencia
artificial
Aprendizaje
automático
Aprendizaje
profundo
< Action Safe
X ✓
$ $$$
< Action Safe No se trata de ahorrar dinero Sino de hacerlo a mayor escala
Title Safe >
Ya no hay barreras de acceso
Vision
Video Intelligence
Natural Language
Translation API de Cloud API de API
< Action Safe
AI Platform Translation Cloud Natural de Video
Tablas de datos Language Intelligence
Title Safe >
Para divertirse con el AA: Corre, Dibuja
quickdraw.withgoogle.com
Vision
Video Intelligence
Natural Language
Translation API de Cloud API de API
< Action Safe
AI Platform Translation Cloud Natural de Video
Tablas de datos Language Intelligence
Title Safe >
Tensorflow
Las aristas
representan
arreglos de datos.
Entrenamiento
en la nube
CPU
Ejecución de
inferencias en iOS,
< Action Safe Android y Raspberry Pi,
Title Safe >
entre otros
TensorFlow contiene varias capas de abstracción
Estimadores Modelos API de alto nivel para
Conjunto de
Canalización de prediseñados de Keras compilar modelos
entrada de datos personalizados
datos
- ecuenciales
API de Estimator
- funcionales
capas, pérdidas,
métricas, Keras Componentes de AA
optimizadores, etc.
SDK de frontend
C++, Python, R, GO, Java, Swift, etc.
para control total
Framework de API de TensorFlow Core Más tareas
compilación de
Accelerated Linear TensorFlow Implementación
Algebra (XLA) Motor de ejecución distribuida (C++) de C++ de alta eficiencia
< Action Safe
Entrenamiento
Entrada Modelo
del modelo
Entrenamiento
Entrada Modelo
< Action Safe del modelo
Title Safe >
Realice las transformaciones necesarias
Creación
Procesamiento
Entrada de
previo
atributos
Entrenamiento
Modelo
del modelo
Creación
Procesamiento
Entrada de
previo
atributos
Entrenamiento
Modelo
del modelo
Implementación
Creación
Procesamiento
Entrada de
previo
atributos
Entrenamiento
Igual
Modelo
del modelo
Implementación
Implementación
Igual
AI Platform
Predicción
Clientes AI Platform
Llamada a la API de
REST con variables
< Action Safe de entrada
Vision
Video Intelligence
Natural Language
Translation API de Cloud API de API
< Action Safe
AI Platform Translation Cloud Natural de Video
Tablas de datos Language Intelligence
Title Safe >
¿Qué se necesita para resolver un problema de AA?
Datos de
entrenamiento
Código de
modelo
Infraestructura
de entrenamiento
y deriva
Código de
modelo
Infraestructura
de entrenamiento
y deriva
Código de
modelo
Infraestructura
de entrenamiento
y deriva
Procesamiento Ajuste de
Diseño de un
previo parámetros del Evaluación Implementación Actualización
modelo de AA
de datos modelo de AA
AutoML Tables
Compile e implemente sin intervenciones
< Action Safe
modelos de aprendizaje automático de
Title Safe >
vanguardia en datos estructurados.
AutoMLModelos de AA
previamente entrenados
Listos para usar
Vision
Video Intelligence
Natural Language
Translation API de Cloud API de API
< Action Safe
AI Platform Translation Cloud Natural de Video
Tablas de datos Language Intelligence
Title Safe >
Use la API de Vision para comprender el contenido
de imágenes
Detección y Identificación de
Extracción de texto
etiquetado entidades
< Action Safe
A. AI Platform
B. AutoML
C. TensorFlow
D. API de Speech
< Action Safe
A. AI Platform
B. AutoML
C. TensorFlow
D. API de Speech
< Action Safe
B. API de Speech-to-Text
C. API de Vision
B. API de Speech-to-Text
C. API de Vision
B. AutoML
C. AI Platform
D. TensorFlow
< Action Safe
B. AutoML
C. AI Platform
D. TensorFlow
< Action Safe