Aprende a diagnosticar Kubernetes, Docker, Helm, Canary, AWS, Azure y GCP con un laboratorio visual paso a paso
Weisewelt Cloud Native Troubleshooting Lab es un emulador educativo premium diseñado para comprender cómo se conectan los contenedores, registros, clusters, despliegues, tráfico, observabilidad y rollback en entornos modernos.
Practica escenarios reales de diagnóstico sin afectar infraestructura productiva ni generar costos en la nube. Cada reto explica qué sucede, por qué falla, cómo identificar la causa raíz y cómo validar una solución segura.
payments-api ImagePullBackOff
checkout-api CrashLoopBackOff
$ helm history checkout
REVISION STATUS CHART
7 failed checkout-2.1.0
6 deployed checkout-2.0.8
Canvas: CI → Registry → Cluster → Service → Canary → Observability → Rollback
Kubernetes / GKE / AKS / EKS
Pods, Services, Ingress, eventos, nodos, scheduling, RBAC, DNS, probes y estados como Pending, NotReady, CrashLoopBackOff e ImagePullBackOff.
Docker
Logs, inspect, redes, volúmenes, imágenes, puertos, daemon, ejecución de contenedores y diagnóstico local antes de llevar la app al cluster.
Helm
Charts, values, releases, upgrades, history, rollback, validación de plantillas y errores frecuentes al desplegar aplicaciones en Kubernetes.
Canary
Despliegues graduales, tráfico parcial, métricas, validación, rollback, comparación de versiones y protección ante fallas en producción.
AWS: EKS, ECS, ECR
Pull de imágenes, permisos IAM, redes, tareas ECS, servicios, registros ECR, errores CannotPullContainer y ResourceInitializationError.
Azure: AKS, ACR
Integración AKS-ACR, roles AcrPull, identidad administrada, conectividad, private endpoints, nodos y troubleshooting de imágenes.
GCP: GKE, Artifact Registry
Pull desde Artifact Registry, workloads en GKE, autenticación, conectividad, Cloud Deploy, releases y estrategias canary.
End-to-End
Retos integrados donde Docker, registry, Helm, Kubernetes, cloud provider, canary y observabilidad trabajan en conjunto.
Canvas explicativo: del código al usuario final
El laboratorio visualiza cada paso del flujo cloud native para que el usuario entienda dónde ocurre la falla y qué parte del sistema debe revisar primero.
Qué aprenderás en el emulador
| Área | Habilidades prácticas | Ejemplos de troubleshooting |
|---|---|---|
| Kubernetes | Inspeccionar Pods, Services, eventos, nodos, endpoints, probes y namespaces. | CrashLoopBackOff, ImagePullBackOff, Service sin endpoints, Node NotReady, errores de RBAC. |
| Docker | Revisar logs, redes, puertos, volúmenes, imágenes, variables y metadata del contenedor. | Contenedor que no inicia, puerto no expuesto, DNS interno, volumen mal montado, imagen incorrecta. |
| Helm | Analizar charts, values, releases, history, upgrade y rollback. | Upgrade fallido, values incorrectos, chart roto, rollback seguro a una revisión estable. |
| AWS / Azure / GCP | Comprender integración entre cluster, registro, red, permisos y despliegue. | ECR/ACR/Artifact Registry sin permisos, VPC o private endpoint incorrecto, pull de imágenes fallido. |
| Canary | Observar tráfico parcial, métricas, salud de versión, decisión de promoción o rollback. | Canary con errores 5xx, latencia alta, imagen nueva defectuosa, rollback por métricas degradadas. |
Laboratorio interactivo
Ejecuta comandos simulados, revisa la salida educativa, observa el canvas y aprende cómo resolver fallas reales de forma segura.
Ideal para
Base de conocimiento oficial
El contenido se apoya en documentación oficial y buenas prácticas de diagnóstico para Kubernetes, Docker, Helm y proveedores cloud.