Descripción
En Bankaya, la confiabilidad es nuestro producto. Como plataforma de Banking as a Service (BaaS), buscamos a un/a Lead Site Reliability Engineer (SRE) que combine liderazgo técnico, visión estratégica y pasión por la estabilidad a gran escala.
Tu impacto
- Serás el/la líder técnico en incidentes críticos (P0), garantizando comunicación clara y soluciones efectivas con equipos internos y socios bancarios.
- Diseñarás e implementarás patrones de resiliencia (Circuit Breakers, Rate Limits, Timeouts) para que nuestra plataforma sea más rápida, escalable y confiable.
- Impulsarás una cultura de mejora continua, liderando postmortems blameless y asegurando que cada incidente deje aprendizajes reales.
- Transformarás métricas y logs (Prometheus, EFK, BetterStack, Sentry, Android Vitals) en acciones concretas para mejorar la estabilidad.
Nuestro stack
- Cloud (principal): GCP (GKE, Istio, Prometheus, EFK, Grafana On-Call).
- DB & Storage: AWS (S3, RDS MySQL, DynamoDB, Aurora).
- Infra adicional: AWS Lambdas, NGINX para conexiones con socios.
- Apps móviles: React Native, monitoreo con Sentry y Android Vitals.
- Integraciones: VPN con sistemas on-premise (REST/SOAP) de socios bancarios.
Lo que buscamos en ti
- Experiencia senior como SRE, DevOps o Platform Engineer en entornos de misión crítica.
- Dominio profundo en Kubernetes (GKE) y observabilidad con Prometheus, Grafana y ELK/EFK.
- Experiencia liderando respuestas a incidentes críticos (P0) con calma bajo presión.
- Conocimiento sólido en patrones de confiabilidad (circuit breakers, retries, rate limiting).
- Manejo experto en infraestructura GCP (indispensable) y AWS (deseable).
- Excelentes habilidades de comunicación para interactuar con devs, sysadmins y socios externos.
Plus que nos encantaría ver
- Experiencia con Istio u otros service mesh.
- Observabilidad en aplicaciones móviles (Sentry, Android Vitals).
- Optimización de rendimiento en Java/JVM.
- Experiencia en FinTech / BaaS.
Si buscas liderar la confiabilidad de una plataforma financiera de alto impacto y resolver desafíos complejos a escala, este rol es para ti.