Vacante para la empresa Beyserin Consulting en Naucalpan de Juárez, Estado de México
Descripción del perfil:
Rol principal: Diseñar, desarrollar y optimizar flujos de datos escalables en Databricks, asegurando calidad, gobernanza y eficiencia.
Funciones clave:
Crear y mantener pipelines de datos (ETL/ELT) en Databricks.
Programar en Python y PySpark para transformar, limpiar y analizar datos.
Integrar datos de diversas fuentes (estructurados, semiestructurados y no estructurados).
Usar Delta Lake para versionado, gobernanza y optimización de datos.
Colaborar con científicos de datos, analistas y stakeholders para entregar soluciones confiables.
Optimizar consultas SQL y manejar bases de datos relacionales.
Trabajar en entornos de nube (Azure, AWS, GCP) para almacenamiento y procesamiento.
Requisitos técnicos:
+4 años de experiencia en Databricks.
Programación sólida en Python y PySpark.
Experiencia en procesamiento de datos a gran escala y Delta Lake.
Conocimiento en SQL y cloud data lakes (Azure Data Lake, AWS S3, GCP).
Inglés avanzado (oral y escrito)
Deseables (plus):
Experiencia en CI/CD y DevOps aplicado a data engineering.
Conocimiento de machine learning pipelines en Databricks.
Manejo de herramientas de BI (Power BI, Tableau, Looker).
Conocimiento en data governance y compliance.
Habilidades blandas:
Trabajo en equipo y comunicación efectiva.
Resolución de problemas y análisis crítico.
Autonomía y capacidad de manejar múltiples prioridades.
Nivel de educación deseada:
Superior - titulado
Nivel de experiencia deseada:
Nivel Medio
Función departamental:
Tecnología / Internet
Industria:
Telecomunicaciones
- ingles avanzado
Esta vacante viene de la bolsa de empleo Talenteca.com:
https://www.talenteca.com/anuncio?j_id=68a480652a00005a00e5ceff&source=indeed