Poste :
En tant que Lead/Senior SRE, vous jouerez un rôle essentiel dans l'assurance de la fiabilité, de la disponibilité et de l'évolutivité de nos systèmes sur site et dans le cloud. Cela inclut une expertise en Kubernetes, Linux, automatisation de l'infrastructure, CI/CD, surveillance, sécurité et gestion des bases de données telles qu'Elasticsearch, PostgreSQL et MongoDB.
Responsabilités :
• Responsabilité de la plateforme : Prendre la responsabilité complète de notre plateforme basée sur Kubernetes, en garantissant sa stabilité, sa performance et son évolutivité.
• Fiabilité des systèmes : Concevoir, mettre en œuvre et maintenir une infrastructure hautement disponible, tolérante aux pannes et évolutive, sur site et dans des environnements cloud (comme AWS) en utilisant des outils d'infrastructure-as-code et de gestion de configuration.
• Pipelines CI/CD : Développer, mettre en œuvre et gérer des systèmes d'intégration et de déploiement continus pour automatiser le déploiement des applications et des changements d'infrastructure.
• Observabilité : Mettre en œuvre des solutions de surveillance et d'alerte robustes pour identifier de manière proactive les goulets d'étranglement de performance, les pannes système et les vulnérabilités de sécurité.
• Sécurité et conformité : Mettre en œuvre et faire respecter les meilleures pratiques en matière de sécurité et de conformité en collaboration avec l'équipe de sécurité. Effectuer des évaluations régulières de la sécurité et des analyses de vulnérabilités.
• Opérations de base de données : Gérer et optimiser le fonctionnement des bases de données sur Kubernetes, y compris Elasticsearch, MongoDB et d'autres applications à état.
• Réponse aux incidents : Collaborer avec des équipes transversales pour diagnostiquer et résoudre les incidents de production, effectuer des analyses des causes profondes et mettre en œuvre des mesures préventives pour atténuer les occurrences futures.
• Collaboration : Travailler en étroite collaboration avec les équipes de développement, d'exploitation et de sécurité pour aligner les objectifs et fournir des solutions répondant aux besoins métiers.
• Documentation : Développer et maintenir la documentation de conception et de dépannage.