Domain manager fiabilité & performance des services
Détails
Informations
Votre mission
Garantir la stabilité, la performance et la disponibilité des services en environnement production et hors-production. Vous portez la culture de la fiabilité au sein des équipes de livraison, en intégrant les pratiques SRE dans les cycles Agile et dans le cycle de vie produit.
Vous êtes le garant de la qualité des évolutions avant leur mise en production, en vous assurant qu'elles répondent aux attentes du client.
Activités principales : Définir, suivre et améliorer les indicateurs de fiabilité (SLOs, SLIs, budgets d'erreurs) par domaine applicatif
Piloter la mise en place d'outils de supervision, observabilité, monitoring et alerting
Valider la préparation opérationnelle des livraisons (Go/No Go)
Gérer les incidents, analyser les causes racines et conduire des revues post-mortem
Travailler avec les équipes plateforme et FinOps pour améliorer la résilience, l'efficacité des coûts et les performances globales
Assurer un reporting régulier sur la fiabilité, les risques et les plans d'amélioration Profil recherché
Compétences attendues : Techniques : Expertise en ingénierie de la fiabilité (SRE) dans des environnements SaaS ou cloud-native
Maîtrise des outils d'observabilité, automatisation et monitoring
Expérience en définition et pilotage des SLOs, SLIs, budgets d'erreurs
Solide pratique du DevSecOps, CI/CD et monitoring continu
Fonctionnelles : Gestion des incidents, analyse post-mortem, validation opérationnelle
Coordination transverse entre les équipes Produit, Tech et Plateforme
Forte culture de la performance, gouvernance et prévention des incidents