Domain manager fiabilité & performance des services

vendredi 29 mai 2026
Rechercher une mission

Détails

Responsable exploitation
exploitation
Service
régie sur site

Informations

France
à définir
Asap
NC

Votre mission

Garantir la stabilité, la performance et la disponibilité des services en environnement production et hors-production. Vous portez la culture de la fiabilité au sein des équipes de livraison, en intégrant les pratiques SRE dans les cycles Agile et dans le cycle de vie produit.

Vous êtes le garant de la qualité des évolutions avant leur mise en production, en vous assurant qu'elles répondent aux attentes du client.

Activités principales : Définir, suivre et améliorer les indicateurs de fiabilité (SLOs, SLIs, budgets d'erreurs) par domaine applicatif

Piloter la mise en place d'outils de supervision, observabilité, monitoring et alerting

Valider la préparation opérationnelle des livraisons (Go/No Go)

Gérer les incidents, analyser les causes racines et conduire des revues post-mortem

Travailler avec les équipes plateforme et FinOps pour améliorer la résilience, l'efficacité des coûts et les performances globales

Assurer un reporting régulier sur la fiabilité, les risques et les plans d'amélioration Profil recherché

Compétences attendues : Techniques : Expertise en ingénierie de la fiabilité (SRE) dans des environnements SaaS ou cloud-native

Maîtrise des outils d'observabilité, automatisation et monitoring

Expérience en définition et pilotage des SLOs, SLIs, budgets d'erreurs

Solide pratique du DevSecOps, CI/CD et monitoring continu

Fonctionnelles : Gestion des incidents, analyse post-mortem, validation opérationnelle

Coordination transverse entre les équipes Produit, Tech et Plateforme

Forte culture de la performance, gouvernance et prévention des incidents

Login