SRE Specialist

3 weeks ago


Montreal administrative region, Canada Intelcom | Dragonfly Full time

Intelcom | Dragonfly C'est plus de 100 stations de tri et des opérations sur trois continents. Leader canadien de la logistique du dernier kilomètre, on a une vision claire : offrir une livraison rapide, précise et fiable grâce à une technologie de pointe. Tu veux un emploi en pleine action où tu peux collaborer en équipe et voir l'impact direct de ton travail? On t'attend. Un rôle stratégique au cœur de la logistique Les responsabilités Gestion des incidents : Détecter les problèmes et y répondre, assurant une reprise rapide pour minimiser les temps d'arrêt. Coordination des équipes d’appel, mise en œuvre de processus d'escalade, communication avec les parties prenantes, et rédaction de rapports d'incidents. Collaboration : Travailler avec les équipes de développement et d’exploitation pour déployer et faire fonctionner les applications à grande échelle, soutenir les processus de test et de mise en production. Influence : Créer des systèmes durables via l'automatisation, promouvoir l'innovation et l'amélioration continue, définir des politiques opérationnelles, encadrer les membres de l'équipe SRE. Automatisation : Automatiser les tâches répétitives, améliorer la fiabilité et la qualité, mesurer et optimiser les performances. Surveillance et alertes : Mettre en place et améliorer les systèmes de surveillance (ex. Datadog) pour garantir haute disponibilité et bonnes performances, développer des tableaux de bord de monitoring. Reprise après sinistre : Préparer et mettre en œuvre des plans de reprise d'activité. Optimisation des performances, planification de capacité, ingénierie du chaos : Tester la résilience du système et améliorer sa scalabilité. Les Qualifications Baccalauréat en génie logiciel, informatique ou équivalent. 3+ ans d'expérience en gestion du cloud, développement et/ou responsabilités SRE. Expérience en méthodologie Agile et exécution de projets techniques. Connaissances des concepts DevOps, environnements AWS, Azure, GCP, outils d'observabilité (Datadog, Cloudflare), Terraform, PagerDuty et leurs intégrations. Autres compétences Forte initiative et résilience, capacité à explorer des idées innovantes pour résoudre des problèmes complexes. Excellentes compétences interpersonnelles et communication en français et en anglais. Capacité à évoluer dans un environnement dynamique et en constante évolution. Horaire Principalement de jour, mais la disponibilité en période d'astreinte est requise durant les premiers mois pour observer et optimiser les processus existants. Pourquoi nous rejoindre ? Chez Intelcom | Dragonfly, tu évolues dans un environnement flexible et stimulant avec des talents passionnés. Tu bénéficies aussi de nombreux avantages : Gymnase avec un entraîneur personnel Lunch de ton choix fournis par l'employeur Assurances collectives REER collectif Journées bien‑être Remboursement partiel du transport de groupe Programme d'aide aux employés et bien plus encore. Diversité et inclusion Chez Intelcom | Dragonfly, nous avançons avec des valeurs fortes : collaboration, innovation, excellence et responsabilité. Nous valorisons la diversité, garantissons l'équité et créons un véritable sentiment d'appartenance. Accommodements Des mesures d'accommodement peuvent être offertes aux personnes en situation de handicap dans le cadre de notre processus de recrutement, conformément à la loi. Merci de nous informer de tout besoin particulier. #J-18808-Ljbffr



  • Montreal (administrative region), Canada Open Systems Technologies Full time

    The Application Infrastructure (AI) department is seeking a Site Reliability Engineer (SRE) to help drive the reliability engineering, operations and customer support services for Morgan Stanley's ServiceNow SaaS implementation. Reporting to a Site Reliability Engineering & Operations Lead. This role requires delivering a range of SRE practices within a...


  • Montreal (administrative region), Canada Open Systems Technologies Full time

    The Application Infrastructure (AI) department is seeking a Site Reliability Engineer (SRE) to help drive the reliability engineering, operations and customer support services for Morgan Stanley's ServiceNow SaaS implementation. Reporting to a Site Reliability Engineering & Operations Lead.This role requires delivering a range of SRE practices within a...


  • Montreal (administrative region), Canada Open Systems Technologies Full time

    The Application Infrastructure (AI) department is seeking a Site Reliability Engineer (SRE) to help drive the reliability engineering, operations and customer support services for Morgan Stanley's ServiceNow SaaS implementation. Reporting to a Site Reliability Engineering & Operations Lead.This role requires delivering a range of SRE practices within a...


  • Montreal (administrative region), Canada Compunnel Inc. Full time

    Site Reliability Engineer (SRE) – AWADC5704026 Work Location: Montreal, QC (3 days onsite/week). Job Title: Site Reliability Engineer (SRE), ServiceNow, Application Infrastructure. Must Have: Hands on Python Scripting. Job Description: Successful candidates for SRE roles in Application Infrastructure come from a variety of backgrounds; a developer looking...


  • Montreal (administrative region), Canada Compunnel Inc. Full time

    Site Reliability Engineer (SRE) – AWADC Work Location: Montreal, QC (3 days onsite/week). Job Title: Site Reliability Engineer (SRE), ServiceNow, Application Infrastructure. Must Have: Hands on Python Scripting. Job Description: Successful candidates for SRE roles in Application Infrastructure come from a variety of backgrounds; a developer looking to...


  • Montreal (administrative region), Canada Compunnel Inc. Full time

    Site Reliability Engineer (SRE) – AWADC5704026 Work Location: Montreal, QC (3 days onsite/week). Job Title: Site Reliability Engineer (SRE), ServiceNow, Application Infrastructure. Must Have: Hands on Python Scripting. Job Description: Successful candidates for SRE roles in Application Infrastructure come from a variety of backgrounds; a developer looking...


  • Montreal (administrative region), Canada PowerToFly Full time

    A leading global financial organization is seeking a Cloud SRE Specialist to join their Azure Platform Squad in Montreal. This role involves enhancing operational stability and automating cloud deployments across Azure and AWS. Candidates should possess at least 4 years of SRE experience, strong skills in Infrastructure as Code, CI/CD pipelines, and Python....


  • Montreal (administrative region), Canada PowerToFly Full time

    A leading global financial organization is seeking a Cloud SRE Specialist to join their Azure Platform Squad in Montreal. This role involves enhancing operational stability and automating cloud deployments across Azure and AWS. Candidates should possess at least 4 years of SRE experience, strong skills in Infrastructure as Code, CI/CD pipelines, and Python....

  • Cloud SRE Specialist

    3 weeks ago


    Montreal (administrative region), Canada PowerToFly Full time

    We're seeking someone to join our Azure Platform Squad as a Cloud SRE Specialist in Enterprise Computing to work on public cloud projects with opportunities to work on both Azure and AWS in a global financial organization, with a focus on improving operational stability and reliability. In the Technology division, we leverage innovation to build the...

  • Cloud SRE Specialist

    3 weeks ago


    Montreal (administrative region), Canada PowerToFly Full time

    We're seeking someone to join our Azure Platform Squad as a Cloud SRE Specialist in Enterprise Computing to work on public cloud projects with opportunities to work on both Azure and AWS in a global financial organization, with a focus on improving operational stability and reliability. In the Technology division, we leverage innovation to build the...