Current jobs related to SRE Specialist - Montreal, Quebec - Intelcom | Dragonfly

  • Senior SRE Specialist

    2 weeks ago


    Montreal, Quebec, Canada Solutions Petal Inc. Full time

    Petal is a leading Canadian healthcare orchestration and billing company that revolutionizes healthcare systems to make them agile, efficient, and resilient by enabling the forecasting and shaping of world-class healthcare through Healthcare BI, advanced analytics, and informed insights. Our commitment to fostering an exceptional workplace culture has...


  • Montreal, Quebec, Canada WorkJam Full time

    WorkJam is the world's leading digital frontline workplace, connecting the entire deskless workforce to work in perfect harmony. WorkJam solves the most common problems faced by global frontline enterprises through scheduling tools, task management, communication, and learning – all within a single appWe're proud of our dedicated teams who are making a...


  • Montreal, Quebec, Canada Orion Innovation Full time

    Orion Innovation is a premier, award-winning, global business and technology services firm.  Orion delivers game-changing business transformation and product development rooted in digital strategy, experience design, and engineering, with a unique combination of agility, scale, and maturity.  We work with a wide range of clients across many industries...


  • Montreal, Quebec, Canada Global Talent Alliance, Canada Full time

    (#11072)The role of the Specialist Site Reliability Engineer (SRE) is to execute RAM analysis and engineering in support of the I&T solutions. The overall mandate is to ensure that these solutions have attributes of high robustness, reliability, and availability. This involves system and product analysis, modeling and requirements assessment during the...


  • Montreal, Quebec, Canada Compunnel Inc. Full time

    Hiring for Data Distribution (Managed File Transfer Protocol) Admin for top 10 Banking Client in Montreal, Quebec, CAJob ID: KUMDC5683998Job Title: Data Distribution (Managed File Transfer Protocol)Location: Montreal, Quebec, CA (Hybrid 3-Days Onsite)Duration: 12+ months with possible extensionJob Description:The Data Distribution Infrastructure L3 support...

  • Senior DevSecOps

    2 weeks ago


    Montreal, Quebec, Canada Intelcom | Dragonfly Full time

    Intelcom | DragonflyWith more than 100 sorting stations and operations across three continents,Intelcom | Dragonflyis Canada's leader in last-mile logistics. Our vision is clear:to deliver fast, accurate, and reliable service powered by cutting-edge technology.A Strategic Role at the Heart of LogisticsKey ResponsibilitiesStrategic Security LeadershipDefine...


  • Montreal, Canada PetalMD Full time

    Petal is a leading Canadian healthcare orchestration and billing company that revolutionizes healthcare systems to make them agile, efficient, and resilient by enabling the forecasting and shaping of world‑class healthcare through Healthcare BI, advanced analytics, and informed insights. Our commitment to fostering an exceptional workplace culture has...


  • Montreal, Canada PetalMD Full time

    Petal is a leading Canadian healthcare orchestration and billing company that revolutionizes healthcare systems to make them agile, efficient, and resilient by enabling the forecasting and shaping of world‑class healthcare through Healthcare BI, advanced analytics, and informed insights. Our commitment to fostering an exceptional workplace culture has...


  • Montreal, Canada Petal Full time

    Petal is a leading Canadian healthcare orchestration and billing company that revolutionizes healthcare systems to make them agile, efficient, and resilient by enabling the forecasting and shaping of world-class healthcare through Healthcare BI, advanced analytics, and informed insights.Our commitment to fostering an exceptional workplace culture has earned...

  • Senior SRE

    2 weeks ago


    Montreal (administrative region), Canada PowerToFly Full time

    A global investment bank is seeking a Senior Site Reliability Engineering Specialist to optimize SRE efforts across multiple infrastructures. The role involves improving system observability, collaborating on design for new services, and mentoring teams. Candidates should have a Bachelor’s degree in Computer Science, 5+ years in SRE, and strong skills in...


  • Montreal, Canada PetalMD Full time

    A leading healthcare technology company in Montreal is seeking a Senior SRE Specialist. This role focuses on ensuring the stability and performance of critical infrastructure while collaborating with product teams. Candidates should have extensive experience in deployment, automation, and solution optimization. The position allows for a hybrid work model,...


  • Montreal, Canada PetalMD Full time

    A leading healthcare technology company in Montreal is seeking a Senior SRE Specialist. This role focuses on ensuring the stability and performance of critical infrastructure while collaborating with product teams. Candidates should have extensive experience in deployment, automation, and solution optimization. The position allows for a hybrid work model,...


  • Montreal, Canada Open Systems Technologies Full time

    Site Reliability Engineer (SRE), ServiceNow, Application Infrastructure 2 days ago Be among the first 25 applicants The Application Infrastructure (AI) department is seeking a Site Reliability Engineer (SRE) to help drive the reliability engineering, operations and customer support services for Morgan Stanley's ServiceNow SaaS implementation. Reporting to a...


  • Montreal, Canada Open Systems Technologies Full time

    Site Reliability Engineer (SRE), ServiceNow, Application Infrastructure 2 days ago Be among the first 25 applicants The Application Infrastructure (AI) department is seeking a Site Reliability Engineer (SRE) to help drive the reliability engineering, operations and customer support services for Morgan Stanley's ServiceNow SaaS implementation. Reporting to a...

  • SRE Specialist

    5 days ago


    Montreal (administrative region), Canada Intelcom | Dragonfly Full time

    Intelcom | Dragonfly C'est plus de 100 stations de tri et des opérations sur trois continents. Leader canadien de la logistique du dernier kilomètre, on a une vision claire : offrir une livraison rapide, précise et fiable grâce à une technologie de pointe. Tu veux un emploi en pleine action où tu peux collaborer en équipe et voir l'impact direct de...


  • Montreal (administrative region), Canada PowerToFly Full time

    A leading global financial organization is seeking a Cloud SRE Specialist to join their Azure Platform Squad in Montreal. This role involves enhancing operational stability and automating cloud deployments across Azure and AWS. Candidates should possess at least 4 years of SRE experience, strong skills in Infrastructure as Code, CI/CD pipelines, and Python....

SRE Specialist

2 weeks ago


Montreal, Quebec, Canada Intelcom | Dragonfly Full time

Intelcom | Dragonfly
C'est plus de 100 stations de tri et des opérations sur trois continents. Leader canadien de la logistique du dernier kilomètre,
on a une vision claire
: offrir une livraison rapide, précise et fiable grâce à une technologie de pointe.

Tu veux un emploi en pleine action où tu peux collaborer en équipe et voir l'impact direct de ton travail ?
On t'attend

Un rôle stratégique au cœur de la logistique
Les responsabilités

  • Gestion des incidents : Détecter les problèmes et y répondre, en assurant une reprise rapide pour minimiser les temps d'arrêt. Les collaborateurs sur appel actuels ont besoin d'une meilleure coordination et d'une meilleure structure dans les enquêtes. Ce rôle implique des événements en dehors des heures de travail, mais ceux-ci sont cycliques avec des périodes plus calmes. Définir et mettre en œuvre un processus d'escalade. Assurer la communication et l'adhésion de toutes les parties prenantes de l'entreprise à ce processus. Documenter les rapports d'incidents et effectuer des analyses a posteriori afin de promouvoir une approche d'amélioration continue.
  • Collaboration : Travailler en étroite collaboration avec les équipes de développement et d'exploitation pour assurer le déploiement et le fonctionnement harmonieux des applications. Fournir un soutien opérationnel primaire et des services d'ingénierie pour des applications logicielles distribuées à grande échelle. Collaborer avec les équipes de développement pour améliorer les services grâce à des procédures rigoureuses de test et de mise en production. Participer au conseil en matière de conception de systèmes, à la gestion des plateformes et à la planification des capacités. Cela nécessite un suivi diligent et une collaboration étroite avec toutes les équipes.
  • Influence : Créer des systèmes et des services durables grâce à l'automatisation et aux améliorations. Promouvoir une culture de l'innovation et de l'amélioration continue au sein de l'équipe SRE et de l'organisation dans son ensemble. Coordonner avec le responsable de l'équipe SRE l'établissement et l'exécution de politiques opérationnelles qui favorisent l'agilité et l'évolutivité. Coordonner et encadrer les autres membres de l'équipe SRE, en favorisant la croissance et le développement professionnels. Travailler en étroite collaboration avec les équipes de développement et d'exploitation pour assurer un déploiement sans heurts.
  • Automatisation : Automatiser les tâches répétitives pour améliorer l'efficacité et réduire les erreurs humaines. Améliorer la fiabilité, la qualité et le délai de mise sur le marché de nos solutions logicielles. Mesurer et optimiser les performances des systèmes en anticipant les besoins de l'entreprise.
  • Surveillance et alertes : Mettre en place et améliorer les systèmes de surveillance (ex. : Datadog) pour suivre la santé et les performances des applications et de l'infrastructure. Des systèmes existent déjà, mais d'autres sont nécessaires. Surveiller et maintenir l'environnement de production en garantissant une haute disponibilité et une bonne santé des systèmes. Collecter et traiter les métriques des systèmes d'exploitation et des applications afin d'optimiser les performances et d'identifier les défaillances. Développer un tableau de bord de surveillance pour offrir une visibilité accrue à nos différents intervenants sur notre environnement de production.
  • Reprise après sinistre : Préparer et mettre en œuvre des plans de reprise après sinistre pour gérer les interruptions imprévues.
  • Optimisation des performances : Améliorer continuellement les performances et la scalabilité des systèmes.
  • Planification de capacité : S'assurer que l'infrastructure peut gérer les demandes actuelles et futures.
  • Ingénierie du chaos : Introduire intentionnellement des défaillances pour tester la résilience du système et améliorer sa robustesse.

Les Qualifications

  • Baccalauréat en génie logiciel, en informatique ou équivalent.
  • 3+ ans d'expérience en gestion du cloud, en développement et/ou en responsabilités SRE.
  • Expérience en méthodologie Agile et en exécution de projets techniques. Connaissance des concepts DevOps, des environnements AWS, Azure, GCP, des outils d'observabilité (Datadog, Cloudflare), de Terraform, PagerDuty et de leur intégration.

Autres compétences :

  • Forte initiative et résilience, avec une capacité démontrée à explorer de nouvelles idées et des approches innovantes pour résoudre des problèmes complexes.
  • Excellentes compétences interpersonnelles et en communication en français et en anglais.
  • Capacité à évoluer dans un environnement dynamique et en constante évolution.

Horaire :

Principalement de jour, mais une disponibilité en période d'astreinte est requise durant les premiers mois afin d'observer et d'optimiser les processus existants.

Pourquoi nous rejoindre ?
Chez Intelcom | Dragonfly, tu évolues dans un environnement flexible et stimulant, entouré·e de talents passionnés. Tu bénéficies aussi de nombreux avantages :

  • Gymnase avec un entraineur personne
  • Lunch de ton choix fournis par l'employeur
  • Assurances collectives
  • REER collectif
  • Journées bien-être
  • Remboursement partiel du transport collectif
  • Programme d'aide aux employé·e·s
  • et bien plus encore.

Diversité et inclusion
Chez Intelcom | Dragonfly, nous avançons avec des valeurs fortes
: collaboration, innovation, excellence et responsabilité.
Nous valorisons la diversité, garantissons l'équité et créons un véritable sentiment d'appartenance.

Des mesures d'accommodement peuvent être offertes aux personnes en situation de handicap dans le cadre de notre processus de recrutement, conformément à la loi. Merci de nous informer de tout besoins particuliers.