Site Reliability Engineer/Ingénieur fiabilité des infrastructures infonuagiques

2 months ago


Québec QC, Canada Tecsys Full time

La version française suit ci-dessous

Having recognized the advantages of remote work, including employee morale, productivity, reduced commuting on employee wellbeing and the environment, as of May 1, 2022, we became a remote-first company. The technologies and programs in which we invested have provided a fantastic foundation to this end. Our remote-first work environment, together with our conveniently located offices and collaborative workspaces, provide our team with the freedom and flexibility to work in the way that makes our employees most productive.

About us

Tecsys is a fast-growing innovator offering supply chain solutions to industry leading healthcare systems, hospitals, and pharmacy businesses to distributors, retailers, and 3PLs. We work with industry leaders to transform their supply chains through technology. If you thrive on tackling difficult challenges with continuous learning opportunities and want to work in a respectful, comfortable, and dynamic work environment, then this could be a good fit for you

About the Role

We are looking for a Site Reliability Engineer to work within our “Network and Security Operations Center” department. Our NOC team is aimed at improving the reliability and uptime of our platform and applications in a data-driven way to support internal and external customers' needs.

Your responsibilities

  • Collaborate with other Engineering teams to support services before they go live through activities such as system design consulting, developing software platforms and frameworks, capacity planning and launch reviews.
  • Maintain services once they are live by measuring and monitoring availability, latency and overall system health.
  • Develop tools & automation on top of Azure & AWS to continuously reduce the need for manual intervention.
  • Scale systems sustainably through automation and evolve systems by pushing for changes that improve reliability and velocity.
  • Be on-call.
  • Practice sustainable incident response and blameless postmortems.
  • Implement automated solutions for continuous integration and delivery (CI / CD).
  • Implement monitoring, Logging, alerting, and SLA Reporting.
  • Implement service monitoring dashboards displaying key metrics.
  • Create and maintain technical documentation.
  • Apply SRE best practices.
  • Take command of high-severity incidents and facilitate their resolution.
  • Provide support for our planning and deployment teams to enable stability, predictability, and scale in our continued growth.
  • Collaborate with members of the Platform Engineering team to implement and support far-reaching strategic efforts, provide constructive feedback, and foster a collaborative environment.
  • Work cross-functionally with internal teams and vendors to manage our growth around the globe, with a strong focus on maintaining the high level of performance, availability, and reliability for our users.

Requirements:

  • Bachelor's degree in computer science or related technical discipline.
  • At least 5 years’ experience in systems engineering experience; demonstrable technical experience in new platform development, orchestration, product ownership, and iterative design and deployment.
  • Experience designing and deploying large scale systems, multi-vendor platforms and globally distributed infrastructure.
  • Strong knowledge of system design; high performance computing; file, block, and storage technologies; integration of compute, storage, and network technologies to deliver cohesive infrastructure solutions.
  • High level of understanding and examples of executing projects with full stack automation; our scale is going to require a lot of it, we grow to use less manual intervention and work with both internal and open-source tools to automate day-to-day activities.
  • Self-organize, collaborate, and manage efforts with peers and teams across responsibility areas, languages, geography, and time zones.
  • Be a self-starter, curious, and not afraid to ask questions and challenge the way things are done today.
  • See a problem or opportunity, take ownership and act on it independently.
  • Knowledge of Datadog preferred (or at least, similar/equivalent product)
  • Knowledge of Rapid7 Insight preferred (or at least, similar/equivalent product)
  • Knowledge and experience of AWS or Azure required.
  • Basic knowledge of Java- or .Net-based development required.
  • Knowledge of GitLab (enterprise license) preferred (or at minimum, Jenkins required)
  • Experience with SaaS company is a strong asset.
  • Strong English communication skills, both written and spoken, are essential for effective correspondence with customers, business partners and colleagues beyond the province of Quebec.

Additional requirements:

  • Escalation on-call rotation
  • Occasional travel (quarterly offsites, conferences – less than 10%)

At Tecsys, we value creativity, innovation, and teamwork. Our employees enjoy a supportive work environment, competitive compensation packages, and opportunities for career growth and advancement.

Tecsys is an equal opportunity employer. Accommodation is available for applicants selected for an interview.

NB: if you are applying to this position, you must be a Canadian Citizen or a Permanent Resident of Canada, OR, have a valid Canadian work permit.

******************************************************************************************************

Ayant reconnu les avantages du travail à distance sur le bien-être des employés et l'environnement, notamment le moral des employés, la productivité, la réduction des trajets domicile-travail, nous sommes devenus, depuis le 1er mai 2022, une entreprise privilégiant le travail à distance. Les technologies et les programmes dans lesquels nous avons investi ont fourni une base fantastique à cette fin. Notre bureau qui privilégie le travail à distance, ainsi que nos bureaux bien situés et nos espaces de travail collaboratifs, offrent à notre équipe la liberté et la flexibilité de travailler de la manière qui rend nos employés les plus productifs.

A propos de Tecsys

Tecsys est un innovateur à croissance rapide qui offre des solutions de chaîne d'approvisionnement aux principaux systèmes de soins de santé, aux hôpitaux, aux pharmacies, aux distributeurs, aux détaillants et aux 3PL. Nous travaillons avec les leaders du secteur pour transformer leurs chaînes d'approvisionnement grâce à la technologie. Si vous aimez relever des défis difficiles avec des opportunités d'apprentissage continu et si vous souhaitez travailler dans un environnement respectueux, confortable et dynamique, alors ce poste pourrait vous convenir.

A propos du poste

Nous recherchons un ingénieur – fiabilité des infrastructures infonuagiques pour travailler au sein de notre département "Network and Security Operations Center". Notre équipe NOC a pour objectif d'améliorer la fiabilité et le temps de fonctionnement de notre plateforme et de nos applications en s'appuyant sur des données afin de répondre aux besoins des clients internes et externes.

Vos responsabilités

  • Collaborer avec d'autres équipes d'ingénieurs pour soutenir les services avant la mise en service par des activités telles que le conseil en conception de systèmes, le développement de plateformes et de cadres logiciels, la planification des capacités et les examens de lancement.
  • Maintenir les services une fois qu'ils sont en place en mesurant et en surveillant la disponibilité, la latence et la santé générale du système.
  • Développer des outils d'automatisation sur Azure et AWS pour réduire continuellement le besoin d'interventions manuelles.
  • Faire évoluer les systèmes de manière durable grâce à l'automatisation, et faire évoluer les systèmes en préconisant des changements qui améliorent la fiabilité et la rapidité.
  • Être sur appel.
  • Implantez des solutions automatisées pour l'intégration et la livraison continues (CI / CD).
  • Implantez un système de surveillance des systèmes, la journalisation, les alertes et rapports d'ententes de service.
  • Implantez des tableaux de bord d'indicateurs de performance pour le suivi des services.
  • Créer et mettre à jour la documentation technique
  • Apporter une réponse durable aux incidents et faire des post mortem de haute qualité.
  • Prendre en charge des incidents de haute gravité et faciliter leur résolution.
  • Fournir un soutien à nos équipes de planification et de déploiement afin de permettre la stabilité, la prévisibilité et l'ampleur de notre croissance continue.
  • Collaborer avec les membres de l'équipe d'ingénierie de la plate-forme pour mettre en œuvre et soutenir des efforts stratégiques de grande envergure, fournir un retour d'information constructif et favoriser un environnement de collaboration.
  • Travailler de manière transversale avec les équipes internes et les fournisseurs pour gérer notre croissance dans le monde entier, en mettant l'accent sur le maintien d'un niveau élevé de performance, de disponibilité et de fiabilité pour nos utilisateurs.

Vos qualifications

  • Baccalauréat en informatique ou dans une discipline technique connexe.
  • Au moins 5 ans d'expérience en ingénierie des systèmes, expérience technique avérée dans le développement de nouvelles plateformes, l'orchestration, la propriété des produits et la conception et le déploiement itératifs.
  • Expérience dans la conception et le déploiement de systèmes à grande échelle, de plateformes multifournisseurs et d'infrastructures distribuées au niveau mondial.
  • Connaissance approfondie de la conception de systèmes, du calcul haute performance, des technologies de fichiers, de blocs et de stockage, de l'intégration des technologies de calcul, de stockage et de réseau pour fournir des solutions d'infrastructure cohérentes.
  • Haut niveau de compréhension et exemples d'exécution de projets avec une automatisation complète de la pile, notre échelle va en demander beaucoup, nous nous développons pour utiliser moins d'interventions manuelles et travailler avec des outils internes et source libre pour automatiser les activités quotidiennes.
  • Faire preuve d'initiative, de curiosité et ne pas avoir peur de poser des questions et de remettre en question la façon dont les choses sont faites aujourd'hui.
  • Voir un problème ou une opportunité, le ou la prendre en charge et agir en toute indépendance.
  • Connaissances de Datadog préférée (ou au moins, d’un produit similaire/équivalent).
  • Connaissances de Rapid7 Insight préférée (ou au moins, d’un produit similaire/équivalent)
  • Connaissances et expérience de AWS ou de Azure r
  • Connaissances de base en développement Java ou .Net requises.
  • Connaissances de GitLab (licence d'entreprise) de préférence (ou au minimum, Jenkins requis).
  • Avec de l'expérience dans un environnement SaaS constitue un atout majeur.
  • Une maîtrise solide de la communication en anglais, tant à l'écrit qu'à l'oral, est essentielle pour une correspondance efficace avec les clients, les partenaires commerciaux et les collègues au-delà de la province du Québec.

Autres exigences :

  • Rotation en cas d’escalade d’incidents
  • Voyages occasionnels (visites trimestrielles sur les lieux, conférences - moins de 10 %)

Chez Tecsys, nous valorisons la créativité, l'innovation et le travail d'équipe. Nos employés bénéficient d’un environnement de travail favorable, des programmes de rémunération compétitifs et d’opportunités de croissance et d'avancement professionnel.

Tecsys est un employeur offrant l'égalité des chances. Des accommodements sont disponibles pour les candidats sélectionnés pour une entrevue. L’usage du masculin dans ce document a pour unique but d’alléger le texte.

NB: Si vous postulez, vous devez être citoyen canadien ou résident permanent du Canada, OU avoir un permis de travail canadien valide.

#J-18808-Ljbffr

  • Montréal, QC, Canada Haven Interactive Studios Full time

    En mai 2021, nous sommes lancés dans la création de Haven Studios avec une petite équipe et de grandes ambitions. Notre objectif était de construire un studio où nous pourrions créer le genre de jeux que nous avons toujours voulu créer - et auxquels nous avons toujours rêvé de jouer ! Nous faisons désormais partie de la famille PlayStations...


  • Montréal, QC, Canada Sony Interactive Entertainment Inc. Full time

    //FRENCH FOLLOWS// In May 2021, we embarked on a journey to start Haven Studios with a small team and big ambitions. Our goal was to build a studio where we could make the kind of games we’ve always wanted to create – and games we’ve longed to play. We’ve made amazing progress in a short time thanks to our talented, passionate team and their...


  • Montréal, QC, Canada Sony Playstation Full time

    Why PlayStation? PlayStation isn’t just the Best Place to Play — it’s also the Best Place to Work. Today, we’re recognized as a global leader in entertainment producing The PlayStation family of products and services including PlayStation5, PlayStation4, PlayStationVR, PlayStationPlus, acclaimed PlayStation software titles from PlayStation Studios,...

  • Project Engineer

    6 days ago


    Québec, QC, Canada Egis in Canada (formerly McIntosh Perry) Full time

    Role: Reporting to the Vice President Infrastructures, Québec, the Project Engineer will be responsible for project organization, coordination between teams, actions follow-up, internal and external reporting to the client. The ideal candidate is an engineer specialized in maritime or civil engineering, with a passion for project management and a desire to...

  • Project Engineer

    1 week ago


    Québec, QC, Canada Egis in Canada (formerly McIntosh Perry) Full time

    Role: Reporting to the Vice President Infrastructures, Québec, the Project Engineer will be responsible for project organization, coordination between teams, actions follow-up, internal and external reporting to the client. The ideal candidate is an engineer specialized in maritime or civil engineering, with a passion for project management and a desire to...

  • Project Engineer

    3 weeks ago


    Québec, QC, Canada Egis in Canada (formerly McIntosh Perry) Full time

    Role: Reporting to the Vice President Infrastructures, Québec, the Project Engineer will be responsible for project organization, coordination between teams, actions follow-up, internal and external reporting to the client. The ideal candidate is an engineer specialized in maritime or civil engineering, with a passion for project management and a desire to...

  • Project Engineer

    3 weeks ago


    Québec, QC, Canada Egis in Canada (formerly McIntosh Perry) Full time

    Role: Reporting to the Vice President Infrastructures, Québec, the Project Engineer will be responsible for project organization, coordination between teams, actions follow-up, internal and external reporting to the client. The ideal candidate is an engineer specialized in maritime or civil engineering, with a passion for project management and a desire to...

  • Project Engineer

    1 week ago


    Québec, QC, Canada Egis in Canada (formerly McIntosh Perry) Full time

    Role: Reporting to the Vice President Infrastructures, Québec, the Project Engineer will be responsible for project organization, coordination between teams, actions follow-up, internal and external reporting to the client. The ideal candidate is an engineer specialized in maritime or civil engineering, with a passion for project management and a desire to...

  • Project Engineer

    1 week ago


    Québec, QC, Canada Egis in Canada (formerly McIntosh Perry) Full time

    Role: Reporting to the Vice President Infrastructures, Québec, the Project Engineer will be responsible for project organization, coordination between teams, actions follow-up, internal and external reporting to the client. The ideal candidate is an engineer specialized in maritime or civil engineering, with a passion for project management and a desire to...


  • Montréal, QC, Canada Sony Interactive Entertainment Inc. Full time

    //FRENCH FOLLOWS// LOCATION: QUEBEC In May 2021, we embarked on a journey to start Haven Studios with a small team and big ambitions. Our goal was to build a studio where we could make the kind of games we’ve always wanted to create – and games we’ve longed to play. We’ve made amazing progress in a short time thanks to our talented, passionate...


  • Montréal, QC, Canada Haven Interactive Studios Full time

    LOCATION : QUEBEC En mai 2021, nous sommes lancés dans la création de Haven Studios avec une petite équipe et de grandes ambitions. Notre objectif était de construire un studio où nous pourrions créer le genre de jeux que nous avons toujours voulu créer - et auxquels nous avons toujours rêvé de jouer ! Nous faisons désormais partie de la famille...


  • Montréal, QC, Canada Sony Playstation Full time

    Why PlayStation? PlayStation isn’t just the Best Place to Play — it’s also the Best Place to Work. Today, we’re recognized as a global leader in entertainment producing The PlayStation family of products and services including PlayStation5, PlayStation4, PlayStationVR, PlayStationPlus, acclaimed PlayStation software titles from PlayStation Studios,...

  • Project Engineer

    3 weeks ago


    Québec, QC, Canada Egis in Canada (formerly McIntosh Perry) Full time

    Role: Reporting to the Vice President Infrastructures, Québec, the Project Engineer will be responsible for project organization, coordination between teams, actions follow-up, internal and external reporting to the client. The ideal candidate is an engineer specialized in maritime or civil engineering, with a passion for project management and a desire...


  • Montréal, QC, Canada OVHcloud Full time

    Département Nous recherchons un.e Ingénieur.e fiabilité de site / DevOps pour notre département TI, technologie & Produits qui conçoit et développe les produits, les services, les infrastructures qui construisent ensemble l’avenir d’OVHcloud. Responsabilités Concevoir et développer des modules fonctionnels intégrés tout en veillant à leur...


  • Québec, Canada TEHORA Full time

    TEHORA est présentement à la recherche analyste en infrastructure infonuagique (Azure DevOps et PaaS) ayant d’excellentes aptitudes techniques, d’excellentes connaissances et qui souhaite mettre à profit ses compétences au sein d’une équipe polyvalente. Sans être exhaustifs, voici les services et livrables que devront fournir l'analyste...

  • Project Engineer

    3 weeks ago


    Québec, Canada Egis in Canada (formerly McIntosh Perry) Full time

    Role:Reporting to the Vice President Infrastructures, Québec, the Project Engineer will be responsible for project organization, coordination between teams, actions follow-up, internal and external reporting to the client. The ideal candidate is an engineer specialized in maritime or civil engineering, with a passion for project management and a desire to...

  • Project Engineer

    3 weeks ago


    Québec, Canada Egis in Canada (formerly McIntosh Perry) Full time

    Role: Reporting to the Vice President Infrastructures, Québec, the Project Engineer will be responsible for project organization, coordination between teams, actions follow-up, internal and external reporting to the client. The ideal candidate is an engineer specialized in maritime or civil engineering, with a passion for project management and a desire to...


  • Contrecoeur, QC, Canada ArcelorMittal Produits longs Canada Full time

    Tu es passionné(e) par le milieu industriel et la fiabilité de ses équipements? Analyser la performance des équipements en visant l’atteinte de leur plein potentiel t’intéresse?Le poste d’Ingénieur fiabilité électrique est fait pour toi! Clique ici pour en savoir plus!Qui sommes-nous ?ArcelorMittal Produits longs Canada (AMPLC) est une grande...


  • Contrecoeur, QC, Canada ArcelorMittal Produits longs Canada Full time

    Tu es passionné(e) par le milieu industriel et la fiabilité de ses équipements? Analyser la performance des équipements en visant l’atteinte de leur plein potentiel t’intéresse?Le poste d’Ingénieur fiabilité électrique est fait pour toi! Clique ici pour en savoir plus!Qui sommes-nous ?ArcelorMittal Produits longs Canada (AMPLC) est une grande...


  • Contrecoeur, QC, Canada ArcelorMittal Produits longs Canada Full time

    Tu es passionné(e) par le milieu industriel et la fiabilité de ses équipements? Analyser la performance des équipements en visant l’atteinte de leur plein potentiel t’intéresse?Le poste d’Ingénieur fiabilité électrique est fait pour toi! Clique ici pour en savoir plus!Qui sommes-nous ?ArcelorMittal Produits longs Canada (AMPLC) est une grande...