Site Reliability Engineer/Ingénieur fiabilité des infrastructures

Found in: beBee S CA - 2 weeks ago


Montreal, Canada Tecsys Inc. Full time

La version française suit ci-dessous

Having recognized the advantages of remote work, including employee morale, productivity, reduced commuting on employee wellbeing and the environment, we are proud to be a digital-first company. The technologies and programs in which we invested have provided a fantastic foundation to this end. Our digital-first work environment, together with our conveniently located offices and collaborative workspaces, provide our team with the freedom and flexibility to work in the way that makes our employees most productive.

About us

Tecsys is a fast-growing innovator offering supply chain solutions to industry leading healthcare systems, hospitals, and pharmacy businesses to distributors, retailers, and 3PLs. We work with industry leaders to transform their supply chains through technology. If you thrive on tackling difficult challenges with continuous learning opportunities and want to work in a respectful, comfortable, and dynamic work environment, then this could be a good fit for you

About the Role

We are looking for a Site Reliability Engineer to work within our "Network and Security Operations Center" department. Our NOC team is aimed at improving the reliability and uptime of our platform and applications in a data-driven way to support internal and external customers' needs.

Your responsibilities

  • Collaborate with other Engineering teams to support services before they go live through activities such as system design consulting, developing software platforms and frameworks, capacity planning and launch reviews.
  • Maintain services once they are live by measuring and monitoring availability, latency and overall system health.
  • Develop tools & automation on top of Azure & AWS to continuously reduce the need for manual intervention.
  • Scale systems sustainably through automation and evolve systems by pushing for changes that improve reliability and velocity.
  • Be on-call.
  • Practice sustainable incident response and blameless postmortems.
  • Implement automated solutions for continuous integration and delivery (CI / CD).
  • Implement monitoring, Logging, alerting, and SLA Reporting.
  • Implement service monitoring dashboards displaying key metrics.
  • Create and maintain technical documentation.
  • Apply SRE best practices.
  • Take command of high-severity incidents and facilitate their resolution.
  • Provide support for our planning and deployment teams to enable stability, predictability, and scale in our continued growth.
  • Collaborate with members of the Platform Engineering team to implement and support far-reaching strategic efforts, provide constructive feedback, and foster a collaborative environment.
  • Work cross-functionally with internal teams and vendors to manage our growth around the globe, with a strong focus on maintaining the high level of performance, availability, and reliability for our users.

Requirements:

  • Bachelor's degree in computer science or related technical discipline.
  • At least 5 years' experience in systems engineering experience; demonstrable technical experience in new platform development, orchestration, product ownership, and iterative design and deployment.
  • Experience designing and deploying large scale systems, multi-vendor platforms and globally distributed infrastructure.
  • Strong knowledge of system design; high performance computing; file, block, and storage technologies; integration of compute, storage, and network technologies to deliver cohesive infrastructure solutions.
  • High level of understanding and examples of executing projects with full stack automation; our scale is going to require a lot of it, we grow to use less manual intervention and work with both internal and open-source tools to automate day-to-day activities.
  • Self-organize, collaborate, and manage efforts with peers and teams across responsibility areas, languages, geography, and time zones.
  • Be a self-starter, curious, and not afraid to ask questions and challenge the way things are done today.
  • See a problem or opportunity, take ownership and act on it independently.
  • Knowledge of Datadog preferred (or at least, similar/equivalent product)
  • Knowledge of Rapid7 Insight preferred (or at least, similar/equivalent product)
  • Knowledge and experience of AWS or Azure required.
  • Basic knowledge of Java- or .Net-based development required.
  • Knowledge of GitLab (enterprise license) preferred (or at minimum, Jenkins required)
  • Experience with SaaS company is a strong asset.
  • Strong English communication skills, both written and spoken, are essential for effective correspondence with customers, business partners and colleagues beyond the province of Quebec.

Additional requirements:

  • Escalation on-call rotation
  • Occasional travel (quarterly offsites, conferences – less than 10%)

At Tecsys, we value creativity, innovation, and teamwork. Our employees enjoy a supportive work environment, competitive compensation packages, and opportunities for career growth and advancement.

Tecsys is an equal opportunity employer. Accommodation is available for applicants selected for an interview.

NB: if you are applying to this position, you must be a Canadian Citizen or a Permanent Resident of Canada, OR, have a valid Canadian work permit.

******************************************************************************************************

Ayant reconnu les avantages du travail à distance sur le bien-être des employés et l'environnement, notamment le moral des employés, la productivité, la réduction des trajets domicile-travail, nous sommes fière d'être une entreprise privilégiant le travail à distance. Les technologies et les programmes dans lesquels nous avons investi ont fourni une base fantastique à cette fin. Notre environnement qui privilégie le travail à distance, ainsi que nos bureaux bien situés et nos espaces de travail collaboratifs, offrent à notre équipe la liberté et la flexibilité de travailler de la manière qui rend nos employés les plus productifs.

A propos de Tecsys

Tecsys est un innovateur à croissance rapide qui offre des solutions de chaîne d'approvisionnement aux principaux systèmes de soins de santé, aux hôpitaux, aux pharmacies, aux distributeurs, aux détaillants et aux 3PL. Nous travaillons avec les leaders du secteur pour transformer leurs chaînes d'approvisionnement grâce à la technologie. Si vous aimez relever des défis difficiles avec des opportunités d'apprentissage continu et si vous souhaitez travailler dans un environnement respectueux, confortable et dynamique, alors ce poste pourrait vous convenir.

A propos du poste

Nous recherchons un ingénieur – fiabilité des infrastructures infonuagiques pour travailler au sein de notre département "Network and Security Operations Center". Notre équipe NOC a pour objectif d'améliorer la fiabilité et le temps de fonctionnement de notre plateforme et de nos applications en s'appuyant sur des données afin de répondre aux besoins des clients internes et externes.

Vos responsabilités

  • Collaborer avec d'autres équipes d'ingénieurs pour soutenir les services avant la mise en service par des activités telles que le conseil en conception de systèmes, le développement de plateformes et de cadres logiciels, la planification des capacités et les examens de lancement.
  • Maintenir les services une fois qu'ils sont en place en mesurant et en surveillant la disponibilité, la latence et la santé générale du système.
  • Développer des outils d'automatisation sur Azure et AWS pour réduire continuellement le besoin d'interventions manuelles.
  • Faire évoluer les systèmes de manière durable grâce à l'automatisation, et faire évoluer les systèmes en préconisant des changements qui améliorent la fiabilité et la rapidité.
  • Être sur appel.
  • Implantez des solutions automatisées pour l'intégration et la livraison continues (CI / CD).
  • Implantez un système de surveillance des systèmes, la journalisation, les alertes et rapports d'ententes de service.
  • Implantez des tableaux de bord d'indicateurs de performance pour le suivi des services.
  • Créer et mettre à jour la documentation technique
  • Apporter une réponse durable aux incidents et faire des post mortem de haute qualité.
  • Prendre en charge des incidents de haute gravité et faciliter leur résolution.
  • Fournir un soutien à nos équipes de planification et de déploiement afin de permettre la stabilité, la prévisibilité et l'ampleur de notre croissance continue.
  • Collaborer avec les membres de l'équipe d'ingénierie de la plate-forme pour mettre en œuvre et soutenir des efforts stratégiques de grande envergure, fournir un retour d'information constructif et favoriser un environnement de collaboration.
  • Travailler de manière transversale avec les équipes internes et les fournisseurs pour gérer notre croissance dans le monde entier, en mettant l'accent sur le maintien d'un niveau élevé de performance, de disponibilité et de fiabilité pour nos utilisateurs.

Vos qualifications

  • Baccalauréat en informatique ou dans une discipline technique connexe.
  • Au moins 5 ans d'expérience en ingénierie des systèmes, expérience technique avérée dans le développement de nouvelles plateformes, l'orchestration, la propriété des produits et la conception et le déploiement itératifs.
  • Expérience dans la conception et le déploiement de systèmes à grande échelle, de plateformes multifournisseurs et d'infrastructures distribuées au niveau mondial.
  • Connaissance approfondie de la conception de systèmes, du calcul haute performance, des technologies de fichiers, de blocs et de stockage, de l'intégration des technologies de calcul, de stockage et de réseau pour fournir des solutions d'infrastructure cohérentes.
  • Haut niveau de compréhension et exemples d'exécution de projets avec une automatisation complète de la pile, notre échelle va en demander beaucoup, nous nous développons pour utiliser moins d'interventions manuelles et travailler avec des outils internes et source libre pour automatiser les activités quotidiennes.
  • Faire preuve d'initiative, de curiosité et ne pas avoir peur de poser des questions et de remettre en question la façon dont les choses sont faites aujourd'hui.
  • Voir un problème ou une opportunité, le ou la prendre en charge et agir en toute indépendance.
  • Connaissances de Datadog préférée (ou au moins, d'un produit similaire/équivalent).
  • Connaissances de Rapid7 Insight préférée (ou au moins, d'un produit similaire/équivalent)
  • Connaissances et expérience de AWS ou de Azure r
  • Connaissances de base en développement Java ou .Net requises.
  • Connaissances de GitLab (licence d'entreprise) de préférence (ou au minimum, Jenkins requis).
  • Avec de l'expérience dans un environnement SaaS constitue un atout majeur.
  • Une maîtrise solide de la communication en anglais, tant à l'écrit qu'à l'oral, est essentielle pour une correspondance efficace avec les clients, les partenaires commerciaux et les collègues au-delà de la province du Québec.

Autres exigences :

  • Rotation en cas d'escalade d'incidents
  • Voyages occasionnels (visites trimestrielles sur les lieux, conférences - moins de 10 %)

Chez Tecsys, nous valorisons la créativité, l'innovation et le travail d'équipe. Nos employés bénéficient d'un environnement de travail favorable, des programmes de rémunération compétitifs et d'opportunités de croissance et d'avancement professionnel.

Tecsys est un employeur offrant l'égalité des chances. Des accommodements sont disponibles pour les candidats sélectionnés pour une entrevue. L'usage du masculin dans ce document a pour unique but d'alléger le texte.

NB: Si vous postulez, vous devez être citoyen canadien ou résident permanent du Canada, OU avoir un permis de travail canadien valide.



  • Montreal, Canada Tecsys Inc. Full time

    La version française suit ci-dessousHaving recognized the advantages of remote work, including employee morale, productivity, reduced commuting on employee wellbeing and the environment, we are proud to be a digital-first company. The technologies and programs in which we invested have provided a fantastic foundation to this end. Our digital-first work...

  • Site Reliability Engineering specialist

    Found in: Appcast CA C2 Glassdoor - 2 weeks ago


    Greater Montreal Metropolitan Area, Canada CGI Full time

    Lieu : Montréal, QuébecBilingue français-anglaisCGI est une entreprise technologique dynamique et innovante engagée à fournir des solutions de pointe. Nous sommes actuellement à la recherche d'un individu hautement qualifié et motivé, francophone, pour rejoindre notre équipe en tant qu'ingénieur FinOps et de fiabilité des sites (SRE). Ce rôle est...

  • Site Reliability Engineering specialist

    Found in: Appcast CA A2 P - 1 week ago


    Greater Montreal Metropolitan Area, Canada CGI Full time

    Lieu : Montréal, QuébecBilingue français-anglaisCGI est une entreprise technologique dynamique et innovante engagée à fournir des solutions de pointe. Nous sommes actuellement à la recherche d'un individu hautement qualifié et motivé, francophone, pour rejoindre notre équipe en tant qu'ingénieur FinOps et de fiabilité des sites (SRE). Ce rôle est...

  • Site Reliability Engineering specialist

    Found in: Whatjobs CA C2 - 1 week ago


    Greater Montreal Metropolitan Area, Canada CGI Full time

    Lieu : Montréal, Québec Bilingue français-anglais CGI est une entreprise technologique dynamique et innovante engagée à fournir des solutions de pointe. Nous sommes actuellement à la recherche d'un individu hautement qualifié et motivé, francophone, pour rejoindre notre équipe en tant qu'ingénieur FinOps et de fiabilité des sites (SRE). Ce rôle...


  • Montreal, Canada Haven Interactive Studios Full time

    En mai 2021, nous sommes lancés dans la création de Haven Studios avec une petite équipe et de grandes ambitions. Notre objectif était de construire un studio où nous pourrions créer le genre de jeux que nous avons toujours voulu créer - et auxquels nous avons toujours rêvé de jouer ! Nous faisons désormais partie de la famille PlayStations Studios...


  • Montreal, Canada Haven Interactive Studios Full time

    En mai 2021, nous sommes lancés dans la création de Haven Studios avec une petite équipe et de grandes ambitions. Notre objectif était de construire un studio où nous pourrions créer le genre de jeux que nous avons toujours voulu créer - et auxquels nous avons toujours rêvé de jouer ! Nous faisons désormais partie de la famille PlayStations Studios...


  • Montreal, Canada Haven Interactive Studios Full time

    En mai 2021, nous sommes lancés dans la création de Haven Studios avec une petite équipe et de grandes ambitions. Notre objectif était de construire un studio où nous pourrions créer le genre de jeux que nous avons toujours voulu créer - et auxquels nous avons toujours rêvé de jouer ! Nous faisons désormais partie de la famille PlayStations Studios...


  • Montreal, Canada Sony Interactive Entertainment Inc. Full time

    //FRENCH FOLLOWS// In May 2021, we embarked on a journey to start Haven Studios with a small team and big ambitions. Our goal was to build a studio where we could make the kind of games we’ve always wanted to create – and games we’ve longed to play. We’ve made amazing progress in a short time thanks to our talented, passionate team and their...


  • Montreal, Canada Sony Interactive Entertainment Inc. Full time

    //FRENCH FOLLOWS// In May 2021, we embarked on a journey to start Haven Studios with a small team and big ambitions. Our goal was to build a studio where we could make the kind of games we’ve always wanted to create – and games we’ve longed to play. We’ve made amazing progress in a short time thanks to our talented, passionate team and their...


  • Montreal, Canada Sony Interactive Entertainment Inc. Full time

    //FRENCH FOLLOWS// In May 2021, we embarked on a journey to start Haven Studios with a small team and big ambitions. Our goal was to build a studio where we could make the kind of games we’ve always wanted to create – and games we’ve longed to play. We’ve made amazing progress in a short time thanks to our talented, passionate team and their...


  • Montreal, Canada Sony Playstation Full time

    Why PlayStation?PlayStation isn’t just the Best Place to Play — it’s also the Best Place to Work. Today, we’re recognized as a global leader in entertainment producing The PlayStation family of products and services including PlayStation5, PlayStation4, PlayStationVR, PlayStationPlus, acclaimed PlayStation software titles from PlayStation Studios,...


  • Montreal, Canada Sony Playstation Full time

    Why PlayStation?PlayStation isn’t just the Best Place to Play — it’s also the Best Place to Work. Today, we’re recognized as a global leader in entertainment producing The PlayStation family of products and services including PlayStation5, PlayStation4, PlayStationVR, PlayStationPlus, acclaimed PlayStation software titles from PlayStation Studios,...


  • Montreal, Canada Sony Playstation Full time

    Why PlayStation?PlayStation isn’t just the Best Place to Play — it’s also the Best Place to Work. Today, we’re recognized as a global leader in entertainment producing The PlayStation family of products and services including PlayStation5, PlayStation4, PlayStationVR, PlayStationPlus, acclaimed PlayStation software titles from PlayStation Studios,...

  • Site Reliability Engineer

    Found in: Talent CA C2 - 1 week ago


    Montreal, Canada OVHcloud Full time

    #Département Nous recherchons un.e Ingénieur.e fiabilité de site / DevOps pour notre département TI, technologie & Produits qui conçoit et développe les produits, les services, les infrastructures qui construisent ensemble l’avenir d’OVHcloud. #Responsabilités • Concevoir et développer des modules fonctionnels intégrés tout en...


  • Montreal, Canada OVHcloud Full time

    Département Nous recherchons un.e Ingénieur.e fiabilité de site / DevOps pour notre département TI, technologie & Produits qui conçoit et développe les produits, les services, les infrastructures qui construisent ensemble l’avenir d’OVHcloud. Responsabilités Concevoir et développer des modules fonctionnels intégrés tout en veillant à leur...


  • Montreal, Canada Lightspeed Commerce Full time

    Hi there! Thanks for stopping by Are you actively looking for a new opportunity? Or just checking the market? Well… you might just be in the right place! We’re looking for a Principal Site Reliability Engineer to join our NuOrder by Lightspeed team in North America. NuORDER by Lightspeed builds software solutions that help merchants grow the size and...

  • Site Reliability Expert

    Found in: Talent CA C2 - 2 weeks ago


    Montreal, Canada PlayStation Full time

    Why PlayStation? PlayStation isn’t just the Best Place to Play — it’s also the Best Place to Work. Today, we’re recognized as a global leader in entertainment producing The PlayStation family of products and services including PlayStation®5, PlayStation®4, PlayStation®VR, PlayStation®Plus, acclaimed PlayStation software titles from...

  • ingénieur fiabilité

    Found in: Talent CA C2 - 1 week ago


    Montreal, Canada TOTEM recruteur de talent Full time

    Poste : Ingénieur(e), FiabilitéLocalisation :TMEDate :17 janvier 2023No. d’affichage :23-03Statut :Permanent non-syndiquéÀ combler d’ici le :ImmédiatementSuperieur immédiat:Directeur, Entretien et IntégritéService :EntretienÀ propos d’Énergie Valero inc.Énergie Valero inc., dont le siège social canadien est situé à Montréal, est une...

  • Expert en ingénierie de fiabilité de site.

    Found in: Talent CA C2 - 6 hours ago


    Montreal, Canada Cisco Full time

    Qui nous sommes En tant que membre de Cisco, Accedian est un chef de file des solutions d’analyse du rendement et d’expérience de l’utilisateur final pour les fournisseurs de services et les moyennes et grandes entreprises. La plateforme d’assurance de service Accedian Skylight offre une visibilité granulaire de bout en bout au sein de...


  • Montreal, Canada Experience AI Solutions Full time

    Senior Infrastructure Engineer Start Date: as soon as possible. Type of employment: Contract Number of Positions: 1 Location: Montreal, Quebec Language skills: Strong English communication skills are required. Perks: Work with cutting-edge technology using sophisticated AI, as part of a passionate, dedicated team that thrives on meaningful innovation...