Site Reliability Engineering Streaming (SRE)
Lieu
Avantages
Extraits de la description complète du poste
- Flextime
- Prise en charge du transport quotidien
- RTT
Description du poste
Découvrez l'interview de Rémi, Engineering Manager chez Clever Cloud depuis 3 ans qui nous parle de son équipe et du projet pour lequel il recrute !
Bonjour Rémi, peux-tu nous présenter Clever Cloud ?
Clever Cloud est une entreprise fondée en 2010 à Nantes. Nous proposons une plateforme d’hébergement répondant aux standards les plus élevés de sécurité et de souveraineté, idéale pour accompagner nos clients dans leur transformation numérique. Notre mission est simple : permettre à nos utilisateurs de se concentrer sur leur cœur de métier, c’est-à-dire coder, pendant que nous nous chargeons de tout ce qui touche à l’hébergement, au déploiement et à la maintenance des applications, sites Internet et bases de données.
Nous nous démarquons de nos concurrents européens par une approche logicielle.
Notre ambition est de devenir le fournisseur de services Cloud de référence, en alliant excellence technologique et responsabilité.
Peux-tu nous parler de l’équipe et des projets sur lesquels vous travaillez actuellement ?
Mon équipe travaille principalement sur un service de systèmes distribués situé au cœur de Clever Cloud. Celui-ci fournit un service de messaging pour l’ensemble des services core de l’entreprise, mais aussi pour nos logs, access-logs, et autres messages. Nous nous appuyons principalement sur Apache Pulsar, technologie open source à laquelle nous contribuons régulièrement concurrente à Apache Kafka.
Aujourd’hui, notre cluster Pulsar est capable de gérer des pics de 150 000 messages par seconde en écriture et 300 000 messages par seconde en lecture ventilée sur des centaines de milliers de topics, avec 128 To de stockage chaud et du stockage froid sur S3.
Nous ne comptons pas nous arrêter en si bon chemin, et notre croissance apporte des challenges extrêmement intéressants de production. Nous avons également énormément d’idées pour développer le streaming de données en interne et en temps que produits. De la notification de FaaS, en passant par le streaming des WAL de nos DBs, les futurs usages ne manquent pas pour notre service.
À quoi ressemble une journée au sein de ton équipe ?
Nos journées et nos missions sont très variées :
- Mettre à jour nos environnements de production (kernel, glibc, Pulsar, etc.).
- Résoudre les problématiques remontées par nos utilisateurs.
- Créer des outils pour automatiser et accélérer les tâches récurrentes.
- Analyser nos tableaux de bord sur Grafana pour surveiller les performances.
Les défis ne manquent pas : maintenir une infrastructure à haute disponibilité tout en l’améliorant sans interruption de service est un vrai challenge au quotidien.
Vous recrutez un SRE, peux-tu nous parler du poste et des missions ?
Oui, nous recherchons un SRE pour nous accompagner sur la maintenance, le développement et l’optimisation de la technologie Pulsar.
La première partie du travail est de participer à l'opération de Pulsar. Cela inclus:
- Maintenir en conditions opérationnelles une stack critique et hautement disponible.
- Optimiser les performances de Pulsar grâce à l’analyse de la télémétrie et aux retours utilisateurs.
- Conseiller et former les utilisateurs internes et externes qui souhaitent adopter Pulsar.
A ce jour, notre volumétrie nous permet déjà de voir les limitations actuelles de la technologie Apache Pulsar. Nous observons notamment des limitations autour de Zookeeper et de Bookkeeper, composants qui nous offrent la coordination et le stockage des données. Un futur plan qui est nécessaire pour nous est de migrer la couche de consensus et de stockage vers des backends + résilients et scalables. Le SRE pourra participer directement à la migration, en apportant son expertise sur l’architecture actuelle et pourra influer sur le design logicielle.
Peux-tu décrire l’environnement technique de ton équipe ?
Nous travaillons principalement dans un environnement Open Source. Pulsar est développé par StreamNative en OSS, et nous utilisons principalement Java. Pour l’opérationnel, nous nous appuyons sur Ansible. Des connaissances en Rust, Scala ou Go seraient un vrai plus, notamment pour déboguer certaines parties des drivers clients. Si vous avez déjà touché à Zookeeper, c’est encore mieux !
Quelles sont les qualités et compétences que vous recherchez chez votre futur(e) collègue ?
Nous recherchons une personne qui aime creuser pour trouver des solutions à nos problèmes opérationnels. Quelqu’un qui a envie d’améliorer l’expérience opérationnelle autour du produit, de mettre en place de l’outillage interne. Quelqu’un qui n’a pas peur d’ouvrir le code source des logiciels qu’ils opèrent pour regarder sous le capot.
Pour terminer, peux-tu nous parler de ton expérience chez Clever Cloud ? Pourquoi rejoindre l’équipe ?
Peu d’entreprises ont des enjeux techniques de cette envergure avec la volonté d’investir autant dans une approche logicielle. Ce qui est aussi très appréciable chez Clever Cloud, c’est la liberté que l’on nous donne pour choisir les outils qui simplifient notre travail. Et l’ambiance est très bonne : les gens sont vraiment sympas et toujours prêts à aider. C’est une belle aventure humaine et professionnelle ! Nous avons des bureaux à Nantes, Brest, Paris et Pau et le poste est ouvert aussi en télétravail..
Envie de rejoindre une équipe de passionnés au sein d'une entreprise Tech française ?
Postulez dès maintenant à jobs@clever-cloud.com et faites partie de l'aventure Clever Cloud
Type d'emploi : Temps plein, CDI
Statut : Cadre
Avantages :
- Intéressement et participation
- Prise en charge du transport quotidien
- RTT
Horaires :
- Flextime
Lieu du poste : Télétravail