Développeur.euse sénior, Plateforme de données ML
Nous recherchons un·e Développeur.euse sénior, Plateforme de données ML visionnaire et hautement technique pour concevoir, implémenter, faire évoluer et maintenir le moteur de données qui alimente nos modèles de pointe (frontier models) de prochaine génération.
Dans ce rôle à fort impact, vous ferez le pont entre la recherche en IA de pointe et l'ingénierie haute performance, en traitant la plateforme de données comme un produit interne dont nos chercheurs sont les principaux clients. Vous serez responsable de la conception d'une architecture de stockage multi-niveaux à ultra-faible temps de latence et de la construction de pipelines de traitement de données automatisés à l'échelle du pétaoctet. Nous recherchons une personne capable de faire évoluer notre environnement technique vers un système à grande échelle, non seulement en suivant les tendances de l'industrie, mais aussi en les remettant en question et en prenant des décisions durables en étroite collaboration avec nos équipes de recherche et de produit.
Responsabilités clés
- Concevoir et maintenir une architecture de stockage hiérarchisée et collaborer avec l'équipe de recherche pour assurer une intégration fluide avec les pipelines d'entraînement.
- Faire évoluer et automatiser l'infrastructure de traitement des données pour gérer des pétaoctets de données et garantir son bon fonctionnement.
- Assurer une utilisation efficace des ressources de calcul, y compris l'accès aux GPU pour les tâches de traitement de données intensives.
- Aider l'équipe d’Infrastructure à provisionner les environnements de calcul et de stockage afin de soutenir la mise à l’échelle (scaling).
- Garantir que tous les ensembles de données (datasets), y compris les résultats intermédiaires de chaque étape de transformation, soient versionnés, reproductibles et entièrement traçables pour répondre aux besoins spécifiques et dynamiques des expériences, et qu'ils soient accompagnés de fiches techniques (datasheets), conformément aux politiques internes de gouvernance des données.
- Collaborer avec l'équipe de recherche et d'autres équipes pour comprendre leurs besoins concernant l'exploration, l'échantillonnage et l'analyse des données en libre-service, et développer les outils appropriés.
Compétences et qualifications
- Un baccalauréat (ou diplôme universitaire équivalent) dans un domaine pertinent (ex. informatique, génie informatique, génie logiciel) est requis.
- Plus de 5 ans d'expérience dans la conception, l'implémentation et la gestion de stockage à l'échelle du web, avec les réseaux haute performance (HPC) ou les environnements de données d’apprentissage automatique (ML) distribués à grande échelle, dont une expérience récente utilisant par exemple Lustre, Ray, Apache Spark, des orchestrateurs de flux de travaux (workflow orchestrators), Apache Arrow et/ou Parquet.
- Capacité à collaborer efficacement avec des équipes interfonctionnelles, à documenter les meilleures pratiques et à rester à l'affût des dernières avancées en matière de traitement de données à grande échelle et de développement logiciel.
- Expérience avec des gestionnaires de charge de travail (ex. Ray, Kubernetes, Slurm).
- Familiarité avec les outils de conteneurisation (ex. Docker, Enroot).
- Familiarité avec les infrastructures et plateformes de données (ex. bases de données vectorielles).
Ce que nous offrons
- La possibilité de contribuer de manière significative à une initiative d'importance mondiale.
- Des avantage sociaux complets en matière de santé (incluant un compte de gestion de la santé mentale et du bien-être).
- 20 jours de vacances par an dès l'embauche.
- Une contribution de l'employeur de 4 % à votre épargne-retraite, sans exigence de contribution équivalente de la part de l'employé.
- Une rémunération supplémentaire totalisant 8 % de votre salaire, à attribuer à une épargne-retraite supplémentaire ou à des primes (non lié à la performance).
- Une équipe d'experts passionnés et compétents.
- Un environnement de travail collaboratif et inclusif dans nos bureaux situés au cœur de la Petite Italie, dans le quartier branché de Mile-Ex, à proximité des transports en commun.
À propos de LoiZéro
LoiZéro est une organisation à but non lucratif dédiée à faire progresser la recherche et à développer des solutions techniques permettant de concevoir des systèmes d'IA sécuritaires. Son approche scientifique repose sur de nouvelles recherches et méthodes proposées par le professeur Yoshua Bengio, le chercheur en IA le plus cité au monde. Basée à Montréal, LoiZéro mène des recherches pour concevoir des systèmes d’IA non agentiques qui apprennent à comprendre le monde plutôt qu'à y intervenir, en répondant de manière véridique aux questions posées sur la base d'un raisonnement probabiliste transparent et extériorisé. De tels systèmes d'IA pourraient être utilisés pour accélérer la découverte scientifique, superviser les systèmes d'IA agentiques et faire progresser notre compréhension des risques de l'IA et des moyens de les éviter. LoiZéro croit que l’IA doit être considérée comme un bien public mondial, développée et utilisée de manière sécuritaire pour favoriser l’épanouissement humain. Plus d’information : www.loizero.org
Vous avez votre place ici
À LoiZéro, la diversité nous tient à cœur. Nous valorisons un environnement de travail équitable, ouvert et respectueux des différences. Nous encourageons les candidatures de personnes hautement qualifiées désireuses de travailler à la réalisation de notre mission dans un cadre respectueux, inclusif et collaboratif.
Vos informations personnelles seront collectées et traitées par LoiZéro afin d'évaluer votre demande d'emploi conformément à notre politique de vie privée. En vertu des lois sur la protection de la vie privée en vigueur dans votre pays de résidence, vous pouvez disposer de plusieurs droits en matière de protection de la vie privée, comme celui de demander l'accès à vos informations personnelles ou de demander que vos informations personnelles soient rectifiées ou effacées. Vous trouverez des détails sur la manière dont vous pouvez exercer vos droits dans notre politique de protection de la vie privée.
Postuler à ce poste
*
indique un champ obligatoire

