Retour aux offres d’emploi
Nouveau

Data Quality / Annotation Specialist (F/H)

Bordeaux, France; Paris, France; Remote - France

Mirakl, leader et pionnier de l’économie de plateforme, propose aux entreprises une suite unique de solutions leur permettant de transformer significativement leur e-commerce afin d'accélérer de façon durable et rentable leur croissance. Depuis 2012, Mirakl accompagne les entreprises B2C et B2B avec la technologie la plus avancée, sécurisée et évolutive leur permettant de digitaliser leur activité et d'élargir leur offre via la marketplace ou le dropship, faciliter la gestion des catalogues et des paiements de leurs fournisseurs pour plus d'efficacité, offrir une expérience d'achat personnalisée à leurs clients, et augmenter leurs profits grâce au retail media. Basée à Paris et Boston, Mirakl est certifiée Great Place to Work.

 

A propos de Mirakl Labs

Nos équipes techniques et produits, nommées Mirakl Labs, sont principalement réparties entre nos 2 hubs situés à Paris et à Bordeaux. Elles collaborent au quotidien afin d'adresser les problématiques de nos clients et utilisateurs en répondant à différents challenges liés aux nouvelles fonctionnalités, à la scalabilité, la sécurité et l’ergonomie…

Elles opèrent en mode agile et s'organisent en Squads composées d'un Squad Lead, de 5 développeurs, d'un Product Manager et d'un QA. Chaque Squad est spécialisée sur un scope fonctionnel afin de concevoir et réaliser de nouvelles features, leurs évolutions et des APIs (avec un découpage en micro-services). Nos équipes Infrastructure, Architecture, Sécurité, Documentation, Product Design, Data et Support opèrent en transverse en apportant leur expertise et de la cohérence sur l’ensemble des produits.

Toutes les équipes sont responsables de leur périmètre et chacun des collaborateurs apporte son expérience et ses idées. Innovation, feedback et implication dans les prises de décision sont au cœur de notre philosophie.

Et pour favoriser ce partage avec d’autres passionnés, nous sommes sponsors, speakers, et hôtes de différents événements, meetups, et associations de la scène Tech en France. Au cours des dernières années, nous avons participé à des événements tels que Devoxx, ReactEurope, ProductConf et Flupa UX Days.

 

À propos du job

Intégré.e à notre équipe Intelligence Artificielle, vous jouerez un rôle clé dans l’assurance qualité de notre produit GenAI Catalog Transformer et des données utilisées pour entraîner nos LLMs / VLMs fine-tunés.

En tant que Data Quality / Annotation Specialist, vous serez responsable de garantir la qualité, la cohérence et la conformité des données d’annotation à grande échelle. Vous travaillerez en étroite collaboration avec les équipes IA, Produit, Data Engineering et Annotation afin d'assurer que nos modèles s'appuient sur des jeux de données fiables et représentatifs.

Nous recrutons en CDI, à Paris, Bordeaux, ou en full remote.


Vos missions

  • Audit & Validation : Effectuer des audits finaux des données avant intégration dans les modèles, en vérifiant leur conformité avec les guidelines.

  • Exactitude & Cohérence : Évaluer la précision, la pertinence et l’utilité des données textuelles et visuelles.

  • Correction des erreurs : Identifier et corriger manuellement les incohérences et les erreurs de contenu.

  • Suivi des guidelines : Vérifier le respect des consignes d’annotation et formuler des retours aux équipes concernées.

  • Optimisation des processus : Participer à l’amélioration continue des workflows d’annotation et de validation.

  • Collaboration transverse : Travailler avec les équipes IA, Produit, Data Engineering pour optimiser les cycles de production de données.

  • Leadership opérationnel : Piloter des projets liés à l’évaluation de prompts, incluant la rédaction de guidelines, FAQ, et la coordination des annotateurs.


Ce qu’il y a pour vous dans ce job

  • Contribuer à des projets d’IA générative de pointe au sein d’un acteur majeur de la tech française.

  • Avoir un impact direct sur la qualité des modèles déployés sur plus de 500 marketplaces dans 40 pays.

  • Collaborer avec des experts en NLP, Computer Vision, et LLMs.

  • Évoluer dans un environnement exigeant mais bienveillant, axé sur la rigueur, la qualité, et l’innovation.


Vous aimerez ce job si :

  • Vous avez une expérience significative dans l’annotation de données ou dans des rôles orientés assurance qualité en IA.

  • Vous êtes rigoureux.se, très attentif.ve aux détails, et capable d’effectuer des tâches répétitives avec une grande fiabilité.

  • Vous avez d’excellentes compétences linguistiques écrites, en français comme en anglais (la maîtrise d'autres langues est un plus).

  • Vous savez travailler de manière autonome, suivre des consignes complexes et évoluer dans un environnement parfois ambigu.

  • Vous avez un très bon sens de l’organisation et une gestion du temps efficace.

  • Vous aimez construire des process, proposer des améliorations concrètes et travailler en équipe dans une logique de qualité produit.


Notre stack et nos outils

Python, Hugging Face, Databricks, Airflow, AWS, SQL, outils internes d’annotation, outils de prompt-eval et benchmark qualitatif des modèles. Collaboration avec les outils de monitoring type Galileo, Unsloth, LangChain, etc.


Le processus de recrutement

  • Un échange téléphonique de 30 minutes avec un recruteur Tech.

  • Un test écrit à distance, axé sur la rigueur, la logique et les compétences linguistiques (test rapide sous forme de questionnaire)

  • Un entretien métier de 45 minutes avec un membre de l’équipe IA.
  • Un dernier entretien d’une heure autour des valeurs et de la culture Mirakl, avec des membres de l’équipe.

Mirakl est engagée en faveur de la diversité, de l’égalité des chances et de l’inclusion. Nous célébrons nos différences car nous sommes convaincus que les qualités visibles et invisibles de chaque Mirakl Worker sont une source de force et d’innovation. Dans le cadre de cet engagement, nous étudions toutes les candidatures sans distinction de : genre, ethnicité, religion, orientation sexuelle, handicap, âge ou toute autre caractéristique protégée par la loi.

Postuler à ce poste

*

indique un champ obligatoire

CV

Types de fichiers acceptés : pdf, doc, docx, txt, rtf

Lettre de motivation

Types de fichiers acceptés : pdf, doc, docx, txt, rtf


Select...

Mirakl handles personal data during your recruitment processes. Mirakl is the controller of the personal data, meaning it decides how and why the data is processed. Mirakl takes strong commitment to protecting applicant data and ensuring compliance with privacy regulations during the recruitment process, in particular:

  1. Types of Data Processed: Mirakl collects data such as name, contact details, educational and employment history, and other relevant information provided during the application process.
  2. Purpose of Data Use: The data is used to manage and process applications, communicate with candidates and, upon successful application, to onboard the individual.
  3. Data Access and Sharing: Access to personal data is generally restricted within Mirakl and its affiliates, though some third-party providers might have access to carry out specific functions like reference checks and payroll processing.
  4. Data Retention: Personal data is retained only as long as necessary for the recruitment process or to comply with legal obligations, typically up to two years from the last contact.
  5. Rights of Individuals: Candidates have rights regarding their data, including access, data portability, correction, restriction of processing, and in certain cases, deletion. In addition, they may lodge a complaint with an EU supervisory authority.
  6. Queries and complaints: If you have any questions or wish to exercise your rights, you may fill in this form or directly contact us by sending an email to privacy@mirakl.com.

A full version of Mirakl’s Privacy Policy is accessible, here.

Select...