Data Quality / Annotation Specialist (F/H)

Remote: 
Full Remote
Contract: 
Work from: 

Offer summary

Qualifications:

Significant experience in data annotation or quality assurance roles in AI., Strong attention to detail and ability to perform repetitive tasks reliably., Excellent written language skills in French and English, with knowledge of other languages being a plus., Strong organizational skills and effective time management..

Key responsibilities:

  • Conduct final audits of data before integration into models, ensuring compliance with guidelines.
  • Evaluate the accuracy, relevance, and usefulness of textual and visual data.
  • Identify and manually correct inconsistencies and errors in content.
  • Collaborate with AI, Product, and Data Engineering teams to optimize data production cycles.

Mirakl logo Icon for a company verified by Jobgether
Mirakl Retailtech: Retail + Technology Unicorn https://www.mirakl.com
501 - 1000 Employees

Job description

Mirakl, leader et pionnier de l’économie de plateforme, propose aux entreprises une suite unique de solutions leur permettant de transformer significativement leur e-commerce afin d'accélérer de façon durable et rentable leur croissance. Depuis 2012, Mirakl accompagne les entreprises B2C et B2B avec la technologie la plus avancée, sécurisée et évolutive leur permettant de digitaliser leur activité et d'élargir leur offre via la marketplace ou le dropship, faciliter la gestion des catalogues et des paiements de leurs fournisseurs pour plus d'efficacité, offrir une expérience d'achat personnalisée à leurs clients, et augmenter leurs profits grâce au retail media. Basée à Paris et Boston, Mirakl est certifiée Great Place to Work.

 

A propos de Mirakl Labs

Nos équipes techniques et produits, nommées Mirakl Labs, sont principalement réparties entre nos 2 hubs situés à Paris et à Bordeaux. Elles collaborent au quotidien afin d'adresser les problématiques de nos clients et utilisateurs en répondant à différents challenges liés aux nouvelles fonctionnalités, à la scalabilité, la sécurité et l’ergonomie…

Elles opèrent en mode agile et s'organisent en Squads composées d'un Squad Lead, de 5 développeurs, d'un Product Manager et d'un QA. Chaque Squad est spécialisée sur un scope fonctionnel afin de concevoir et réaliser de nouvelles features, leurs évolutions et des APIs (avec un découpage en micro-services). Nos équipes Infrastructure, Architecture, Sécurité, Documentation, Product Design, Data et Support opèrent en transverse en apportant leur expertise et de la cohérence sur l’ensemble des produits.

Toutes les équipes sont responsables de leur périmètre et chacun des collaborateurs apporte son expérience et ses idées. Innovation, feedback et implication dans les prises de décision sont au cœur de notre philosophie.

Et pour favoriser ce partage avec d’autres passionnés, nous sommes sponsors, speakers, et hôtes de différents événements, meetups, et associations de la scène Tech en France. Au cours des dernières années, nous avons participé à des événements tels que Devoxx, ReactEurope, ProductConf et Flupa UX Days.

 

À propos du job

Intégré.e à notre équipe Intelligence Artificielle, vous jouerez un rôle clé dans l’assurance qualité de notre produit GenAI Catalog Transformer et des données utilisées pour entraîner nos LLMs / VLMs fine-tunés.

En tant que Data Quality / Annotation Specialist, vous serez responsable de garantir la qualité, la cohérence et la conformité des données d’annotation à grande échelle. Vous travaillerez en étroite collaboration avec les équipes IA, Produit, Data Engineering et Annotation afin d'assurer que nos modèles s'appuient sur des jeux de données fiables et représentatifs.

Nous recrutons en CDI, à Paris, Bordeaux, ou en full remote.


Vos missions
  • Audit & Validation : Effectuer des audits finaux des données avant intégration dans les modèles, en vérifiant leur conformité avec les guidelines.

  • Exactitude & Cohérence : Évaluer la précision, la pertinence et l’utilité des données textuelles et visuelles.

  • Correction des erreurs : Identifier et corriger manuellement les incohérences et les erreurs de contenu.

  • Suivi des guidelines : Vérifier le respect des consignes d’annotation et formuler des retours aux équipes concernées.

  • Optimisation des processus : Participer à l’amélioration continue des workflows d’annotation et de validation.

  • Collaboration transverse : Travailler avec les équipes IA, Produit, Data Engineering pour optimiser les cycles de production de données.

  • Leadership opérationnel : Piloter des projets liés à l’évaluation de prompts, incluant la rédaction de guidelines, FAQ, et la coordination des annotateurs.


Ce qu’il y a pour vous dans ce job
  • Contribuer à des projets d’IA générative de pointe au sein d’un acteur majeur de la tech française.

  • Avoir un impact direct sur la qualité des modèles déployés sur plus de 500 marketplaces dans 40 pays.

  • Collaborer avec des experts en NLP, Computer Vision, et LLMs.

  • Évoluer dans un environnement exigeant mais bienveillant, axé sur la rigueur, la qualité, et l’innovation.


Vous aimerez ce job si :
  • Vous avez une expérience significative dans l’annotation de données ou dans des rôles orientés assurance qualité en IA.

  • Vous êtes rigoureux.se, très attentif.ve aux détails, et capable d’effectuer des tâches répétitives avec une grande fiabilité.

  • Vous avez d’excellentes compétences linguistiques écrites, en français comme en anglais (la maîtrise d'autres langues est un plus).

  • Vous savez travailler de manière autonome, suivre des consignes complexes et évoluer dans un environnement parfois ambigu.

  • Vous avez un très bon sens de l’organisation et une gestion du temps efficace.

  • Vous aimez construire des process, proposer des améliorations concrètes et travailler en équipe dans une logique de qualité produit.


Notre stack et nos outils

Python, Hugging Face, Databricks, Airflow, AWS, SQL, outils internes d’annotation, outils de prompt-eval et benchmark qualitatif des modèles. Collaboration avec les outils de monitoring type Galileo, Unsloth, LangChain, etc.


Le processus de recrutement
  • Un échange téléphonique de 30 minutes avec un recruteur Tech.

  • Un test écrit à distance, axé sur la rigueur, la logique et les compétences linguistiques (test rapide sous forme de questionnaire)

  • Un entretien métier de 45 minutes avec un membre de l’équipe IA.
  • Un dernier entretien d’une heure autour des valeurs et de la culture Mirakl, avec des membres de l’équipe.

Mirakl est engagée en faveur de la diversité, de l’égalité des chances et de l’inclusion. Nous célébrons nos différences car nous sommes convaincus que les qualités visibles et invisibles de chaque Mirakl Worker sont une source de force et d’innovation. Dans le cadre de cet engagement, nous étudions toutes les candidatures sans distinction de : genre, ethnicité, religion, orientation sexuelle, handicap, âge ou toute autre caractéristique protégée par la loi.

Required profile

Experience

Industry :
Retailtech: Retail + Technology
Spoken language(s):
FrenchEnglish
Check out the description to know which languages are mandatory.

Other Skills

  • Collaboration
  • Time Management
  • Teamwork
  • Organizational Skills
  • Detail Oriented

Data Quality Analyst Related jobs