← Retour au blog

Data Fabric vs Data Mesh en pratique

Lucian BLETAN

Le débat “Data Fabric ou Data Mesh” est souvent un faux dilemme. Ces deux approches ne sont pas opposées, mais complémentaires. La Data Fabric vise à créer une couche d’accès unifiée et intelligente aux données, où qu’elles se trouvent. Le Data Mesh, lui, pousse une organisation décentralisée où chaque domaine métier est propriétaire de ses “produits de données”. En pratique, la meilleure architecture combine les deux : des domaines autonomes qui publient des produits de données fiables (Mesh), et une couche d’accès commune qui les rend découvrables, sécurisés et interrogeables (Fabric).

deux philosophies complémentaires

Le Fabric unifie l’accès (pull), tandis que le Mesh décentralise la propriété (push).

data fabric (accès unifié)

une seule requête

consommateur

couche fabric

source 1

source 2

data mesh (propriété distribuée)

publie

publie

domaine 1

produit de données

domaine 2

produit de données

consommateur

quand la fabric aide

Une couche Fabric apporte de la valeur en centralisant les problématiques transverses.

  • Découverte et fédération: Elle fournit un catalogue de données unifié et peut fédérer des requêtes sur plusieurs systèmes sans que l’utilisateur ait à connaître la localisation physique des données.
  • Gouvernance transversale: C’est le point d’entrée unique pour appliquer des politiques de sécurité, de qualité et de conformité de manière cohérente sur tous les produits de données.
  • Virtualisation contrôlée: Pour des cas d’usage rapides où créer une copie matérielle serait trop lent, la Fabric peut créer des vues virtuelles sur les données sources.

quand le mesh gagne

Le Data Mesh est avant tout un modèle organisationnel qui apporte de l’agilité.

  • Ownership clair: Chaque produit de données a un propriétaire clairement identifié. Fini le “cimetière de données” où personne n’est responsable de rien.
  • Vitesse locale: Les équipes de domaine peuvent publier et maintenir leurs produits de données à leur propre rythme, sans dépendre d’une équipe centrale.
  • Adaptation au métier: Les produits de données sont conçus par les experts du métier, ce qui garantit qu’ils répondent à des besoins réels et sont sémantiquement corrects.

articulation: le meilleur des deux mondes

La clé est de faire de la Fabric la “vitrine” des produits de données publiés par les domaines du Mesh.

  • Les domaines sont responsables de leurs produits de données “gold” et les exposent via des contrats de données clairs.
  • La Fabric agit comme une couche d’accès commune qui indexe ces produits, applique la gouvernance et offre des services (observabilité, lineage).
  • Un comité léger arbitre les standards et les dépendances entre les domaines.
  • Chaque produit de données intègre ses propres tests de qualité, dont les résultats sont exposés par la Fabric.

exemple d’architecture combinée

consommateurs

couche d'accès (fabric)

domaines (mesh)

publie

publie

est indexé dans

est indexé dans

sert

sert

domaine ventes

produit: `ventes.orders_v`

domaine marketing

produit: `marketing.campaigns_v`

catalogue & accès unifié

business intelligence

machine learning

erreurs courantes

  • Symptôme: Les dashboards sont lents car tout est virtualisé.

    • Cause: Abus de la virtualisation de la Fabric.
    • Correctif: Matérialiser les produits de données “gold” les plus critiques. La virtualisation doit rester une exception pour l’exploration rapide.
  • Symptôme: Personne ne se sent responsable de la qualité des données exposées.

    • Cause: Une Fabric sans Mesh, c’est-à-dire une couche technique sans ownership clair.
    • Correctif: Imposer le principe de base du Mesh : pas de produit de données sans un propriétaire de domaine identifié.
  • Symptôme: Les équipes créent des copies de données car la Fabric est trop lente ou rigide.

    • Cause: Une Fabric qui devient un goulot d’étranglement.
    • Correctif: La Fabric doit être une plateforme en self-service. Les domaines doivent pouvoir y publier leurs contrats de données de manière autonome.
  • Symptôme: On découvre des problèmes de fraîcheur des jours plus tard.

    • Cause: Une Fabric sans observabilité.
    • Correctif: La Fabric doit exposer des métriques de santé pour chaque produit de données qu’elle sert (fraîcheur, volume, résultats des tests de qualité).

faq

  • Par quoi commencer, la Fabric ou le Mesh ? Commencez par le Mesh. La première étape est organisationnelle : identifiez vos domaines, nommez des propriétaires et demandez-leur de publier un ou deux produits de données critiques. La Fabric vient ensuite comme une solution pour unifier et gouverner ces produits à mesure que leur nombre augmente.

  • Un Data Fabric est-il un produit unique que l’on achète ? Non, c’est une architecture. Elle est généralement composée d’un assemblage d’outils : un catalogue de données (ex: DataHub, Amundsen), un moteur de requêtes fédérées (ex: Trino, Dremio) et des outils d’observabilité.