Et non, ce n'est pas le modèle. C'est votre data.
Il y a quelque chose d’étrange dans la façon dont les entreprises parlent de leur transformation IA aujourd’hui.
Elles parlent de modèles. De prompts. D’agents. De RAG, de fine-tuning, de gouvernance des LLMs. Elles investissent dans des licences Copilot, des plateformes d’orchestration, des PoC qui s’enchaînent à un rythme presque frénétique.
Ce qu’elles n’ont pas encore vraiment regardé en face, c’est ce que l’IA va trouver quand elle va aller chercher de l’information dans leurs systèmes.
Et là, ça se complique sérieusement.
L'illusion du modèle tout-puissant
On a tendance à penser que l’intelligence artificielle va compenser les lacunes de nos organisations. Qu’un bon modèle, bien prompté, va « s’en sortir » malgré un environnement imparfait.
C’est faux. Et dangereusement faux.
Un LLM ne génère pas de la connaissance. Il synthétise, structure, et restitue ce qu’on lui donne. Si ce qu’on lui donne est fragmenté, incohérent ou contradictoire — il va halluciner. Pas parce qu’il est mauvais. Parce qu’il n’a pas le choix.
Voici un cas concret, que vous reconnaîtrez immédiatement.
Le client qui existe en cinq exemplaires
Prenons une entité aussi banale que fondamentale : le client.
Dans la plupart des organisations que j’accompagne, ce client existe — simultanément — dans :
- Salesforce (CRM commercial, avec ses propres règles de dédoublonnage)
- Le back-office métier (ERP, facturation, contrats — souvent le plus « vrai » juridiquement)
- Le front-office (portail client, app mobile — avec des données saisies parfois en libre-service)
- SharePoint ou un intranet (notes de réunion, historiques de relation, comptes-rendus)
- Les outils marketing (HubSpot, Mailchimp, Brevo — avec des segments, des scores, des doublons assumés)
Cinq systèmes. Cinq versions d’un même client. Cinq noms légèrement différents, cinq adresses qui ne se correspondent pas toujours, cinq statuts de relation qui racontent des histoires divergentes.
Maintenant, vous demandez à votre agent IA de répondre à la question : « Quel est l’historique de notre relation avec ce client, et quelle est la meilleure action commerciale à mener ? »
L’IA va répondre. Elle va même répondre de façon fluide et confiante. Mais elle va synthétiser cinq réalités partielles qui ne se recoupent pas. Elle va inventer des cohérences qui n’existent pas. Elle va, en d’autres termes, halluciner — non pas par caprice, mais parce que vous lui avez donné de la boue et attendu de l’or.
Ce n'est pas un problème de modèle. C'est un problème de fondations.
Eric Weber, dans son analyse sur la transformation IA des organisations data, identifie deux moitiés distinctes : la transformation technique (les outils, les modèles, les workflows) et la transformation opérationnelle (les rôles, les processus, la façon dont les équipes fonctionnent).
Je veux ajouter une troisième dimension que ni l’une ni l’autre ne couvre suffisamment : la transformation de la donnée elle-même.
Parce que ce n’est pas qu’un enjeu d’opérations. C’est un enjeu structurel. Vos modèles IA sont aussi bons que la donnée qu’ils consomment. Et si cette donnée est fragmentée entre des dizaines de silos applicatifs hérités de dix ans de stack empilée couche par couche, vous ne faites qu’industrialiser votre désordre.
L’investissement technique se capitalise pendant six mois, puis il plafonne — non pas parce que l’IA est mauvaise, mais parce que l’organisation n’a pas été redessinée autour de la nouvelle forme du travail. La donnée, c’est exactement pareil : le modèle plafonne quand les fondations data ne suivent pas.
Les trois angles morts que personne ne regarde
1. La gouvernance des référentiels
Qui est responsable de la définition « officielle » d’un client dans votre organisation ? D’un produit ? D’un contrat ? Dans la plupart des cas, la réponse honnête est : personne, vraiment. Chaque application gère sa vérité. L’IA va devoir choisir entre ces vérités — et elle choisira mal, ou au hasard.
2. La qualité des données dans les systèmes non structurés
Les LLMs adorent les documents, les emails, les notes de réunion. Ils sont aussi très capables de confondre une note informelle de 2019 avec une décision structurante de 2024. Sans métadonnées claires, sans datation rigoureuse, sans signalement des données périmées, l’IA va traiter l’obsolète comme le vivant.
3. Les données manquantes ou asymétriques
Ce qui n’a jamais été saisi n’existe pas pour l’IA. Si votre équipe commerciale documente ses interactions dans des carnets ou des emails personnels, votre agent IA aura une vision tronquée de la relation client — et personne ne lui dira qu’il manque quelque chose.
Avant de déployer l'IA, posez-vous cette question
« Si un consultant externe arrivait demain avec uniquement accès à mes données, pourrait-il reconstituer une image cohérente de mon business ? »
Si la réponse est non — et elle l’est pour la majorité des organisations — alors votre projet IA est construit sur du sable.
Ce n’est pas une raison de ne pas avancer. C’est une raison de ne pas avancer dans le mauvais ordre.
Ce que ça implique concrètement
La bonne séquence n’est pas : modèle → données → gouvernance. C’est l’inverse.
Étape 1 — Cartographier les entités critiques : client, produit, contrat, collaborateur. Identifier dans combien de systèmes chacune existe, avec quelles variations.
Étape 2 — Définir un référentiel de vérité : pas nécessairement un MDM complet au sens classique, mais au minimum une source d’autorité claire par entité, et des règles de réconciliation explicites.
Étape 3 — Évaluer la qualité réelle : complétude, fraîcheur, cohérence. Pas sur la base de vos intuitions — sur la base de métriques. Ce qu’on ne mesure pas, on ne peut pas améliorer.
Étape 4 — Documenter les données pour l’IA : pas seulement pour les humains. Les descriptions de colonnes, les règles métier, les définitions — tout ça devient du contexte que l’IA peut utiliser pour interpréter correctement ce qu’elle trouve.
Étape 5 — Alors seulement, construire les use cases IA : avec des fondations solides, vos agents ne synthétiseront plus du chaos. Ils produiront de la valeur réelle, auditable, fiable.
La vraie compétitivité, c'est là qu'elle se joue
Les entreprises qui gagneront avec l’IA ne seront pas celles qui auront le meilleur modèle. Elles seront celles dont la donnée sera la plus propre, la plus cohérente, la plus gouvernée.
C’est moins glamour que de parler d’agents autonomes et de co-pilotes intelligents. Mais c’est infiniment plus déterminant.
L’IA ne transforme pas votre organisation. Elle révèle ce qu’elle est vraiment.
Sources : Eric Weber, « We’re Missing Data: The Other Half of AI Transformation », From Data to Product — Substack, mai 2026 : ericdataproduct.substack.com