Longtemps présentée comme un accélérateur de productivité, l’IA générative révèle désormais son autre visage : celui d’une infrastructure coûteuse, consommatrice de données, d’énergie et de puissance de calcul. Car derrière chaque requête, chaque résumé, chaque agent autonome, une unité s’impose comme le nouveau compteur invisible de l’entreprise, à savoir le token.
Après deux ans d’expérimentations souvent enthousiastes, parfois désordonnées, les entreprises entrent dans une phase beaucoup moins confortable de leur relation avec l’IA générative. Celle du compteur.
Compteur budgétaire, d’abord, avec des coûts qui ne se limitent plus à quelques licences mensuelles. Compteur technique, ensuite, avec des millions de tokens consommés par les prompts, les documents, les historiques de conversation, les connecteurs métiers et les agents IA. Compteur énergétique, également, avec des infrastructures de calcul de plus en plus puissantes et des datacenters sous tension. Compteur réglementaire, enfin, avec l’AI Act, le RGPD, la cybersécurité, la propriété intellectuelle et les exigences de traçabilité.
L’IA n’est plus une expérimentation sympathique menée par quelques équipes curieuses. Elle devient une brique du système d’information. Et comme toute brique critique, elle doit être pilotée.
Le paradoxe est là. Beaucoup d’entreprises veulent industrialiser l’IA, mais peu disposent encore d’une gouvernance solide pour savoir qui l’utilise, dans quel but, avec quelles données, sur quel modèle, à quel coût, avec quel résultat et avec quel niveau de risque. Il est aujourd’hui question de contrôle, de preuve, de sécurité et de responsabilité.
Le token, nouveau compteur invisible de l’entreprise
Pour comprendre le coût réel de l’IA, il faut commencer par expliquer ce qu’est un token.
Il s’agit d’une unité de traitement utilisée par les modèles d’IA pour lire, comprendre et générer du texte. Ce n’est pas exactement un mot, ni une phrase, mais une portion de texte. À chaque fois qu’un collaborateur interroge un modèle, l’IA consomme des tokens pour analyser la demande, lire les documents transmis, tenir compte du contexte et produire une réponse.
Cette consommation reste invisible pour la plupart des utilisateurs. Quand un salarié demande à une IA de résumer un contrat, de comparer trois documents, de produire une note ou de rédiger une réponse commerciale, il ne voit pas ce que l’opération consomme réellement. Pourtant, plus le prompt est long, plus les pièces jointes sont nombreuses, plus l’historique est conservé, plus la réponse attendue est détaillée, plus le nombre de tokens augmente.
Avec les agents IA, le phénomène s’amplifie encore. Un agent ne se contente pas de répondre à une question. Il peut découper une tâche en étapes, interroger plusieurs sources, appeler des outils, relancer des requêtes, vérifier des résultats, produire des versions intermédiaires. Autrement dit, un seul ordre humain peut déclencher une chaîne de consommations successives. Ce qui semblait être une simple demande devient une opération informatique distribuée.
Bon nombre d’entreprise raisonnent encore comme si l’IA était un logiciel classique. Or l’IA générative ressemble davantage à une infrastructure de consommation. Elle se rapproche du cloud, où la facture dépend des ressources réellement mobilisées. Elle se rapproche aussi de l’électricité, où chaque geste paraît négligeable, jusqu’au moment où les volumes deviennent industriels.
Demain, les directions financières ne regarderont plus seulement le nombre de licences IA déployées. Elles devront regarder la consommation par direction, par métier, par cas d’usage, par modèle et par niveau de criticité.
Le vrai coût de l’IA ne se limite pas à la facture fournisseur
Mais la gouvernance de l’IA ne se résume pas à un simple sujet de maîtrise budgétaire. Le coût réel de l’IA est beaucoup plus large.
Il y a bien sûr le coût direct (abonnements, appels API, modèles premium, plateformes, connecteurs, stockage, intégration, supervision…), mais il y a aussi les coûts indirects (formation des collaborateurs, sécurisation des usages, contrôle des données envoyées aux modèles, documentation des traitements, gestion des droits, audit des fournisseurs, adaptation des politiques internes, temps passé à corriger des réponses médiocres ou à vérifier des hallucinations…).
Il y a surtout le coût du mauvais usage. Une IA utilisée sans cadre peut produire plus vite, mais produire faux. Elle peut accélérer une analyse, mais à partir de données non vérifiées. Elle peut aider un collaborateur, mais exposer un secret d’affaires. Elle peut automatiser une décision, mais sans traçabilité suffisante. Elle peut donner une impression de productivité tout en déplaçant le risque vers le juridique, la conformité ou la cybersécurité.
C’est tout le sujet du retour sur investissement. Une entreprise sérieuse doit être capable de répondre à cette question : la consommation d’IA augmente-t-elle plus vite ou moins vite que la valeur réellement créée ?
La réponse doit être mesurée. Pour un service juridique, cela peut signifier le nombre de contrats préanalysés avec un niveau de qualité vérifié. Pour un service client, le taux de résolution amélioré sans dégradation de l’expérience. Pour une DSI, le temps gagné sur certaines tâches de développement ou de documentation, mais aussi le nombre d’erreurs évitées. Pour une direction commerciale, la capacité à préparer davantage de rendez-vous utiles, pas seulement à générer davantage de textes.
L’IA peut rapporter plus qu’elle ne coûte, mais seulement si l’entreprise sait distinguer les usages créateurs de valeur des usages gadgets, redondants ou dangereux.
L’impact énergétique, grand impensé de l’IA générative
Un autre coût reste encore largement mis sous le tapis : le coût énergétique.
L’IA donne une illusion d’immatérialité. Un prompt semble léger. Une réponse apparaît en quelques secondes. Un résumé de document paraît presque gratuit. Mais derrière cette fluidité se trouvent des infrastructures massives (serveurs spécialisés, GPU, réseaux, stockage, refroidissement, alimentation électrique, data centers…).
À l’échelle d’un utilisateur, l’impact d’une requête peut sembler négligeable. À l’échelle d’une grande entreprise, puis d’un marché entier, la logique change. Des millions de requêtes quotidiennes, des modèles de plus en plus puissants, des agents capables d’effectuer plusieurs opérations en cascade et des usages intégrés dans tous les outils de travail transforment l’IA en sujet énergétique.
Ce point est encore rarement intégré dans les politiques IA internes. Les entreprises parlent conformité, sécurité, productivité, parfois coûts. Elles parlent beaucoup moins sobriété. Pourtant, la question va devenir incontournable. D’autant que tous les usages IA ne nécessitent pas le modèle le plus puissant. Toutes les tâches ne justifient pas un contexte de plusieurs dizaines de pages. Toutes les demandes ne méritent pas une génération longue. Toutes les automatisations ne créent pas assez de valeur pour justifier leur consommation.
La gouvernance devra donc intégrer une forme de sobriété opérationnelle. Autrement dit, choisir le bon modèle pour le bon usage, réduire les prompts inutiles, limiter les contextes démesurés, réutiliser ce qui peut l’être, éviter les traitements redondants, mesurer les consommations et arbitrer les cas d’usage selon leur valeur réelle.
Ce n’est pas un discours anti-IA. Au contraire. C’est la condition pour que l’IA soit durablement acceptable, économiquement et environnementalement.
Gouverner l’IA, ce n’est pas freiner l’innovation
Gouverner l’IA ne signifie pas interdire les usages, mais plutôt les rendre maîtrisables. Une bonne gouvernance doit, en effet, permettre d’aller plus vite, mais avec des règles claires. Elle doit dire quels outils sont autorisés, quels usages sont sensibles, quelles données ne doivent jamais être envoyées dans un modèle public, quels traitements doivent être validés, quels résultats doivent rester sous contrôle humain et quels cas d’usage peuvent être industrialisés.
Elle doit aussi organiser une alliance nouvelle entre la DSI, la DAF, le RSSI, le DPO, les métiers et la direction générale. La DSI ne peut pas porter seule le sujet. La DAF doit comprendre que l’IA n’est pas seulement une dépense, mais une ressource productive à piloter. Le RSSI doit encadrer les risques de fuite de données, de compromission, de shadow AI ou d’usage non maîtrisé d’outils externes. Le DPO doit veiller à la conformité des traitements. Les métiers doivent documenter la valeur attendue. La direction générale doit arbitrer les priorités.
C’est dans ce contexte qu’émergera probablement une nouvelle compétence, à mi-chemin entre FinOps, data governance et pilotage de la performance IA. Certains parlent déjà de “Token Manager”. Le terme peut faire sourire, mais l’idée est sérieuse. Car il faudra des profils capables de comprendre à la fois les coûts, les modèles, les usages, les risques, les métriques de valeur et les arbitrages opérationnels.
L’IA non gouvernée devient une dette invisible
Le vrai risque, pour les entreprises, est d’utiliser l’IA sans compteur, sans cadre et sans preuve.
Une IA non gouvernée peut, en effet, créer une dette budgétaire, parce que les consommations explosent sans lien clair avec la valeur. Elle peut créer une dette cyber, parce que les collaborateurs utilisent des outils non validés ou exposent des informations sensibles. Elle peut créer une dette réglementaire, parce que les usages ne sont ni cartographiés ni documentés. Elle peut créer une dette environnementale, parce que la consommation énergétique reste absente des arbitrages. Elle peut enfin créer une dette managériale, parce que l’entreprise croit gagner en productivité sans vérifier la qualité réelle de ce qui est produit.
C’est pourquoi la gouvernance de l’IA devient impérieuse.
L’IA entre dans l’âge adulte et devra désormais accepter ce que toutes les infrastructures critiques acceptent, à savoir des règles, des mesures, des contrôles, des arbitrages et une responsabilité partagée.
