« 4× plus rapide » : on a testé la nouvelle IA de Google sur une machine locale — et la promesse s’inverse

Une annonce a circulé : Google publie une IA capable de générer du texte « jusqu’à 4× plus vite » grâce à une technique nouvelle, la diffusion. Séduisant — et exactement le genre de promesse qu’on préfère mesurer plutôt que relayer. Nous l’avons donc fait tourner sur un ordinateur de bureau, face à une IA classique de taille identique. Le résultat est l’inverse exact du slogan, et ce qu’il révèle est plus utile qu’un benchmark.

La promesse : une IA qui écrit « en bloc »

Les IA de texte habituelles écrivent comme une machine à écrire : un mot après l’autre, de gauche à droite, chaque mot attendant le précédent. C’est ce qui les rend parfois lentes. La nouvelle approche de Google, dite « par diffusion », fonctionne autrement : elle part d’un brouillon flou et le raffine d’un coup, par blocs entiers — la même idée que les générateurs d’images qui font émerger une photo nette d’un nuage de pixels.

Sur le papier, le gain est spectaculaire. Google annonce « jusqu’à 4× plus rapide », et plus de 1000 fragments de texte par seconde. Mais une ligne, en petit, change tout : ces chiffres sont obtenus sur des cartes graphiques de centre de données, des machines à plusieurs dizaines de milliers d’euros. La vraie question, pour qui veut une IA chez soi, est ailleurs : que vaut cette promesse sur une machine ordinaire ?

Le test : même ordinateur, même question, deux IA

Le modèle étant publié en libre accès, nous l’avons installé sur un petit ordinateur de bureau — une machine que l’on possède, sans rien envoyer dans le cloud. Puis nous lui avons posé une question simple, et nous avons posé exactement la même à une IA « classique » de taille rigoureusement identique, sur la même machine. Même matériel, même question, même mesure : seule la technique de génération changeait.

Note d’honnêteté : c’est un banc d’essai, pas une étude de laboratoire. Le modèle de Google est lui-même expérimental, et sa qualité de réponse est, de l’aveu de Google, en deçà de ses modèles habituels. On mesure ici une chose précise — la vitesse réelle en local — et on en tire une direction, pas une loi.

Le résultat : 4× plus lente, pas plus rapide

L’IA « 4× plus rapide » a produit son texte à environ 14 fragments par seconde. L’IA classique, sur la même machine, à environ 60 — soit plus de quatre fois plus vite, pour une qualité au moins équivalente. La promesse ne s’est pas seulement dégonflée : elle s’est retournée. Sur un ordinateur de bureau, la « révolution » était le choix le plus lent.

Le détail qui compte : ce n’est pas que le modèle de Google soit mauvais. C’est que tout son avantage repose sur une condition qui n’existe pas chez vous.

Pourquoi : la vitesse était dans le matériel, pas dans l’IA

La diffusion ne va vite que si la machine peut traiter des centaines de fragments de texte d’un seul coup, en parallèle. C’est précisément ce que font les cartes de centre de données : des milliers de petits calculs simultanés. Un ordinateur de bureau, lui, n’a pas cette puissance brute — il déroule les étapes plus en série, et l’avantage de la diffusion se transforme en handicap. Pendant ce temps, l’IA classique, parfaitement optimisée pour les puces grand public, garde l’avantage.

Autrement dit, la performance annoncée n’était pas une propriété de l’IA. C’était une propriété du matériel sur lequel on la fait tourner. Déplacez le modèle hors du centre de données, et le chiffre s’effondre. C’est une distinction que le marketing efface, et qui change tout pour une décision d’entreprise.

Ce que ça change pour vous

La leçon dépasse ce modèle précis. Un chiffre de performance ne veut rien dire sans la machine qui va avec. « 4× plus rapide » sur un serveur loué peut signifier « 4× plus lent » sur la vôtre — et la seule façon de le savoir, c’est de mesurer là où l’IA tournera vraiment : chez vous, sur vos tâches, sur votre matériel.

C’est exactement la logique d’AQUIFÈRE. Une IA souveraine n’est pas celle qui affiche les plus gros chiffres dans une annonce ; c’est celle qui tourne bien sur du matériel qui vous appartient, avec vos données qui ne sortent jamais. Et plutôt que de vous vendre un slogan, on vous donne la carte honnête : ce qui est rapide chez vous, ce qui ne l’est pas, et pourquoi — preuve à l’appui.

La vraie souveraineté commence là : non pas croire la promesse, mais pouvoir la vérifier sur sa propre machine. Le reste n’est que communication.

Quelle IA tourne vraiment vite chez vous ?

On en parle 30 minutes : quels modèles d’IA sont réellement performants sur votre matériel, mesurés sur vos tâches, et comment AQUIFÈRE pose une IA souveraine dont vous vérifiez vous-même les promesses.

Découvrir AQUIFÈRE →