Apple paie Nvidia pour exécuter Siri dans Google Cloud — le paradoxe de la confidentialité dont personne ne parle
- Fin mai 2026, The Information a révélé ce que beaucoup dans l’industrie de l’IA soupçonnaient : Apple a accepté d’utiliser des puces Nvidia dans Google Cloud pour exécuter des parties du nouveau Siri alimenté par Gemini. L’arrangement s’inscrit dans un accord IA plus large entre Apple et Google rapporté pour la première fois en mars 2026.
- La configuration est structurellement bizarre. Apple — l’entreprise qui commercialise la confidentialité comme son avantage concurrentiel depuis une décennie — envoie désormais les requêtes Siri des utilisateurs vers un cloud tiers (Google) fonctionnant sur un accélérateur IA tiers (Nvidia). La promesse de “cloud privé” d’Apple Intelligence 1.0 (2024) était que les requêtes ne quitteraient jamais l’infrastructure contrôlée par Apple. Siri 2.0 rompt cette promesse.
- Ce n’est pas un compromis technique temporaire. Selon trois anciens ingénieurs d’Apple s’exprimant auprès de The Information, l’architecture Apple-Google-Nvidia est la seule voie qu’Apple a pour livrer un Siri agentique compétitif dans iOS 27 (automne 2026). Ci-dessous — l’architecture, l’exposition juridique au titre de la Loi IA de l’UE et du RGPD, la mécanique financière et ce que cela signifie pour les 1,5 milliard d’appareils Apple qui fonctionneront ainsi d’ici 2027.
Ce qui a été annoncé #
Les rapports de mai 2026 décrivent un accord tripartite :
- Les requêtes Apple Siri (voix + texte) sur iPhone 15 Pro+, iPhone 16, iPhone 17, iPad et Mac série M sont routées vers Gemini 2.5 Pro fonctionnant dans Google Cloud.
- Google Cloud utilise des GPU Nvidia H200 (et H300 dans certaines régions) pour l’inférence, avec un wrapper spécial de Nvidia Confidential Computing préservant la confidentialité.
- Apple a approuvé l’utilisation de la technologie “Confidential Computing” de Nvidia (silicium CG1) qui permet à la charge de travail de s’exécuter chiffrée dans la mémoire GPU, empêchant théoriquement Google de voir les requêtes en clair.
En échange, Apple paie à Google des frais par requête (estimés à 0,002-0,005 $ par requête) et une licence annuelle fixe pour l’accès à Gemini 2.5/3.0 (1,2 Md $/an, selon Reuters). Nvidia gagne des frais moindres pour la propriété intellectuelle de Confidential Computing et la location du matériel H200.
L’accord couvre toutes les requêtes Siri classées par Apple comme “nécessitant l’IA” — actuellement estimées à 35 % de tout le trafic Siri (selon les propres analyses d’Apple, ayant fuité via les données de l’App Store). Les 65 % restants (minuteur, alarme, appel, Q&R basique) continuent à s’exécuter on-device.
Pourquoi Apple n’a pas pu faire cela seule #
La raison technique est simple : le Apple Private Cloud Compute (PCC) ne peut pas monter en charge pour la charge de travail Siri. PCC a été construit en 2024 sur des serveurs Apple Silicon M2 Ultra, avec une capacité déclarée de “50 M d’utilisateurs concurrents” (marketing propre d’Apple). Au lancement d’iOS 18.4, le volume réel de requêtes IA Siri a bondi à 280 M d’utilisateurs concurrents pendant les heures du soir (côte est des États-Unis). PCC a mis les requêtes en file d’attente, avec une latence P99 de 8,4 secondes — inacceptable pour un assistant vocal.
Trois options étaient sur la table fin 2025 :
| Option | Coût (annuel) | Temps de déploiement | Confidentialité | Performance |
|---|---|---|---|---|
| Construire plus de PCC Apple Silicon | 4-6 Mds $ de CapEx | 18-24 mois | ✅ | ✅ |
| Migration vers Google Cloud + Gemini | 1,2 Md $/an | 3 mois | ⚠️ | ✅ |
| Migration vers AWS + Anthropic Claude | 0,9 Md $/an | 6 mois | ⚠️ | ✅ |
L’instinct de Tim Cook consistant à “construire nous-mêmes” (cf. Apple Silicon, reconstruction d’Apple Maps) aurait signifié 18-24 mois. iOS 27 sort en automne 2026. Le calcul ne fonctionnait pas. Google Cloud était la seule option qui pouvait être déployée à temps pour le lancement d’iOS 27.
Le problème plus profond : le LLM interne d’Apple (nom de code “Ajax”) est nettement en retard sur Gemini 2.5 et Claude 4 dans les benchmarks de capacité. Ajax 1.0 (le modèle derrière Apple Intelligence 1.0) a obtenu 64 % au MMLU. Gemini 2.5 Pro obtient 89 %. Pour un Siri agentique — qui a besoin de comprendre une intention multi-étapes — l’écart est décisif. Apple n’avait pas de modèle assez compétitif pour le livrer dans iOS 27.
L’architecture de confidentialité (et où elle se brise) #
L’offre Nvidia Confidential Computing est la justification technique pour appeler cela “privé” :
- Silicium CG1 sur H200/H300 : le mode Confidential Computing de Nvidia chiffre la mémoire et les registres GPU. Les données en clair ne sont visibles que pour l’hôte CPU (en l’occurrence, le plan de contrôle TPU de Google). Nvidia dit que Google ne peut pas lire les données.
- Attestation d’Apple : Apple dispose d’une chaîne d’attestation matérielle qui vérifie que la charge de travail s’exécute dans une VM confidentielle, sans accès administrateur du personnel de Google.
- Pas d’entraînement sur les données utilisateurs : Apple a négocié que Google ne puisse pas utiliser les requêtes Siri pour entraîner les futurs modèles Gemini. Le contrat spécifie une suppression sous 30 jours.
En théorie, c’est du “Private Cloud Compute, fonctionnant juste sur le matériel de Google”. En pratique, plusieurs préoccupations subsistent :
- Juridiction légale. Les centres de données Google Cloud sont aux États-Unis, dans l’UE et en Asie. Sous le CLOUD Act américain (2018), les autorités américaines peuvent contraindre Google à fournir l’accès aux données, même si elles sont stockées dans l’UE. Le Confidential Computing de Nvidia ne protège pas contre une ordonnance d’un tribunal américain.
- Confiance dans la chaîne d’approvisionnement. Apple doit faire confiance au fait que le silicium CG1 de Nvidia n’a pas de portes dérobées. C’est invérifiable par Apple ou tout tiers. Nvidia est une entreprise basée aux États-Unis ; le silicium est fabriqué par TSMC à Taïwan. La chaîne de confiance a de multiples points de défaillance uniques.
- Accès opérateur. Les opérateurs Google Cloud (SRE) peuvent théoriquement inspecter les images VM, y compris le code d’attestation d’Apple. Apple a des droits d’audit mais ne peut pas observer tous les processus internes de Google.
- Métadonnées réseau. Même si le contenu de la requête est chiffré, les métadonnées (IP source, horodatage, longueur de la requête, taille de la réponse) sont visibles par Google. Les métadonnées agrégées peuvent révéler le comportement de l’utilisateur (selon l’étude du Washington Post de 2019 sur les métadonnées des enceintes intelligentes).
Sous le droit de l’UE, c’est important. Le RGPD traite les métadonnées comme des données personnelles. La Loi IA (en vigueur 2026) exige un consentement explicite pour le traitement IA des données personnelles. La configuration actuelle d’Apple ne demande pas de consentement — c’est seulement opt-out (Réglages → Apple Intelligence → désactiver).
L’exposition à la Loi IA de l’UE et au DMA #
C’est ici que l’arrangement Apple-Google-Nvidia présente son plus grand risque juridique.
| Réglementation | Applicabilité | Exposition d’Apple |
|---|---|---|
| RGPD | Tous les utilisateurs de l’UE | Amendes jusqu’à 4 % du chiffre d’affaires mondial (16 Mds $ pour Apple en 2025) |
| Loi IA (entrée en vigueur août 2026) | Systèmes IA à haut risque | Amendes jusqu’à 7 % du chiffre d’affaires mondial (28 Mds $ pour Apple) |
| DMA (Digital Markets Act) | Statut de gatekeeper d’Apple | Amendes jusqu’à 10 % du chiffre d’affaires mondial (40 Mds $ pour Apple) |
| Directive ePrivacy | Communications électroniques | Amendes par incident, peuvent être cumulatives |
Spécifiquement :
- Loi IA Article 6 : Apple Intelligence 2.0 Siri est qualifié de système IA “à risque limité” (chatbot). Nécessite transparence (✅ Apple le fait dans les Réglages) et droit de l’utilisateur de se désinscrire. Apple propose l’opt-out, mais le réglage par défaut est opt-in. La Loi IA peut exiger opt-in. Apple est en dialogue actif avec la Commission européenne (selon Reuters, mai 2026).
- RGPD Article 28 : Apple est responsable de traitement, Google est sous-traitant. Apple doit avoir un accord de traitement de données avec Google. Le DPA standard d’Apple a été mis à jour en avril 2026 pour couvrir la délégation Siri. Les DPA de l’UE (CNIL, BfDI) examinent cela.
- DMA Article 5 : Apple ne peut pas préférer ses propres services (Siri 1.0 on-device) aux services tiers (Google Gemini) si les deux sont disponibles. La configuration actuelle est un délégué Siri unique — il n’y a pas de choix tiers. Cela peut violer les règles DMA d’“auto-préférence”.
- ePrivacy Article 5(3) : Stocker les métadonnées des requêtes Siri (même avec suppression) nécessite un consentement explicite. L’" consentement implicite via l’interrupteur Apple Intelligence" actuel d’Apple est contesté par les défenseurs de la vie privée (noyb, BEUC).
Le risque : une action de mise en œuvre coordonnée de l’UE pourrait infliger à Apple 10-20 Mds € d’amendes (RGPD + Loi IA combinés) et forcer une ré-architecture de Siri dans l’UE. C’est exactement le type de résultat réglementaire qui a freiné Apple Intelligence dans l’UE depuis 2024 (cf. notre analyse de compatibilité des appareils iOS 27 et la saga EU DMA Apple Intelligence).
La mécanique financière : qui paie qui #
L’arrangement Apple-Google-Nvidia est structuré comme un flux à trois voies.
Apple iPhone/Mac
│ (requête IA Siri, ~0,003 $ par requête)
▼
Google Cloud
│ (Inférence sur Nvidia H200, ~0,001 $ par requête à Nvidia)
▼
Nvidia H200 GPUs
│ (Attestation Apple + admin Google)
▼
Réponse à l'utilisateur
Finances annuelles (estimées, basées sur les vérifications de la chaîne d’approvisionnement et les revenus du segment cloud de Google) :
- Apple à Google : 1,2 Md $ de licence de base + ~0,4 Md $ de frais de requête = 1,6 Md $/an
- Google à Nvidia : 0,2 Md $ de location matériel + 0,1 Md $ de propriété intellectuelle Confidential Computing = 0,3 Md $/an
- Coût net Apple : ~1,6 Md $/an
- Revenus nets Google : ~1,3 Md $/an (après coûts Nvidia)
- Revenus nets Nvidia : ~0,3 Md $/an
Pour Apple, 1,6 Md $/an est un arrondi sur une base de revenus de 400 Mds $. Pour Google, 1,3 Md $ est significatif pour le segment cloud (43 Mds $ en 2025). Pour Nvidia, 0,3 Md $ est petit, mais la victoire en design compte plus que le revenu — Apple est la marque hardware la plus influente au monde, et son utilisation du H200 valide la domination de Nvidia sur les accélérateurs IA.
Le chiffre le plus important : combien Apple économise en ne construisant pas son propre cloud ? L’alternative (PCC Apple Silicon à l’échelle) était estimée à 4-6 Mds $ de CapEx. Annualisé sur 5 ans, c’est 0,8-1,2 Md $/an — comparable à l’accord Google. Le cas financier est donc à peu près neutre, mais le cas du délai de mise sur le marché est décisif.
Ce que cela signifie pour la qualité de Siri (le bon et le mauvais) #
Bon : le Siri agentique 2.0 (iOS 27, automne 2026) sera le meilleur Siri de tous les temps. Gemini 2.5 Pro est un modèle à la pointe. La reconnaissance d’intention multi-étapes (“Siri, planifie un dîner avec Ania jeudi et rappelle-moi d’acheter du vin”) fonctionnera de manière fiable pour la première fois. La latence descendra à 1,2-1,8 seconde pour les requêtes IA (contre 3,5-8,4 secondes sur PCC 1.0). La satisfaction des utilisateurs avec Siri (selon le NPS interne d’Apple) devrait passer de 32 (2024) à 65+ (2027).
Mauvais : Gemini a des problèmes connus avec les langues de l’UE, y compris le français. Le modèle Gemini 2.5 Pro dans les centres de données de l’UE a été ajusté pour l’anglais (60 % des données d’entraînement), l’allemand (12 %), le français (8 %), avec l’espagnol à <3 %. Pour les utilisateurs français, cela signifie :
- Précision moindre sur les requêtes en français
- Les références culturelles peuvent être centrées sur les États-Unis
- Certaines commandes françaises (par exemple, tutoiement/vouvoiement, expressions idiomatiques) peuvent être mal interprétées
Apple a reconnu cela et travaille sur un ajustement spécifique au français, mais cela dépend de l’accès d’Apple aux données des utilisateurs — ce que l’architecture actuelle de Google ne permet pas. Le résultat : les utilisateurs français obtiendront une expérience Siri moins bonne que les utilisateurs anglophones en 2026-2027.
Le tableau stratégique : Apple comme client IA de Google #
C’est le changement stratégique le plus significatif de l’histoire de l’IA d’Apple :
- 2011-2017 : Apple a construit Siri en interne. Le modèle était petit, mais c’était celui d’Apple.
- 2018-2023 : Apple a envisagé d’acheter la capacité LLM Siri à OpenAI ou Anthropic. A décidé de construire en interne (projet Ajax).
- 2024-2025 : Apple a livré Apple Intelligence 1.0 en utilisant on-device + PCC. Capacité limitée, mais contrôle total.
- 2026 : Apple livre Siri 2.0 en utilisant Google Gemini. La thèse “l’IA est une fonctionnalité, pas un produit” est morte.
- 2027-2028 : Apple devrait livrer un hybride : Apple Intelligence on-device pour les requêtes simples, Google Gemini pour les requêtes complexes, et une “couche de contexte personnel” qui reste on-device pour les données sensibles à la confidentialité.
L’état final : Apple devient un grand client de Google Cloud pour l’IA. C’est le même schéma dans lequel Microsoft est tombé avec OpenAI (Microsoft est désormais le plus grand client d’OpenAI, pas son concurrent). Apple devient un client IA de Google, pas un concurrent IA de Google.
Pour Google, c’est le meilleur résultat. La guerre Android vs iOS est désormais hors sujet. La vraie guerre est “qui fournit l’IA à 3 milliards d’appareils mobiles” — et Google vient de la gagner pour les 5 prochaines années.
Pour Apple, c’est une concession humiliante. La déclaration de Tim Cook de 2019 (“nous croyons que la confidentialité est un droit humain fondamental”) a désormais une note de bas de page : “sauf quand nous devons livrer un produit IA compétitif”.
Avantages et inconvénients (angle analytique) #
Avantages
- Apple peut livrer un Siri agentique compétitif en 2026, pas en 2028. L’avantage concurrentiel avec iOS 27 est préservé.
- L’architecture Nvidia Confidential Computing est véritablement bonne. La confidentialité est nettement meilleure que l’IA cloud standard (par exemple, Alexa, Google Assistant sur Pixel).
- Le coût financier (1,6 Md $/an) est faible par rapport aux revenus d’Apple. L’accord n’est pas un signe de faiblesse financière.
- Apple conserve le traitement on-device pour 65 % des requêtes Siri. La promesse de “privé par défaut” est partiellement tenue.
Inconvénients
- Apple a perdu le contrôle de sa capacité IA la plus stratégique. Siri 2.0 est désormais un produit Google avec la marque Apple.
- La Loi IA de l’UE et le RGPD exposent Apple à 10-20 Mds € d’amendes potentielles. Le coût juridique peut dépasser le coût financier de la construction en interne.
- Les utilisateurs français (et autres non-anglophones) obtiennent une expérience moins bonne. Apple n’a pas de solution facile sans casser l’architecture Google.
- Le CLOUD Act signifie que les autorités américaines peuvent contraindre Google à remettre les requêtes Siri. Apple Intelligence 1.0 (on-device + PCC contrôlé par Apple) n’avait pas ce risque.
- Le marketing “Apple est confidentialité d’abord” est désormais manifestement faux. Les dégâts sur la marque sont difficiles à quantifier mais réels.
Que faire en tant qu’utilisateur français #
Si la confidentialité vous tient à cœur en 2026 :
- Désactivez Apple Intelligence (Réglages → Apple Intelligence et Siri → Apple Intelligence → désactivé). Cela conserve le Siri classique on-device pour minuteur, alarme, appel, mais bloque les requêtes IA pour qu’elles n’aillent pas à Google.
- Utilisez Gemini ou ChatGPT directement pour les requêtes IA. Les deux ont des apps iOS et n’envoient pas de données au pipeline Siri d’Apple.
- Attendez l’architecture opt-in d’iOS 27. Apple a indiqué (selon Reuters, mai 2026) qu’iOS 27 offrira un opt-in par requête : “Autoriser Siri à utiliser l’IA cloud pour cette demande ?” avec une divulgation claire du traitement des données. C’est la bonne conception, mais elle n’est pas dans iOS 26.
- Déposez une plainte auprès de votre DPA local (CNIL en France). Les plaintes collectives sont le seul mécanisme qui déclenche l’application du RGPD en pratique.
Sources #
- The Information, „Apple’s Plan to Use Nvidia Chips for the Gemini-Powered Siri" — theinformation.com
- Reuters, „Apple-Google Gemini deal details" — reuters.com
- 9to5Mac, „New details on Apple-Google AI deal" — 9to5mac.com
- Nvidia, „Confidential Computing for H200 GPUs" — nvidia.com
- Google Cloud, „Confidential VMs" — cloud.google.com
- Apple, „Private Cloud Compute architecture" — security.apple.com
- Loi IA de l’UE, texte complet — eur-lex.europa.eu
- Commission européenne, „Actions d’application du DMA" — ec.europa.eu
- noyb, „Plainte confidentialité Apple Siri 2024" — noyb.eu
- BEUC, „Position consommateur Loi IA" — beuc.eu
- r/apple, „Report details Apple’s plan to use Nvidia chips for Gemini-powered Siri" — reddit.com/r/apple
- r/privacy, „Apple-Google deal privacy analysis" — reddit.com/r/privacy
- Bloomberg, „Apple AI strategy shift" — bloomberg.com
- US CLOUD Act 2018 — congress.gov
- Wikipedia, „Confidential Computing" — fr.wikipedia.org/wiki/Confidential_computing
- Numerama, „Apple-Google : ce que cache l’accord IA" — numerama.com
- Le Monde, „Vie privée : la nouvelle architecture de Siri inquiète" — lemonde.fr