La France connecte ses données publiques à l’IA : on a fouillé le rayon audiovisuel
L’Etat français vient de lancer un MCP open data accessible à tous les outils IA du marché. On a exploré ce qu’on y trouve coté streaming. Spoiler : on est tombés sur le dossier piratage IPTV de l’Arc
TL;DR
La France lance un MCP (Model Context Protocol) sur data.gouv.fr : toutes les données publiques françaises deviennent interrogeables par n’importe quel outil IA, en accès libre. Chapeau la DINUM, c’est une première mondiale pour un portail open data national
On a cherché “audiovisuel” dedans. 14 datasets, du CNC à l’Arcom. C’est maigre. Mais le dataset ARCOM IPTV 2024 est une pépite : 2 600 répondants, données brutes, interrogeable programmatiquement
Le pirate IPTV français type n’est PAS la GenZ paresseuse qu’on nous vend à longueur de tribune. C’est un actif de 35-49 ans, majoritairement une femme, déjà abonnée Netflix et Canal+, qui achète son boitier à la FNAC. Votre voisin de palier, en fait
13 000 sites bloqués, 1,5 milliard de manque à gagner théorique, et un taux de piratage qui ne bouge pas. Le problème n’est ni technique ni policier. L’offre pirate est tout simplement un meilleur produit
Quelque chose de plutot remarquable vient de se passer dans l’open data français, et personne n’en parle dans le monde du streaming. Ce qui est dommage, parce que c’est exactement le genre de truc qu’on devrait célébrer.
L’Etat français a connecté data.gouv.fr, sa plateforme nationale de données ouvertes, à un serveur MCP (Model Context Protocol). Pour ceux qui ne baignent pas dans l’écosystème IA : le MCP est le standard ouvert lancé par Anthropic fin 2024 qui permet à n’importe quel outil d’intelligence artificielle de se brancher sur des sources de données structurées. Concrètement, vous êtes sur Claude, ChatGPT, ou n’importe quel agent IA compatible, vous activez le connecteur data.gouv, et vous interrogez l’intégralité des données publiques françaises en langage naturel. Chercher des datasets, lire les métadonnées, télécharger et parser les fichiers, filtrer les données. Zéro navigateur, zéro Excel, zéro prise de tete.
Chapeau la DINUM (Direction interministérielle du numérique). Pendant que tout le monde court après les chatbots et les générateurs d’images, eux ont fait le choix silencieux de rendre les données publiques nativement accessibles aux agents IA. C’est de l’infrastructure. C’est pas sexy. Et c’est exactement ce qui change la donne sur le long terme.
Naturellement, ma première question a été : qu’est-ce qu’on trouve en audiovisuel là-dedans ?
Le rayon audiovisuel : 14 datasets et beaucoup de vide
Recherche “audiovisuel” via le MCP. Résultat : 14 datasets. C’est pas la caverne d’Ali Baba.
Le CNC publie des données sur l’exportation de programmes, les dépenses des ménages, la production ciné, la fréquentation et les investissements. Le matériau brut pour comprendre l’économie de la production française est là, meme si faut aller le chercher.
L’Arcom propose les métadonnées de l’offre VOD et SVOD (un vestige de l’époque Hadopi, paix à son ame). Et surtout la pièce maitresse : l’étude complète sur la consommation illicite en IPTV, publiée fin 2024. Pas un PDF résumé pour journalistes pressés. Les données brutes. 2 600 répondants. 600 pirates isolés. Interrogeables.
L’INA publie sa collecte des sites web audiovisuels français, avec un dataset qui démarre en 2009. Mais l’INA cartographie et archive les contenus audiovisuels depuis bien plus longtemps que ça. En 2000, j’ai bossé sur Mediascope, un outil que l’INA utilisait exactement pour cartographier et archiver l’ensemble des contenus audiovisuels. Vingt-six ans plus tard, les données sont sur data.gouv.fr et interrogeables par une IA. Le monde avance (utile pour les historiens du streaming, moins pour l’analyse de marché). Les régions publient des trucs sur les fonds de soutien et les festivals. Et il y a les données Hadopi de la réponse graduée, ces fameux mails d’avertissement que personne n’a jamais pris au sérieux.
Si on cherche “streaming”, “SVOD”, “Netflix” : rien. Nada. Le vocabulaire de data.gouv.fr est encore celui de la télé linéaire et du cinéma. Le mot “streaming” n’existe pas dans l’open data français. Un gap qui en dit long sur le retard conceptuel entre régulateurs et réalité du marché.
Bon, le dataset ARCOM IPTV est là. On a zoomé. Et ce qu’on a trouvé mérite qu’on en parle.
Le pirate IPTV français n’est pas celui qu’on vous vend
L’Arcom a confié à l’Ifop une étude quantitative auprès de 2 600 individus représentatifs des Français de 15 ans et plus. 600 utilisateurs d’IPTV isolés pour analyse fine. Un fichier Excel de 600 lignes et 524 colonnes que j’ai parsé directement via le MCP (sans ouvrir Excel, mes yeux me remercient).
11% des internautes français consomment de l’IPTV illicite. OK. Mais qui sont ces gens ?
Parce que le narratif dominant, on le connait. On nous le sert dans chaque tribune de la SACD, chaque communiqué de la LFP, chaque édito de Télérama : c’est la GenZ. Les jeunes qui ne veulent rien payer. La génération “tout gratuit” qui tue la création. Les digital natives sans morale qui piratent comme ils respirent.
Les données disent le contraire. Et c’est pas moi qui le dis, c’est l’Arcom elle-meme.
Le coeur de cible : 25-49 ans. 51% des utilisateurs. Les 35-49 ans sont LE segment dominant, à 27%. Et les 18-24 ans ? 21,3%. Exactement autant que les 50-64 ans. Le pirate IPTV type a l’age d’avoir un crédit immobilier et deux gamins en primaire, pas celui d’avoir son bac.
54,7% sont des femmes. Je répète, parce que je sais que ça va en surprendre plus d’un : la majorité des utilisateurs d’IPTV illicite en France sont des femmes. Là, le cliché du geek en hoodie qui torrent dans sa cave en prend un sacré coup.
72% sont abonnés SVOD. 70% ont accès à la TV payante. C’est ça le plus beau. Le pirate IPTV moyen, c’est quelqu’un qui paie déjà. Qui a Netflix, qui a Canal+ dans son offre fibre, qui a peut-être Disney+ et Amazon Prime, et qui utilise EN PLUS un boitier acheté sur Amazon (30% des achats) ou à la FNAC (25%). On achète son boitier pirate à la FNAC. A coté des Airpods. En 2024. Les vendeurs ne demandent pas ce que vous comptez en faire, et les clients ne se cachent pas.
Ce n’est pas un profil de délinquant. C’est monsieur et madame tout le monde. Votre voisin de palier. Votre belle-soeur. Votre boss.
62,5% y accèdent gratuitement (36% inscription directe, 26,5% identifiants d’un proche). Quand c’est payant, 14,40 euros par mois. Le cout d’un boitier : 106 euros, amorti en 7 mois face à l’empilement d’abonnements.
Et le chiffre que toute la chaine de valeur devrait imprimer et coller au mur : 49% se sont désabonnés d’au moins un service légal depuis qu’ils utilisent l’IPTV. Ce qui commence comme “je complète” finit par “je remplace”. A 14 euros par mois, c’est pas vraiment surprenant.
Pour la petite histoire : en 2014, lors de mon premier (et dernier) NAB à Las Vegas, je suis passé dans le hall où les boitiers IPTV se vendaient comme des hot-dogs. Ils venaient d’Asie, pas très chers, et ce qui m’avait le plus surpris c’est que tout était déjà basé sur HLS. A la meme époque, M6 Replay utilisait encore un lecteur Flash sur le web. Les pirates avaient une longueur d’avance technique sur les diffuseurs légaux. Onze ans plus tard, ils ont toujours cette avance. Mais maintenant c’est sur le produit, pas la tech.
13 000 sites bloqués, et le piratage ne bouge pas
L’Arcom a joué le jeu de l’escalade. Depuis 2022 : plus de 13 000 noms de domaine bloqués. En 2024 : 3 797 sites, +146% par rapport à 2023. La part de l’IPTV dans les demandes de blocage : 6% en 2023, 28% en 2024, 40% sur les trois premiers trimestres 2025. L’artillerie lourde.
L’audience des services illicites a reculé de 35% entre 2021 et 2025. C’est le chiffre que l’Arcom met sur ses slides. Bravo. Sauf que le taux de piratage sportif reste planté à 18%. Et seulement 32% des utilisateurs déclarent avoir déjà été bloqués. Les deux tiers n’ont jamais vu la couleur d’un blocage. Vous parlez d’un filet aux mailles larges.
En février 2026, une opération Europol/Eurojust a visé 31 suspects dans 7 pays. La lutte se judiciarise, s’internationalise, et coute de plus en plus cher. Pour des résultats qui, fondamentalement, ne changent pas la donne.
Le manque à gagner selon PMP Conseil : 1,5 milliard d’euros par an. 290 millions pour le sport. 420 millions de pertes fiscales. Des chiffres théoriques, parce que quand 60% des pirates sportifs paient déjà pour du légal, ce 1,5 milliard ne se matérialiserait pas si l’IPTV disparaissait demain. C’est un manque à gagner fantasmé, pas un transfert de valeur réel.
Le vrai problème : l’offre pirate est un meilleur produit. Point.
Et c’est là que le discours dominant déraille. Parce que l’industrie entière parle de “lutte contre le piratage” comme s’il s’agissait de combattre un ennemi extérieur. Alors que le problème est intérieur. L’offre pirate est objectivement un meilleur produit que l’offre légale. Et tant qu’on ne regarde pas ça en face, on peut bloquer 130 000 sites, ça ne changera rien.
Prenez le sport. Vous voulez regarder du foot en France en 2026 ? La Ligue 1 a maintenant sa propre plateforme, Ligue 1+, à 14,99 euros par mois. Oui, la LFP a créé son propre service de streaming après le fiasco DAZN (une saison, 700 000 abonnés, un procès, au revoir). C’est le premier grand championnat européen en direct-to-consumer. Audacieux. Mais ça fait un abonnement de plus. Et encore, la situation n’est meme pas claire : beIN Sports avait un match le samedi, mais le torchon brule entre la LFP et la chaine qatarie, et personne ne sait exactement ce qui se passe d’un mois à l’autre. La Champions League ? Canal+, avec le “Pass Coupes d’Europe” en option. La Premier League ? Canal+. La Liga ? beIN Sports. La Serie A ? DAZN (oui, ils diffusent encore le foot italien en France, allez comprendre). Le Top 14 ? Canal+. La Formule 1 ? Canal+.
Et le tennis. Accrochez-vous. Roland-Garros, c’est France TV pour la journée et Amazon Prime Video pour les sessions de soirée. L’Open d’Australie et l’US Open, c’est Eurosport, donc un abonnement Max. Wimbledon ? beIN Sports. Le circuit ATP (Masters 1000, ATP 500) ? Eurosport. Le circuit WTA ? beIN Sports. Monte-Carlo et Bercy ? Les demi-finales et finales sont en clair sur C8, mais le reste c’est Eurosport. La Coupe Davis ? Bein. Pour suivre le Grand Chelem complet, il faut trois abonnements différents. Pour un sport.
Le Tour de France ? France TV et Eurosport. L’UFC ? RMC Sport. Le MotoGP ? Canal+.
Vous suivez encore ? Personne ne suit. C’est exactement le point.
Pour les films et séries, c’est pareil. Netflix pour Stranger Things. Disney+ pour Star Wars. Max pour The Last of Us. Amazon pour Les Anneaux de Pouvoir. Paramount+ pour Mission Impossible (accessible uniquement via les packs Canal+, bonne chance pour le trouver). Apple TV+ pour Severance. Canal+ pour les films récents. Résultat : 6, 7, 8 abonnements. A 10-15 euros chacun. Des centaines d’euros par an pour une expérience utilisateur fragmentée entre 8 apps, 8 moteurs de recherche différents, et 8 systèmes de recommandation qui ne se parlent pas.
En face, le boitier IPTV : un seul point d’accès. Toutes les chaines. Tous les sports. Tous les catalogues. Une interface. Un “abonnement” à 14 euros. Ou gratuit. L’ironie suprême : l’abonnement Ligue 1+ coute 14,99 euros par mois. Pour un seul championnat. Le boitier pirate, pour le meme prix, donne accès à tous les championnats du monde.
C’est un meilleur produit. Pas un produit “équivalent mais gratuit”. Un. Meilleur. Produit. Plus simple, plus complet, plus pratique. Et les données le confirment : 61% des utilisateurs citent l’étendue de l’offre comme motivation première. Le prix n’arrive qu’à 38%. Les gens ne piratent pas parce que c’est moins cher. Ils piratent parce que c’est mieux.
L’industrie musicale a mis 15 ans à comprendre ça. Le piratage musical ne s’est pas effondré grâce à Hadopi (paix à son ame, bis). Il s’est effondré quand Spotify a proposé toute la musique du monde à un seul endroit pour 9,99 euros par mois. Un meilleur produit que le piratage. C’est la seule formule qui marche.
Le streaming vidéo en est encore à l’étape d’avant. Chaque studio, chaque ligue sportive, chaque ayant droit veut son propre silo, sa propre plateforme, son propre abonnement. Tout le monde défend son petit pré carré de revenus. Et le consommateur, lui, a trouvé sa solution. Elle est illégale, mais elle marche.
Tant que l’industrie n’aura pas son “moment Spotify”, rien ne changera. Et l’ordre des priorités devrait etre limpide.
D’abord, l’offre. C’est la seule variable qui compte. Quand 61% des pirates citent la fragmentation comme motivation première et que 72% paient déjà pour du légal, le diagnostic est posé. Le consommateur ne demande pas la gratuité, il demande la simplicité. Un point d’accès. Un catalogue. Un prix. Spotify l’a fait pour la musique. Le jour où quelqu’un le fait pour la vidéo, le piratage IPTV s’effondre mécaniquement. Pas besoin de bloquer quoi que ce soit.
Ensuite, la tech. Le watermarking, la détection de flux, le fingerprinting audio, tout ça a du sens comme couche complémentaire une fois que l’offre est en place. Mais déployer de la tech anti-piratage sur une offre légale cassée, c’est mettre un antivol sur une voiture qui n’a pas de moteur. Personne ne veut la voler, c’est juste qu’il y en a une meilleure garée à coté.
Le politique, en dernier. Parce que légiférer sur le piratage numérique suppose de comprendre le piratage numérique. Et quand la solution consiste à expliquer ce qu’est un DNS à un député, ça ne peut jamais bien se passer. Les 13 000 domaines bloqués sont la preuve que l’approche réglementaire, sans refonte de l’offre, produit des chiffres impressionnants sur des slides et zéro impact sur le terrain. 18% de piratage sportif. Stable. Depuis des années.
Les données de l’Arcom le disent noir sur blanc. Il suffit de les lire. Et grace au MCP data.gouv, c’est maintenant beaucoup plus facile.
Le MCP data.gouv : un précédent pour l’analyse streaming
Revenons au point de départ. Le MCP data.gouv.fr n’est pas un gadget. Pour cet article, j’ai fait tout le chemin en une conversation : recherche “audiovisuel”, identification du dataset Arcom, parsing des 600 lignes et 524 colonnes, calcul des distributions, génération des visualisations. Zéro téléchargement, zéro nettoyage de données manuel.
C’est exactement l’approche du MCP Streaming Radar sur Lens : rendre la data streaming accessible via des agents IA. Data.gouv.fr offre les données publiques, Lens la data propriétaire sur les marchés streaming (vertical drama, Afrique...). Les deux sont complémentaires. Un agent qui croise les données Arcom avec les données CNC et les données de marché privées, c’est le début d’une vision systémique de l’écosystème audiovisuel français.
Le rayon audiovisuel est encore maigre sur data.gouv. Pas de données Médiamétrie, pas de chiffres plateformes. Mais le mouvement est lancé. Et le fait que l’Arcom publie ses données brutes, pas juste un PDF, est un précédent que d’autres régulateurs devraient suivre.
Pour tester : le MCP data.gouv.fr est accessible en ajoutant le connecteur dans n’importe quel client IA compatible. L’URL du serveur est publique. C’est gratuit. Et c’est français. Ce qui, dans le paysage tech actuel, mérite d’être souligné.
Ludovic Bostral - Streaming Radar Strategic Advisor Streaming & OTT | Data Intelligence & IA | Freelance Newsletter : streaming-radar.com Data Intelligence : lens.streaming-radar.com MCP Streaming Radar : lens.streaming-radar.com/mcp Prendre rendez-vous : bostral.com/call




