TL;DR
• YouTube TV et Disney trouvent un accord : après 15 jours de coupure totale des chaînes ESPN et ABC, elles reviennent sur la plateforme — avec ESPN Unlimited dans le package d’ici fin 2026
• Netflix bascule dans les podcasts vidéo : 50 à 75 shows au lancement début 2026, avec exclusivité retirée de YouTube
• Le contenu interactif devient moteur business : Netflix déploie le vote en temps réel pour transformer l’engagement passif en participation active
• Les plateformes deviennent le produit : être visible sur l’écran d’accueil de ta TV est devenu plus important que la qualité du contenu lui-même
• Les outils de mesure qualité montrent leurs limites : avec les nouveaux codecs et l’IA générative, VMAF (l’outil standard de l’industrie) ne reflète plus ce que l’œil humain perçoit vraiment
Quinze jours denses dans l’écosystème streaming. Entre l’accord Disney-YouTube TV qui met fin à un bras de fer commercial médiatisé, Netflix qui se lance dans la bataille des podcasts vidéo contre YouTube, et des réflexions pointues sur les limites de nos outils de mesure qualité, les cartes se redistribuent. La tech avance, le business s’adapte, et l’infrastructure montre ses failles.
La semaine a été marquée par deux mouvements de fond qui continuent de structurer l’industrie. D’un côté, les plateformes renforcent leur position de gatekeeper — ce n’est plus le contenu qui fait la différence, c’est l’interface. De l’autre, Netflix confirme sa stratégie d’expansion tous azimuts : après les jeux, le live et la pub, voici les podcasts vidéo. Pendant ce temps, Fabio Sonnati publie une réflexion technique essentielle sur les défis de mesure qualité face aux nouveaux codecs et à l’IA. Spoiler : VMAF ne suffit plus.
🤝 Disney et YouTube TV : la fin d’une guerre commerciale
L’accord était dans l’air depuis quelques jours, il est tombé vendredi soir. Disney et YouTube TV ont signé un accord multi-années qui met fin à 15 jours de coupure totale. ESPN, ABC, FX, Disney Channel et les autres chaînes du groupe reviennent sur la plateforme de Google, qui compte 9,4 millions d’abonnés aux États-Unis selon les estimations de MoffettNathanson.
Le timing de cette coupure (qu’on appelle un “blackout” dans le jargon) n’était pas anodin : les utilisateurs YouTube TV ont raté deux Monday Night Football, des matchs de football américain universitaire, et divers événements sportifs majeurs. Google avait d’ailleurs offert un crédit de 20$ à ses abonnés pour compenser. Mais ce qui intéresse vraiment dans cet accord, c’est ce qui se cache derrière.
Premièrement, YouTube TV obtient l’accès à ESPN Unlimited — le nouveau service all-inclusive d’ESPN qui combine ESPN+ et du contenu additionnel — d’ici fin 2026, sans surcoût pour les abonnés au plan de base. C’est un coup stratégique qui renforce encore la valeur de l’offre YouTube TV face à Hulu + Live TV (propriété Disney) et Fubo.
Deuxièmement, Disney+ et Hulu pourront être ajoutés en bundle à l’abonnement YouTube TV. Cette intégration confirme une tendance qu’on observe depuis Streaming Radar #18 : les bundles (ces offres groupées qui combinent plusieurs services) deviennent la nouvelle norme. Les consommateurs ne veulent plus gérer 12 apps différentes, ils veulent un guichet unique.
Le vrai sujet ici n’est pas tant “qui a gagné” — même si les deux camps s’en sortent bien — mais plutôt ce que ça dit sur le rapport de force. ESPN facture plus de 10$ par mois et par abonné aux plateformes de distribution (ce qu’on appelle les “frais de diffusion” ou “carriage fees”), le tarif le plus élevé de l’industrie américaine. CNBC rapporte que c’était le cœur du conflit. YouTube TV refusait de payer les tarifs demandés. Disney menaçait de retirer ses chaînes.
Ce blackout temporaire montre que même YouTube — filiale d’Alphabet, 2000 milliards de capitalisation boursière — doit négocier serré avec Disney. L’ère où les GAFA dictaient leurs conditions aux médias traditionnels touche peut-être à sa fin. Le sport reste le contenu premium qui fait plier les plateformes.
🎙️ Netflix entre dans l’arène des podcasts vidéo
Netflix ne fait jamais les choses à moitié. Après avoir annoncé en octobre un accord avec Spotify pour diffuser une sélection de podcasts de The Ringer (propriété Spotify) incluant The Bill Simmons Podcast et The Rewatchables, la plateforme accélère.
Bloomberg révèle cette semaine que Netflix est en négociation avec iHeartMedia pour licencier des podcasts vidéo comme The Breakfast Club, Jay Shetty Podcast, et Stuff You Should Know. Et The Hollywood Reporter rapporte que Netflix a contacté des dizaines d’agents chez WME, UTA et CAA pour recruter massivement des créateurs de podcasts vidéo.
L’objectif ? 50 à 75 shows au lancement début 2026, avec l’ambition de monter à 200 shows selon Business Insider. Le message est clair : Netflix veut devenir une destination podcast, pas juste tester l’eau.
Mais il y a un hic. Netflix exige l’exclusivité vidéo. Concrètement, les podcasts signés avec Netflix devront retirer leurs épisodes vidéo de YouTube. Ça peut sembler logique du point de vue plateforme, mais c’est une pilule difficile à avaler pour les créateurs. YouTube génère des revenus publicitaires substantiels et touche plus d’1 milliard de viewers podcast mensuels actifs. Comme l’explique TechCrunch, l’audio reste sur Spotify (ou autres plateformes audio), mais la vidéo devient exclusive Netflix.
Netflix promet un gros push marketing et des deals financiers “compétitifs” selon trois agents cités par Business Insider. Reste à voir si c’est suffisant pour convaincre des créateurs d’abandonner l’audience massive de YouTube.
D’un point de vue stratégique, cette offensive podcasts fait sens pour Netflix. Ted Sarandos, co-CEO, l’avait d’ailleurs annoncé en avril 2025 : “Les frontières entre podcasts et talk shows deviennent floues.” En intégrant des podcasts, Netflix enrichit son catalogue de contenu “always-on” à coût relativement faible, fidélise l’audience avec du contenu quotidien ou hebdomadaire (vs les séries qu’on binge en un week-end), et surtout, attaque YouTube sur son terrain.
YouTube domine la vidéo courte et longue durée. Netflix dominait le premium longue durée. Maintenant Netflix veut aussi le format intermédiaire : conversations, interviews, podcasts structurés. C’est cohérent avec leur stratégie live (combat Jake Paul vs Mike Tyson, événements sportifs) et leur volonté de devenir “le lieu où l’on va pour se divertir”, peu importe le format.
🎮 Le vote en temps réel : quand l’engagement devient moteur business
Une annonce tech peut sembler anodine et révéler en fait un changement de paradigme. TechCrunch rapporte que la CTO de Netflix Elizabeth Stone a dévoilé à TechCrunch Disrupt 2025 une fonctionnalité de vote en temps réel pour le contenu live. Les spectateurs de shows comme Star Search ou Dinner Time Live with David Chang pourront voter, influençant directement l’issue du programme.
Petite note personnelle : cette annonce me ramène quinze ans en arrière. Entre 2009 et 2011, chez M6, on bossait déjà sur le second écran avec X Factor. Les téléspectateurs votaient via le site web pendant l’émission live. Puis il y a eu Rising Star (2014), cette émission éphémère où tout était décidé en temps réel par le vote du public — l’écran géant sur le plateau se remplissait au fur et à mesure. Ça n’a pas duré, mais l’idée était là. Comme dirait Lavoisier (en plaisantant) : “Rien ne se perd, rien ne se crée, tout se transforme” — Netflix reprend le concept, mais cette fois avec la puissance d’une infrastructure streaming mondiale et une base de 280 millions d’abonnés.
L’analyse de The Streaming Wars va au cœur du sujet : ce n’est pas juste une feature UX sympa, c’est une transformation de l’engagement en moteur business. Traditionnellement, le KPI roi était le temps de visionnage (watch time). Plus tu scrolles, plus tu binges, mieux c’est. Mais le temps de visionnage mesure l’attention passive.
Le vote mesure l’investissement actif. Quand un utilisateur vote, plusieurs choses se passent :
Activation du circuit de récompense dopaminergique (même mécanisme que les réseaux sociaux et le gaming)
Création d’une mémoire émotionnelle plus forte
Formation d’habitudes comportementales durables
Concrètement, tu as voté pour un candidat sur Star Search. Tu es maintenant investi dans son parcours. Tu reviendras voir le résultat. Netflix crée ainsi une obligation de retour, sans avoir besoin de sortir 8 épisodes d’un coup. C’est du rendez-vous télévisuel, mais encodé dans le produit.
Les implications business sont multiples :
Données comportementales premium : Netflix ne sait plus juste ce que tu regardes, mais comment tu décides sous pression temporelle, quelles préférences tu exprimes activement
Rétention via l’identité : tu défends ce que tu contribues à créer, psychologie comportementale de base
Urgence live sans coûts linéaires : la fenêtre de vote crée l’urgence, sans nécessiter une diffusion broadcast traditionnelle
C’est intelligent. Netflix virtualise l’effet “live” (la tension du vote qui se clôture) tout en conservant les marges d’une infrastructure streaming. Comme l’écrit The Streaming Wars : “Netflix isn’t trying to keep people watching. It’s now trying to make them believe they matter.”
Pour ceux qui ont vécu l’échec du contenu interactif Netflix avec Black Mirror: Bandersnatch (2018), cette approche est différente. Bandersnatch était narratif-complexe, multi-embranchements, lourd en prod. Là, c’est simple : un vote, un impact direct, une boucle de feedback instantanée. C’est scalable.
La différence avec nos expériences M6 de 2009-2014 ? À l’époque, on gérait deux écrans (TV + web/mobile), avec les complexités de synchronisation que ça impliquait. Netflix intègre tout dans une seule app, avec un contrôle total sur la stack technique. L’avantage aussi : ils dosent l’interactivité. Rising Star avait poussé le concept au maximum — 100% décidé par le vote en temps réel — ce qui rendait le format imprévisible. Netflix semble prendre une approche plus mesurée : le vote influence, sans tout contrôler. C’est probablement plus durable.
📺 La plateforme devient le produit
J’ai souvent évoqué l’importance de l’infrastructure et des CDN dans ces newsletters — Streaming Radar #12 parlait des coûts de delivery, #15 des stratégies multi-CDN. Mais un article de The Streaming Wars sur le rôle des plateformes recentre le débat : ce n’est plus le contenu qui compte, c’est la surface où il apparaît.
Le constat est simple. Tu peux avoir le meilleur film du monde, s’il est enterré trois carousels plus bas sur la page d’accueil, personne ne le trouvera. La bataille n’est plus “créer du bon contenu”, c’est “être visible sur l’écran d’accueil de la TV et dans les résultats de recherche”.
Les plateformes OS (les systèmes d’exploitation des TV connectées : Samsung, LG, Roku, Apple TV, Google TV, Amazon Fire) contrôlent désormais :
La recherche universelle (quand tu tapes “thriller” dans ta TV, qui apparaît en premier ?)
Les carrousels de la page d’accueil (ces rangées de vignettes qui défilent)
Les slots de lecture automatique (ce qui se lance tout seul quand tu allumes ta TV)
Les recommandations contextuelles (suggestions basées sur tes habitudes)
Et ces plateformes monétisent cet espace. Vous voulez être dans le premier carrousel ? Il y a un deal pour ça. Vous voulez apparaître dans la recherche universelle avant vos concurrents ? Il faut négocier. C’est devenu un inventaire publicitaire programmatique : chaque emplacement est une opportunité de revenus.
C’est pour ça que tous les fabricants TV lancent des services FAST propriétaires (FAST = Free Ad-Supported Streaming Television, autrement dit des chaînes gratuites financées par la pub : Samsung TV Plus, LG Channels, Roku Channel). Pas parce qu’ils pensent devenir Netflix. Mais parce qu’ils veulent contrôler ce qui s’affiche par défaut. Quand tu allumes ta TV, leur service se lance en premier. Ou occupe la lecture automatique. Ou remplit les trous entre tes binges.
The Streaming Wars le dit crûment : “Content owners: You’re No Longer in a Fair Fight.” Si vous êtes un streamer ou un producteur de contenu, vous jouez sur un terrain où l’arbitre (la plateforme OS) possède aussi une équipe en compétition. C’est comme affronter les Chiefs : techniquement possible de gagner, mais ne comptez pas sur les arbitres pour vous aider.
Chez M6, quand on a lancé 6Play en 2008, le problème était technique : encoder, délivrer, gérer les DRM. Aujourd’hui, le problème est politique : négocier votre visibilité sur des OS propriétaires. Le contenu est devenu une commodity. La surface, elle, est rare et monnayable.
🎯 VMAF ne suffit plus : quand l’IA et le grain de film cassent les outils de mesure
Cette semaine, Fabio Sonnati publie une analyse technique fondamentale sur les défis de mesure qualité avec les nouveaux codecs et l’IA. Le constat : VMAF (Video Multimethod Assessment Fusion), l’outil de mesure qualité vidéo développé par Netflix et que toute l’industrie utilise depuis 2016, montre ses limites face aux nouvelles techniques d’encodage.
VMAF fonctionne sur un principe simple : il compare une vidéo compressée à sa source non compressée, image par image, pour calculer un score de 0 à 100. Plus le score est élevé, plus la compression a préservé la qualité perçue. Pendant des années, ça marchait bien pour optimiser les encodages H.264 et HEVC. Mais deux nouvelles approches cassent ce modèle.
Premier problème : le Film Grain Synthesis (FGS). Les codecs modernes comme AV1, VVC et LCEVC intègrent une technique radicalement différente pour gérer le grain de film — ces petites variations aléatoires qui donnent cette texture “cinéma” aux images. Traditionnellement, un encodeur s’acharne à compresser chaque pixel de grain, ce qui coûte énormément en débit. Le FGS adopte une approche inverse : il analyse le grain, l’élimine complètement avant l’encodage, et stocke juste les paramètres pour le recréer à la lecture (fréquence, intensité, distribution).
C’est comme prendre une photo d’un pull en laine : au lieu de photographier chaque fibre individuellement (lourd), tu photographies le pull lisse et tu enregistres “ajouter texture laine, densité moyenne, gris chiné” (léger). Au décodage, un générateur de bruit procédural recrée un grain statistiquement équivalent. Économie de bande passante : 30 à 50% sur du contenu filmique granuleux. Qualité visuelle : excellente pour l’œil humain.
Mais voilà le hic : VMAF compare pixel par pixel la sortie décodée à la source originale. Le grain synthétisé ressemble visuellement au grain d’origine, mais mathématiquement, les pixels ne correspondent pas exactement — c’est du bruit recréé, pas reproduit. Résultat : VMAF pénalise sévèrement le FGS, avec des chutes de score pouvant atteindre 10 à 15 points, alors que l’œil humain ne détecte aucune dégradation.
Netflix, qui optimise religieusement ses encodages pour atteindre un score VMAF de ~94 (leur seuil qualité), se retrouve coincé. Pour maintenir ce score avec AV1, l’encodeur écrase les hautes fréquences — le grain, mais aussi les textures fines. On obtient des rendus “plastiques” : des bords ultra-nets, des aplats de couleur lisses, mais zéro grain naturel. Et paradoxalement, du banding (ces dégradés en escalier visibles dans les ciels ou les ombres) que VMAF ne pénalise pas assez.
Sonnati illustre le problème avec un test éloquent : deux encodages ciblant tous deux VMAF 94, l’un en HEVC, l’autre en AV1. Le HEVC préserve une partie du grain et des textures. L’AV1 élimine complètement les hautes fréquences pour satisfaire le score. Visuellement, l’HEVC est supérieur. Mathématiquement, VMAF les juge équivalents. L’outil nous ment.
Deuxième problème : l’IA générative qui améliore. Les workflows modernes intègrent de plus en plus d’IA pour le super-resolution (upscaling), la correction de banding, ou la restauration de détails perdus. Quand un modèle IA ajoute des détails plausibles dans une zone floue, augmente la netteté perçue, ou corrige un artefact de compression, il “modifie” l’image par rapport à la source.
VMAF, conçu pour mesurer la fidélité, voit ça comme une déviation de l’original et pénalise le résultat, alors que c’est une amélioration visuelle objective. C’est comme si un prof de français pénalisait une rédaction corrigée parce qu’elle ne correspond plus mot pour mot au brouillon initial, même si les fautes ont été supprimées. L’outil mesure la proximité avec la source, pas la qualité perçue.
Face à ces limites, Sonnati teste IMAX NR-XVS (ex-SSIMwave), un outil de mesure qui fonctionne différemment : il évalue la qualité sur une échelle absolue 0-100 sans référence à l’originale, en modélisant directement ce que l’œil humain perçoit (contraste, netteté, artefacts visibles, cohérence temporelle). Les résultats sont prometteurs : XVS détecte le manque de grain, le banding, la sur-lissage des rendus Netflix AV1. Sur les tests de Sonnati, XVS corrèle mieux avec les jugements humains que VMAF sur du contenu encodé avec FGS ou traité par IA.
Pourquoi c’est critique ? Parce que toute l’industrie optimise ses pipelines d’encodage sur VMAF. Si VMAF est biaisé, on optimise dans la mauvaise direction depuis des années. Avec le FGS qui devient standard (AV1 l’implémente, VVC aussi, les futurs codecs IA-native l’adopteront), et l’IA qui s’invite massivement dans les workflows vidéo (upscaling, restauration, génération), on a besoin de nouvelles métriques de mesure. Vite.
Sonnati propose une approche hybride pragmatique : combiner un outil de mesure absolue (qualité perçue, comme XVS) pour les workflows incluant du FGS ou de l’IA générative, et conserver un outil de comparaison relative (fidélité à la source, comme VMAF) pour les workflows classiques, avec une pondération intelligente selon le use case. C’est le genre de réflexion technique qui peut sembler pointue, mais qui impacte littéralement des milliards de streams par jour et des millions de dollars d’infrastructure CDN.
Pour ceux qui ont suivi Streaming Radar #6 sur AV1 et les codecs next-gen, cet article de Sonnati est dans la continuité logique : la tech avance, les outils de mesure doivent suivre. Sinon, on se retrouve à optimiser pour des scores qui ne reflètent plus la réalité de ce que les gens voient sur leur écran — et à laisser des gains de qualité ou de bande passante sur la table.
🔧 Conclusion : tech qui évolue, business qui bascule
Cette semaine confirme plusieurs mouvements structurels. Sur le plan technique, les nouveaux codecs (AV1, VVC) et l’IA généralisée imposent de repenser nos outils de mesure qualité. VMAF, l’outil que toute l’industrie utilise depuis des années, ne suffit plus face au Film Grain Synthesis (cette technique qui régénère le grain à la lecture) et aux améliorations IA. Il faudra probablement des outils hybrides ou des mesures absolues comme XVS pour continuer d’optimiser efficacement.
Sur le plan business, les systèmes d’exploitation des TV connectées deviennent le vrai produit. Le contenu reste essentiel, mais la visibilité (placement sur la page d’accueil, résultats de recherche, lecture automatique) devient le goulot d’étranglement. Les fabricants TV monétisent leur interface, et les créateurs de contenu doivent négocier pour exister. Disney vs YouTube TV l’illustre : même avec du contenu premium (ESPN qui facture 10$/mois par abonné), il faut négocier pied à pied avec les distributeurs.
Et Netflix continue sa diversification tous azimuts : événements live, jeux, publicité, et maintenant podcasts vidéo avec l’ambition d’atteindre 200 shows. C’est cohérent avec leur stratégie “devenir la destination entertainment”, pas juste “la bibliothèque de séries”. Le vote en temps réel renforce cette logique : transformer des spectateurs passifs en participants actifs génère plus de fidélisation qu’un algorithme de recommandation, aussi bon soit-il.
Le streaming n’est plus seulement une question de tuyauterie technique (encoder, délivrer, mesurer). C’est devenu une guerre de plateformes, d’interfaces, et de comportements utilisateurs. Les cartes se redistribuent. Ceux qui maîtrisent à la fois l’infrastructure tech et la négociation business seront les gagnants de cette prochaine phase.
Newsletter :












