De l’internet à l’IA, bis repetita entre médias et géants du numérique ?

Charis Papaevangelou, Franck Rebillard, Nikos Smyrnaios

Le 13 mars 2024, Le Monde annonce avoir conclu un accord avec OpenAI1. Six mois plus tard, l’entreprise propriétaire de l’agent conversationnel ChatGPT établit des partenariats avec plusieurs groupes de médias majeurs à l’étranger (Axel Springer, Condé Nast, News Corp…) mais aucun autre en France. Les organisations nationales d’éditeurs de presse ont pourtant sollicité OpenAI en ce sens, ainsi que d’autres entreprises de pointe dans le domaine de l’intelligence artificielle2 telles qu’Anthropic, Mistral ou Perplexity, et même les groupes Alphabet et Meta. Ces derniers n’ont néanmoins pas donné suite aux sollicitations des éditeurs pour conclure des accords de rémunération portant sur leurs activités en matière d’IA (avec respectivement Gemini ou Llama). Or, des accords avaient déjà été signés avec les principales organisations de médias (et notamment avec l’Apig – Alliance de la presse d’information générale) au titre des droits voisins pour leurs activités dans le domaine des moteurs de recherche (Google) et autres réseaux sociaux (Facebook)3.

LES MÉDIAS SONT, PAR AILLEURS, D’UNE IMPORTANCE INÉGALE QUANT À L’INTÉRÊT STRATÉGIQUE QU’ILS REPRÉSENTENT POUR LES ACTEURS DU NUMÉRIQUE

Faut-il en conclure que les relations entre médias et géants du numérique seront différentes avec l’IA de ce qu’elles ont été durant une vingtaine d’années avec internet ? Une telle conclusion serait évidemment hâtive. D’abord, parce que, par définition, la situation actuelle est forcément provisoire. Ensuite, parce que l’économie politique du secteur de l’IA, ses technologies et ses pratiques sont loin d’être stabilisées. Par ailleurs, toute nouvelle configuration des relations entre les industries de la culture et de l’information, d’un côté, et les acteurs du numérique, de l’autre, s’inscrit forcément dans une certaine continuité avec les configurations précédentes. Toutes ces considérations amènent à appréhender avec mesure les mouvements conjoncturels se nouant autour de l’IA dans la période actuelle, pour mieux les replacer dans le temps long et au regard des enjeux structurels affectant les relations entre les médias et les géants de la Silicon Valley.

Il convient d’abord de se pencher sur le rapport de force entre les acteurs concernés. Et rappeler ici, à la lumière des relations observées depuis le début des années 2000, que celles-ci sont asymétriques sur un double plan. Sur un plan global, la relation est à l’avantage des acteurs du numérique, en position oligopolistique à l’échelle mondiale dans la médiation de l’accès aux internautes. À cette aune, ils sont susceptibles d’imposer leurs conditions aux différents éditeurs de médias, en grande majorité d’envergure nationale, qui dépendent des plateformes pour atteindre leur public. Mais les médias sont, par ailleurs, d’une importance inégale quant à l’intérêt stratégique qu’ils représentent pour les acteurs du numérique. Il en résulte un traitement différencié qui se matérialise par des accords offrant des avantages inégaux aux différents éditeurs, et ce, depuis le milieu des années 2000. L’hypothèse de la continuité d’une telle configuration devra donc être examinée. Consistant pour l’industrie du numérique à exercer, d’une part, une domination technologique et économique sur les médias et, de l’autre, à privilégier des relations avec un nombre toujours plus limité d’éditeurs, elle pourrait nuire au pluralisme du paysage de l’information. Une telle perspective sera, en outre, replacée dans le contexte des politiques publiques en France et de celles expérimentées dans d’autres pays comme l’Australie, le Canada et les États-Unis.

De la stratégie du fait accompli à la domination technologique

Dès les années 1990, des start-up de l’internet telles que Yahoo, des portails comme MSN ou des fournisseurs d’accès (Wanadoo, Tiscali, Free, etc.) ont constitué une offre d’information en ligne. Mais l’ensemble de ces services se fondait sur des contrats classiques d’achat de licence : un opérateur de service en ligne rémunère un fournisseur de contenus (une agence de presse ou un journal) pour la reproduction et la publication de ses contenus qui, à leur tour, attirent des visiteurs sur le site du premier.

GOOGLE SE FIXE COMME OBJECTIF D’« ORGANISER L’INFORMATION DU MONDE » SANS PRENDRE EN CONSIDÉRATION LES CONTRAINTES DE L’ÉCONOMIE TRADITIONNELLE

Avec le lancement de Google News en 2002 (2003 en France), en réponse à une forte demande d’actualité après les attentats du 11 septembre 2001, Google passe outre cette pratique bien ancrée. En accord avec l’« idéologie informationnelle » qui domine dans la Silicon Valley, Google se fixe comme objectif d’« organiser l’information du monde »4 sans prendre en considération les contraintes de l’économie traditionnelle (droit d’auteur, droit des marques, organisation des industries culturelles, etc.)5. Ce qui prime avant tout est de permettre à l’utilisateur d’avoir accès à une « sélection des sources d’information, caractérisées par des points de vue et des lignes éditoriales différentes, réalisée sans parti pris politique ni idéologique »6. Google se présente ainsi comme un intermédiaire, neutre et désintéressé, dont l’objectif est de rendre plus facilement accessible toute l’information disponible en ligne. Son service d’actualité met en œuvre une technologie de pointe afin de recenser de manière quasi exhaustive et d’organiser algorithmiquement en temps réel des milliers de contenus produits par de très nombreux médias professionnels. En accord avec ses préceptes idéologiques, mais aussi pour éviter de s’engager dans des accords coûteux, Google lance son service sans consultation préalable avec les éditeurs alors que celui-ci absorbe la totalité de leurs contenus et republie des titres, des extraits de texte (snippets) et des images qui leur appartiennent.

CE QUI OBLIGE LES MÉDIAS À SE CONFORMER PROGRESSIVEMENT AUX ALGORITHMES DE SERVICES D’INDEXATION ET DE RECOMMANDATION [...] JUSQU’À L’« ASSERVISSEMENT »

De leur côté, Facebook et Microsoft lancent respectivement News Feed et MSN News Search (devenu Bing) en 2006 et 2008. 2006 est également l’année où Google rachète YouTube qui atteint rapidement des audiences record. En effet, à partir du milieu des années 2000, les internautes passent de plus en plus par ces plateformes intermédiaires pour accéder aux contenus d’actualité et de divertissement, ce qui oblige les médias à se conformer progressivement aux algorithmes de services d’indexation et de recommandation (moteurs de recherche, réseaux sociaux numériques, services de streaming, etc.) jusqu’à l’« asservissement »7. En effet, dès la fin des années 2000, près de la moitié du trafic entrant vers des sites d’informations français et étatsuniens provient de différents services de Google et de Facebook8.

CES DIVERSES ADAPTATIONS LOGICIELLES VONT PARFOIS JUSQU’À SE DOUBLER D’UNE CONCESSION DE NATURE MATÉRIELLE : LEURS CONTENUS SONT DIRECTEMENT HÉBERGÉS ET DIFFUSÉS PLATEFORMES OLIGOPOLISTIQUES

À partir du milieu des années 2010, l’information en ligne devient majoritairement consultée sur les smartphones et les applications optimisées pour leurs écrans. Afin de s’adapter à ce nouveau support, les médias sont contraints de reconfigurer leurs contenus pour qu’ils soient compatibles avec chacun des systèmes d’exploitation de ces appareils, dominés par le duopole que forment Android de Google et iOS d’Apple. Le procédé AMP (Accelerated Mobile Pages), mis au point par Google pour optimiser l’affichage de contenus web (codés en HTML) sur des terminaux mobiles, est adopté par plusieurs éditeurs. Ces diverses adaptations logicielles vont parfois jusqu’à se doubler d’une concession de nature matérielle, marquant un degré supplémentaire dans la capture infrastructurelle de certains médias : leurs contenus sont directement hébergés et diffusés par les plateformes oligopolistiques, telles que Facebook avec Instant Articles, lancé en 2015 et interrompu en avril 2023, ou Snapchat avec Discover, également lancé en 2015 et encore en activité9. Ce dernier cas est assez caractéristique des relations électives qui se mettent en place entre plateformes et médias : Snapchat choisit les médias qu’elle souhaite comme partenaires et qui, à l’instar du Monde, peuvent profiter de leur présence dans le service Discover.

Des relations électives à la corégulation

Ainsi, au fil des années, les relations se sont faites plus étroites entre les industriels du numérique et les producteurs d’information, tout en concernant seulement certains de ces éditeurs. Emblématique à cet égard en raison de sa position dominante, Google a dû composer en Europe, et particulièrement en France, avec deux contraintes majeures qui l’ont poussé à établir des relations sélectives avec certains médias au détriment d’autres. D’abord, il y a le défi de la traduction algorithmique des logiques éditoriales. Pour que son service soit efficace et réponde aux besoins des internautes (donner la priorité aux actualités les plus importantes et les plus récentes, proposer des sources nombreuses et pertinentes, etc.), Google doit intégrer, au sein de son algorithme, des critères d’évaluation des médias qu’il recense, afin d’établir une hiérarchie entre eux. Corollairement, la société de Mountain View a été confrontée, dès le milieu des années 2000, aux premières procédures judiciaires intentées par des éditeurs comme l’Agence France-Presse (AFP) et par certaines organisations professionnelles comme le GESTE (Groupement des éditeurs de services en ligne), qui regroupe les principaux médias français.

L’ALGORITHME DE HIÉRARCHISATION DE GOOGLE NEWS INTÈGRE UN CLASSEMENT DES SOURCES FONDÉ SUR DES CRITÈRES COMME LA TAILLE ET LA PRODUCTIVITÉ DES RÉDACTIONS – CE QUI TEND À PRIVILÉGIER LES GRANDS MÉDIAS AU DÉTRIMENT DES SITES D’INFORMATION INDÉPENDANTS ET DES BLOGS QUI SE TROUVENT RÉTROGRADÉS DANS LES RÉSULTATS

Pour répondre à ces défis, Google infléchit sa position initiale et commence à se rapprocher de certains éditeurs qu’il juge stratégiques : il signe ainsi des accords de rémunération avec des agences de presse comme l’AFP et Associated Press en 2007, et il accepte un certain nombre de revendications du GESTE, auquel il finit même par adhérer. Parallèlement, l’algorithme de hiérarchisation de Google News intègre un classement des sources fondé sur des critères comme la taille et la productivité des rédactions10 – ce qui tend à privilégier les grands médias au détriment des sites d’information indépendants et des blogs qui se trouvent rétrogradés dans les résultats. Dans le même temps, Google propose des formations et des outils spécifiques (publicité, mesure d’audience, marketing) à ses médias partenaires. Cette évolution advient dans un contexte où l’entrée de Google sur le marché français déstabilise plusieurs secteurs économiques et génère des tensions à la fois avec des acteurs industriels (secteur du luxe, de la presse et de l’édition) mais également avec le pouvoir politique11. Google cherche alors à neutraliser ces conflits en établissant des alliances avec des acteurs qu’il perçoit comme influents dans l’establishment culturel français, à l’instar des accords avec Hachette et la Bibliothèque nationale de France (BNF) en 2009-2010.

L’ÉTAT FAVORISE UNE APPROCHE D’AUTORÉGULATION CONTRACTUELLE ENTRE LES ACTEURS QUI REPRODUIT LES RAPPORTS DE FORCE ET LES INÉGALITÉS PRÉEXISTANTES

À la suite de cet infléchissement, mais également en raison d’un changement de cap politique qui privilégie désormais une relation partenariale avec les géants du numérique, le gouvernement français arbitre le conflit qui oppose Google aux éditeurs français par une solution qui semble convenir aux deux parties. En 2013 se crée ainsi, sous les auspices de François Hollande, un fonds abondé par Google et géré par une association d’éditeurs (FINP – Fonds pour l’innovation numérique dans la presse), une première dans le monde. Google se satisfait de la non-reconnaissance d’un droit de rémunération systématique des éditeurs, quand ces derniers profitent d’une nouvelle source de financement. Cependant, cette initiative ne concerne pas tous les médias et elle est critiquée pour son manque d’équité et son opacité. Après avoir été testé en France, ce type de fonds se généralise : création de Digital News Initiative pour l’Europe en 2015 ; Facebook Journalism Project en 2017 ; Google News Initiative en 2018, etc.

La création du fonds Google en France montre qu’à l’origine l’État favorise une approche d’autorégulation contractuelle entre les acteurs qui reproduit les rapports de force et les inégalités préexistantes. Cette politique se poursuit et se transforme en corégulation12 après la transposition en France de la directive européenne sur le droit d’auteur de 2019 qui introduit un nouveau droit voisin pour les éditeurs de presse, visant à faciliter une rétribution pour la réutilisation de leurs contenus. La monétisation de ce droit voisin encadré par la loi dépend de la négociation entre les parties, ce qui favorise des ententes entre les grands groupes médiatiques et les plateformes oligopolistiques, au détriment de structures plus petites13.

L’État fixe ainsi un cadre général et il laisse les acteurs préciser son application, sans imposer une politique publique volontariste – comme le système de péréquation qui régit la distribution de la presse papier – qui pourrait favoriser activement le pluralisme en soutenant davantage les médias les plus fragiles. Selon une information révélée en 202114, Google accorde au groupe Le Monde la somme de 1,5 million d’euros par an au titre de la rémunération de ses droits voisins, à comparer aux 12 500 euros versés à un journal local comme La Voix de la Haute-Marne. Ce modèle d’accords ad hoc se généralise partout où les plateformes entrent en négociation avec les éditeurs de presse pour la rémunération de leurs contenus, comme en Australie ou au Canada.

En Australie, le Code de négociation des médias d’information (News Media Bargaining Code), entré en vigueur en 2021, contraint Google et Meta à partager leurs revenus avec des éditeurs de presse (voir La rem n°67, p.76). Cette législation permet l’injection annuelle de 200 millions de dollars australiens dans l’industrie de la presse. Un processus similaire se met en place au Canada, où la loi sur les nouvelles en ligne génère un financement de 100 millions de dollars canadiens par an pour les médias. Cependant, la répartition de ces sommes résulte des négociations bilatérales entre plateformes et éditeurs et dépend du bon vouloir des premières. Ainsi, Meta a récemment annoncé la fermeture de son service Facebook News un an seulement après son lancement. Ce qui a comme conséquence son retrait des accords australien et canadien.

Enfin, comme le montrent les diverses condamnations de Google en France par l’Autorité de la concurrence, si les Gafam acceptent, sur le principe, le cadre de la corégulation sur une base contractuelle de leurs relations avec les médias, imposé par les États, dans la pratique, ils usent de tous les moyens à leur disposition pour minimiser les coûts et les contraintes technico-légales que celui-ci génère pour leur activité15. La dernière décision en date de l’Autorité de la concurrence (décision 24-D-03 du 15 mars 2024) s’est ainsi soldée par une amende de 250 millions d’euros infligée à Google, amende fondée pour l’essentiel sur la loi de 2019 relative aux droits voisins. Mais elle a aussi montré que s’entrouvrait un nouveau chapitre des relations entre médias et géants du numérique, autour de l’IA (voir La rem n°69-70, p.29).

Une domination élective susceptible de perdurer avec l’IA

L’instruction menée par l’Autorité de la concurrence permet de retracer de façon assez détaillée comment Google a pu exploiter les contenus des éditeurs et des agences de presse, sans prévenir ces derniers, ou alors de façon détournée, pour mettre au point le modèle de fondation (LM – language model) PaLM2 à la base de son service d’IA Bard, renommé Gemini depuis. En réponse à un questionnaire de l’Autorité, Google a ainsi avoué que « certains jeux de données utilisés pour entraîner PaLM ont inclus du contenu issu de domaines d’éditeurs de presse et d’agences de presse »16. Cette pratique a eu cours jusqu’en février 2023 sans que les éditeurs et les agences de presse n’en aient été avertis. Leurs contenus ont ainsi servi lors de l’étape d’entraînement du modèle de fondation PaLM, modèle sur lequel est assis le service d’IA générative Bard-Gemini. Et celui-ci, pour afficher des réponses pertinentes aux requêtes, doit passer par une autre étape dite de grounding, qui requiert là aussi de mobiliser les contenus des éditeurs et des agences de presse17.

Lors de cette étape, Google a proposé aux éditeurs d’actionner le levier de l’opt-out en fournissant, à partir de septembre 2023, une solution informatique baptisée Google-Extended. Cependant, la mise en œuvre de celle-ci, notamment parce qu’elle repose sur le protocole robots.txt, s’est révélée ambiguë aux dires de plusieurs éditeurs (propos recueillis par l’Autorité de la concurrence). Ces derniers ont craint d’actionner ainsi un refus d’accès à leurs contenus en direction des services d’IA de Google, en même temps qu’en direction du moteur de recherche de façon plus générale. L’Autorité a estimé que l’entreprise étatsunienne avait ici usé de sa position pour lier les deux types de services, favorisant ainsi ses propres intérêts : une pratique déjà critiquée lorsque, avec le service News Showcase, Google avait essayé de contourner la rétribution au titre des droits voisins18.

À plusieurs égards, cet épisode récent concernant Google à propos de l’IA semble rejouer les scènes déjà vues des relations plus structurelles entre médias et acteurs du numérique. La domination des acteurs du numérique continue à passer par l’asymétrie technique et économique dont ils usent pour imposer leurs conditions. Ainsi, de façon tout à fait emblématique, en 2023 comme il y a une quinzaine d’années, Google use du protocole robots.txt comme d’un « contrat léonin » auxquels les éditeurs sont plus qu’incités à se plier19. Au-delà du cas français, selon une étude portant sur un échantillon de 1 157 sites d’information à travers le monde, 56 % d’entre eux ouvrent leur protocole robots.txt pour laisser Google moissonner leurs contenus à des fins d’IA. Ils sont un peu moins nombreux (49 %) à autoriser OpenAI à faire de même20.

LORSQUE GOOGLE PROCURE DES FACILITÉS D’OPT-OUT AUX ÉDITEURS À LA FIN DE L’ÉTÉ 2023, C’EST APRÈS AVOIR ALLÈGREMENT PUISÉ DANS LEURS ARCHIVES

On retrouve aussi la stratégie du fait accompli soulignée préalablement. Lorsque Google procure des facilités d’opt-out aux éditeurs à la fin de l’été 2023, c’est après avoir allègrement puisé dans leurs archives au cours des mois précédents, et sans envisager de renoncer aux services qui ont été élaborés grâce à cela, comme se borne à le constater l’Autorité de la concurrence : « Google a également précisé que l’option de refus ne vaut que pour l’avenir. Ainsi, les sites qui ont déjà contribué à l’entraînement de Bard-Gemini ne peuvent être supprimés des modèles correspondants (à savoir, PaLM 2). Selon Google, une telle suppression serait impossible dans la mesure où ces modèles ne contiennent pas une copie des données qu’ils ont utilisées pour leur entraînement.21 » Ainsi, une autre question particulière à l’IA générative se pose et complique encore la relation entre les médias et les fournisseurs de technologie : celle de la gouvernance des données et de la régulation de ces systèmes plus largement.

Quoi qu’il en soit, les acteurs du numérique semblent maintenir l’imposition de leur domination vis-à-vis des médias, dans la période contemporaine. Celle-ci pourrait même s’exacerber si l’on considère que, avec l’IA générative, la strate de production des contenus est désormais investie par des géants de la Tech qui sont également présents dans les strates de distribution et d’hébergement, que ce soit directement dans le cas des groupes Alphabet et Meta ou indirectement dans le cas de Microsoft via son alliance avec OpenAI. Ce faisant, l’emprise infrastructurelle s’étend et rend d’autant plus dépendantes les entreprises de médias22.

Des asymétries possiblement renforcées à l’intérieur du secteur médiatique

Les entreprises de médias voient par ailleurs s’accentuer, pour l’heure au moins, les inégalités internes qui caractérisaient leurs relations respectives avec les acteurs du numérique. Rappelons en effet que, à ce jour, un seul média en France (Le Monde) a obtenu les faveurs d’OpenAI. L’entreprise a, de fait, mis en place un programme préférentiel (Preferred Publisher Program) qui vise à former un club très fermé de « select, high-quality editorial partners »23. Les heureux élus seront-ils encore moins nombreux que les happy few choisis par Snapchat ou par Facebook lors des expériences de Discover et d’Instant Articles ? Le caractère en partie avorté de ces expériences au bout de quelques années, à rebours de l’emballement qui les avait accompagnées lors de leur lancement en 2015, doit cependant inciter à la prudence en ce milieu des années 2020.

Quand bien même un nouveau cycle d’innovations s’enclencherait en ce moment autour de l’IA, nous n’en serions qu’à ses débuts. Par conséquent, le cercle des médias nouant des accords avec OpenAI – ou d’autres entreprises – pourrait s’élargir. C’est déjà le cas aux États-Unis : OpenAI y a conclu des partenariats avec l’agence Associated Press (13 juillet 2023), News Corp (22 mai 2024), The Atlantic (29 mai 2024), Vox Media (29 mai 2024), Time (27 juin 2024), Condé Nast (20 août 2024). Remarquons ainsi que, au-delà de la nécessité d’avoir accès aux contenus d’une agence de presse (AP), c’est-à-dire à sa couverture médiatique très large, tant thématique que géographique, sous la forme de dépêches factuelles et non partisanes, apparaît aussi la nécessité d’accéder à des informations plus développées et illustrées telles qu’en propose la presse magazine (publications des groupes Condé Nast et Vox), ou à des médias de lignes éditoriales variées (plutôt pro-Démocrates comme The Atlantic, pro-Républicains chez News Corp). Il reste que, même si le nombre des médias partenaires d’OpenAI – qui sont amenés donc à influer sur le contenu des réponses de son agent conversationnel – s’accroît, il reste très limité comparé à l’offre globale d’information en ligne disponible.

SI LE NOMBRE DES MÉDIAS PARTENAIRES D’OPENAI S’ACCROÎT, IL RESTE TRÈS LIMITÉ COMPARÉ À L’OFFRE GLOBALE D’INFORMATION EN LIGNE DISPONIBLE

Un autre changement de contexte à prendre en compte concerne la disponibilité des informations produites par les médias, en vue de l’utilisation des services d’IA générative comme « moteurs de réponses ». Ceux-ci créent des textes relatifs à des questions qui relèvent autant de l’information d’actualité « chaude » (par exemple, « Quelle est la situation actuelle dans la bande de Gaza ? ») que de l’information documentaire (par exemple, « Quels sont les évènements ayant conduit, depuis la création de l’État d’Israël, à la situation actuelle dans la bande de Gaza ? »). En comparaison des moteurs de recherche précédents, les moteurs de réponse doivent donc mobiliser davantage les archives des médias. Or, ces archives ne sont le plus souvent pas disponibles à la moisson des moteurs, notamment pour les plus anciennes d’entre elles. Et en miroir de ce nouveau besoin – contrarié – d’accès aux archives, les informations d’actualité elles-mêmes sont, beaucoup plus fréquemment que par le passé, placées à l’abri de paywalls (accès payant aux actualités). Ceci complique aussi la tâche des moteurs de réponse et peut obliger les entreprises d’IA à demander l’autorisation des éditeurs pour accéder à leurs informations, et à permettre à ceux dont les contenus sont les plus stratégiques de regagner un peu d’autonomie, voire de rendre les géants du numérique dépendants et renverser ainsi le processus de relations électives. Mais un tel rééquilibrage, s’il advenait, ne bénéficierait qu’à une poignée d’éditeurs, renforçant par là-même les asymétries existantes au sein du secteur médiatique.

Un moment régulateur aux effets ambigus

Notons également que, malgré l’affaiblissement du volontarisme public que marque le passage à la corégulation, celle-ci, impulsée notamment au niveau de l’Union européenne depuis la seconde moitié des années 2010, a au moins le mérite d’exister, alors que la régulation nationale faisait en grande partie défaut auparavant.

LES CRITIQUES SOUTIENNENT QUE LA CONTRIBUTION DE GOOGLE AU FONDS DE JOURNALISME EST DÉRISOIRE PAR RAPPORT AUX BÉNÉFICES QUE L'ENTREPRISE TIRE DES ARTICLES D'ACTUALITÉ RELAYÉS PLATEFORME

Et, si l’on en juge notamment par la régulation relative aux droits voisins – transposée en droit national dès la directive européenne adoptée en 2019, rappelons-le –, il semblerait qu’elle commence à porter quelques fruits, lentement mais sûrement. Après les tentatives de contractualisation directes avec les plateformes engagées par la plus influente organisation d’éditeurs, Apig, dès 2019, voire de gré à gré par ses membres les plus puissants et en particulier à nouveau Le Monde, la voie de la gestion collective des droits, pour le compte de médias de plus petite envergure et souvent très spécialisés sur le plan éditorial, semble finalement aboutir si l’on en juge par les deux annonces récentes de la société des Droits voisins de la presse (DVP) d’accords conclus avec Google (annonce du 17 octobre 2023) et Meta (annonce du 25 juin 2024). Signe que l’idée d’une forme de gestion collective de droits voisins gagne du terrain, l’Apig a confié à la Sacem la renégociation de ses accords sur les droits voisins avec Google et Meta mais aussi avec LinkedIn, Microsoft, Apple ou encore X24.

Cependant, dans les pays relevant de la tradition du copyright, les lois créant une obligation de financement des médias de la part des plateformes, comme celles de l’Australie et du Canada, ne reconnaissent pas formellement des droits voisins, car la reprise d’extraits de contenus est considérée comme relevant du fair use. Ce qui laisse le champ libre à des stratégies d’influence et de négociations très politiques pour définir les contours et le contenu de ces accords. Ainsi, la loi sur la préservation du journalisme (Journalism Preservation Act), qui a été adoptée en août 2024 dans l’État de la Californie, a été critiquée comme étant le fruit d’une négociation opaque entre Google, le gouverneur Newsom et des grands éditeurs de presse, à l’exclusion des organisations professionnelles de journalistes25.

L’INCERTITUDE JURIDIQUE AINSI CRÉÉE EST DE NATURE À DÉCOURAGER LES ENTREPRISES DE MÉDIAS DE DÉPLOYER ELLES-MÊMES DES SERVICES D’IA

Cette loi instaure un mécanisme de financement des médias sur cinq ans, pour un montant total de 250 millions de dollars visant à compenser le manque à gagner des éditeurs pour la réutilisation de leurs contenus. Toutefois, une grande partie de ces fonds provient de l’État et non des entreprises technologiques. Les critiques soutiennent que la contribution de Google au fonds de journalisme est dérisoire par rapport aux bénéfices que l'entreprise tire des articles d'actualité relayés par sa plateforme. L’accord prévoit également la création d’un programme appelé AI Accelerator, salué par Google et OpenAI, car il vise à soutenir l’adoption de l’IA générative dans les salles de rédaction26. Si les éditeurs sont favorables à cet accord qui leur apporte des ressources supplémentaires, ce n’est pas le cas des organisations professionnelles de journalistes, qui craignent de nouvelles suppressions d’emplois dans un secteur déjà sinistré. De plus, ce programme pourrait profondément renforcer la situation de vendor lock-in, où les médias et leurs employés sont forcés d’adopter des systèmes d’IA propriétaires au lieu d’explorer ou de développer des alternatives qui pourraient être plus conformes aux principes et aux valeurs journalistiques.

LES NOMBREUX ÉLÉMENTS RECENSÉS SUGGÈRENT UNE CONTINUITÉ AVEC LES CONFIGURATIONS ANTÉRIEURES, NOTAMMENT UNE CONCENTRATION AU PROFIT DES GRANDS GROUPES NUMÉRIQUES, AU DÉTRIMENT DE LA DIVERSITÉ MÉDIATIQUE

Déjà à la manœuvre dans cette initiative législative, le gouverneur Newsom a plus récemment apposé son veto, en septembre 2024, à la loi sur la sécurité de l’IA de l’État de la Californie. Ce texte visait à rendre les entreprises d’intelligence artificielle légalement responsables des dommages causés par leurs modèles27. Il fait écho à l’AI Act, édicté par le Parlement européen et le Conseil de l’Union européenne en juin 2024, et qui rend lui aussi responsables les fournisseurs de systèmes d’IA (providers), à moins que les intermédiaires assurant leur déploiement (deployers) aient significativement modifié le système d’origine (voir La rem n°69-70, p.11). L’incertitude juridique ainsi créée est de nature à décourager les entreprises de médias de déployer elles-mêmes des services d’IA qui seraient adaptés à leurs besoins spécifiques et, de façon plus générale, aux impératifs de l’activité journalistique, avec pour autre conséquence de renforcer la domination des géants du numérique, seuls à même d’assumer les risques liés à la mise au point de services d’IA28.

En conclusion, ces développements récents soulèvent des questions majeures concernant l’avenir des médias. Les géants du numérique, en position dominante, sont en mesure d’imposer leurs conditions aux éditeurs, tout en favorisant des partenariats sélectifs dans le domaine de l’IA, ce qui refléterait alors une asymétrie persistante dans les rapports de force entre ces deux catégories d’acteurs, mais également entre les médias eux-mêmes. S’il est prématuré d’en tirer des conclusions, les nombreux éléments recensés suggèrent une continuité avec les configurations antérieures, notamment une concentration au profit des grands groupes numériques, au détriment de la diversité médiatique. Le défi sera d’équilibrer ces relations à travers des politiques publiques adaptées, aussi bien en France que dans d’autres contextes nationaux, afin de préserver le pluralisme et l’indépendance des médias dans un paysage numérique en pleine mutation.

Sources :

  1. Dreyfus Louis, Fenoglio Jérôme, « Intelligence artificielle : un accord de partenariat entre "Le Monde" et OpenAI », fr, 13 mars 2024.
  2. Alcaraz, Marina, « OpenAI : pas d’accord global en vue avec les médias français », fr, 16 septembre 2024.
  3. « L’Apig étend le mandat de la Sacem pour renégocier les droits voisins avec Google et Meta », com, 10 avril 2024.
  4. Fox Nick, « Organizing the world’s information: where does it all come from? », google, December 3, 2020.
  5. Loveluck Benjamin, « Internet, une société contre l’État ? Libéralisme informationnel et économies politiques de l’auto-organisation en régime numérique », Réseaux, 2015, 192/4, 235-270.
  6. Description du service citée par Rebillard Franck, « Du traitement de l’information à son retraitement. La publication de l’information journalistique sur l’internet », Réseaux, 2006, 137/3, 29-68.
  7. Lamoureux Samuel, Roy Jean-Hugues, « De la capture à l’asservissement : Comment la machine Meta remodèle les pratiques des journalistes francophones », tic&société, 2023, 17, n° 1-2, p. 195-229. https://doi.org/10.4000/11r9d
  8. Rebillard Franck, Smyrnaios Nikos, « Entre coopération et concurrence : les relations entre infomédiaires et éditeurs de contenus d’actualité », Concurrences, 2011, n° 3, n° 37281.
  9. Rebillard Franck, Smyrnaios Nikos, « Quelle "plateformisation" de l’information ? Collusion socioéconomique et dilution éditoriale entre les entreprises médiatiques et les infomédiaires de l’Internet », tic&société, 2019, 13, n° 1-2, p. 247-293. https://doi.org/10.4000/ticetsociete.4080
  10. Smyrnaios Nikos, Rebillard Franck, « L’actualité selon L’emprise du principal moteur de recherche sur l’information en ligne », Communication & langages, 2009, n° 160. p. 95-109.
  11. Thibout Charles, « Les ancrages nationaux d’une multinationale : Recrutements et adaptation de Google au champ du pouvoir français (2002-2012) », Réseaux, 2024, 244/3, p. 187-224.
  12. Vauchez Antoine (dir.), Le moment régulateur. Naissance d’une contre-culture de gouvernement, Presses de Sciences Po, 2024.
  13. Smyrnaios Nikos, Papaevangelou Charis, 2023, « Réguler la dépendance. Les accords sur les droits voisins entre Alphabet-Meta et la presse française », Balisages […], 2023, n° 6. https://doi.org/10.35562/balisages.1055
  14. Rosemain Mathieu, « Exclusive: Google’s $76 million deal with French publishers leaves many outlets infuriated », com, February 13, 2021
  15. Papaevangelou Charis, Smyrnaios Nikos, « Regulating dependency: The political stakes of online platforms’ deals with French publishers », Anàlisi: Quaderns de Comunicació i Cultura, 29 juin 2023, 68, p. 117-134. https://doi.org/10.5565/rev/analisi.3546
  16. Autorité de la concurrence, décision 24-D-03 du 15 mars 2024, p. 37.
  17. Cette technique consiste, en sus des données « génériques » utilisées pour élaborer le modèle fondateur d’IA, à se servir de données plus « concrètes », comme les résultats d’une requête auprès d’un moteur de recherche ou dans la base de données d’un média, afin d’améliorer les réponses du service en temps réel.
  18. Smyrnaios Nikos, Rebillard Franck, « En France comme en Australie, l’information à l’épreuve de sa plateformisation », INA, La revue des médias, 24 février 2021.
  19. Sire Guillaume, « Inclusion exclue : le code est un contrat léonin. Enquête sur la valeur technique et juridique du protocole robots.txt », Réseaux, 2015, 189/1, 187-214.
  20. « Who blocks OpenAI, Google AI and Common Crawl ? », Palewire, re.
  21. Autorité de la concurrence, décision 24-D-03 du 15 mars 2024, p. 40.
  22. Simon Felix M., « Escape Me If You Can: How AI Reshapes News Organisations’ Dependency on Platform Companies », Digital Journalism, November 29, 2023, 12(2), p. 149–170. https://doi.org/10.1080/21670811.2023.2287464
  23. Brown Pete, « Licensing deals, litigations raise raft of familiar questions in fraught world of platforms and publishers », Columbia Journalism Review, May 22, 2024.
  24. « Droits voisins : la presse quotidienne confie à la Sacem la renégociation avec Meta et Google », la-croix.com, 9 avril 2024.
  25. Pearce Matt, « A deep dive into Google’s shady (and shoddy) California journalism deal », substack.com, September 13, 2024.
  26. Merchant Brian, « How a bill meant to save journalism from big tech ended up boosting AI and bailing out Google instead », com, August 23, 2024.
  27. Lesne Corine, « Le gouverneur de Californie met son veto à la loi sur la sécurité de l’IA », fr, 30 septembre 2024.
  28. Helberger Natali, « FutureNewsCorp, or how the AI Act changed the future of news », Computer Law & Security Review, April 2024, vol. 52, art. 105915. https://doi.org/10.1016/j.clsr.2023.105915

Charis Papaevangelou, Franck Rebillard, Nikos Smyrnaios