Avis relatif au fonctionnement concurrentiel du secteur de l’intelligence artificielle générative

Les géants du numérique verrouillent déjà le secteur de l’intelligence artificielle générative

Le 8 février 2024, l’Autorité de la concurrence a décidé de s’autosaisir pour avis sur « le fonctionnement concurrentiel du secteur de l’IA générative et de lancer une consultation publique, lui permettant de collecter le point de vue d’une quarantaine d’acteurs et d’une dizaine d’associations d’acteurs ». Cet avis analyse le secteur et la concurrence sur le marché en développement de l’IA générative, et les stratégies des grands acteurs numériques pour renforcer leur position en amont de la chaîne de valeur, c’est-à-dire dans « la conception, l’entraînement et la spécialisation des grands modèles de langage ». L’Autorité de la concurrence s’intéresse notamment aux « pratiques mises en œuvre par les acteurs déjà présents sur l’infrastructure d’informatique en nuage (cloud) et aux problématiques liées à l’accès à ces infrastructures, à la puissance de calcul, aux données et à une main-d’œuvre qualifiée », ainsi qu’aux « prises de participations et partenariats des grands acteurs du numérique, notamment dans des entreprises innovantes spécialisées dans l’IA générative ».

Sans surprise, le secteur de l’IA générative présente déjà de nombreuses barrières à l’entrée, notamment dues à la nécessité d’une puissance de calcul considérable et à l’accès à de vastes ensembles de données. Pour développer des modèles dits « de fondation », dont font partie les grands modèles de langage comme ChatGPT, les entreprises doivent nécessairement s’équiper, à prix d’or, de processeurs graphiques avancés, fournis par Nvidia, ou d’accélérateurs d’IA comme les unités de traitement tensoriel – en anglais, Tensor Processing Unit (TPU) – de Google. La très forte demande mondiale de puissance de calcul, d’une part, et d’accès à des données, d’autre part, augmente le prix de ces ressources autant qu’elle diminue leur disponibilité. Si quelques grands acteurs du secteur, tels Meta et Samsung, disposent d’infrastructures internes suffisantes, la majorité, incapable de procéder à de tels investissements matériels, doit nécessairement accéder à des ressources via le cloud, dont le marché est déjà concentré entre les mains de quelques grands acteurs du numérique. L’entraînement des modèles d’intelligence artificielle générative nécessite, en outre, un très grand volume de données, souvent issues de sources publiques. Le traitement et le nettoyage de ces données représentent un défi majeur, alors que l’accès à ces données suscite de nombreux contentieux juridiques, comme celui opposant le New York Times à OpenAI et Microsoft. De plus, parce que tous les acteurs de l’IA ont accès aux mêmes données publiques, « les données propriétaires détenues par un petit nombre d’acteurs prennent plus de poids ». Les compétences techniques de très haut niveau requises en apprentissage automatique, des salaires très attractifs et « l’expérience empirique qui ne peut être acquise qu’en travaillant avec ces modèles » constituent également une certaine forme de barrière à l’entrée. L’ensemble de ces ressources, à la fois techniques et humaines, engendre des besoins financiers considérables, avec une multiplication par six des investissements entre 2022 et 2023.

Pour limiter ces barrières à l’entrée, « des évolutions techniques ou organisationnelles et certaines politiques publiques » pourraient être mises en œuvre, explique l’Autorité de la concurrence. Certaines solutions, comme l’accès à des supercalculateurs publics en échange de contributions à la science ouverte, peuvent aider à réduire les barrières à l’entrée pour certains acteurs, notamment du monde de la recherche. Des innovations technologiques, telles que les modèles de taille réduite ou encore l’utilisation de données synthétiques (c’est-à-dire des données générées par une IA), visent également à atténuer les besoins en calcul et en données. Enfin, l’approche open source permet à de nombreux développeurs de contribuer à l’amélioration « de la connaissance globale sur cette technologie », même si cette dernière recouvre « des situations très variables, allant de celles où seuls les poids du modèle sont rendus publics (open-weights), la plus répandue, aux modèles totalement ouverts où l’ensemble du code, de l’architecture, des données d’apprentissage, des poids et du processus d’apprentissage sont mis à disposition ».

L’Autorité identifie de très nombreux risques d’abus au niveau des composants informatiques ou des risques de verrouillage par les grands fournisseurs de services cloud ; des préoccupations de concurrence concernant l’accès aux données, mais aussi des préoccupations pour accéder à une main-d’œuvre qualifiée ; des risques concurrentiels liés aux modèles en accès libre ou encore liés à la présence d’entreprises sur plusieurs marchés distincts. Il s’avère ainsi que « le secteur de l’IA générative est marqué par d’importantes barrières à l’entrée susceptibles de favoriser les grands acteurs du numérique bénéficiant par ailleurs d’avantages liés à leurs activités sur d’autres marchés numériques ». Google, Microsoft, Meta, Amazon, Apple tirent un avantage concurrentiel considérable grâce à leur accès privilégié en matière de puissance de calcul et d’accès aux données.

Avis relatif au fonctionnement concurrentiel du secteur de l’intelligence artificielle générative, Autorité de la concurrence, 28 juin 2024.