À la Maison Blanche, la régulation de l'IA cale sur fond de récits contradictoires

Pourquoi Donald Trump a-t-il renoncé à signer un décret très attendu sur l'intelligence artificielle (IA)? Plusieurs récits irriguent vendredi Washington pour interpréter ce nouvel épisode des difficultés de la Maison Blanche à s'accorder sur des garde-fous pour cette technologie de plus en plus puissante.

La plupart des analyses pointent vers l'ancien conseiller David Sacks, toujours influent malgré son départ de la Maison Blanche en mars.

Selon Politico, cet investisseur tech de renom, proche d'Elon Musk, aurait appelé le président jeudi matin pour le convaincre qu'un décret prévoyant un examen sécuritaire des modèles d'IA avant leur diffusion ralentirait l'innovation américaine face à la Chine.

Les responsables de la Maison Blanche croyaient pourtant avoir rallié David Sacks à l'équilibre du décret, peu contraignant. Mais l'ex-conseiller aurait exprimé ses réserves la veille, inquiet que l'examen volontaire ne devienne un jour obligatoire, selon Politico.

"Nous sommes en tête face à la Chine (...) et je ne veux rien faire qui risque de compromettre cette avance", avait justifié jeudi Donald Trump, en annulant la signature.

Le Washington Post a avancé un récit plus large: des appels de dernière minute de David Sacks, d'Elon Musk et de Mark Zuckerberg, le patron de Meta, auraient convaincu le président.

"C'est faux. (...) le président ne m'a parlé qu'après avoir refusé de signer", a démenti Musk sur X. Meta a également contesté, affirmant que Zuckerberg n'avait parlé au président qu'a posteriori.

Aucun de ces récits ne mentionne les dirigeants de Google, OpenAI ou Anthropic, dont les modèles auraient été concernés au premier chef. Leurs dirigeants, favorables à une régulation minimale, étaient invités à la signature, et l'absence de plusieurs d'entre eux constituerait un autre facteur, selon certains médias.

Un tel décret, s'il était finalement signé, acterait un virage radical pour l'administration Trump, jusqu'ici hostile à toute régulation de l'IA.

Premier bilan de Mythos

Mais l'enjeu sécuritaire a changé la donne: Washington s'inquiète de la capacité des récents modèles à exploiter des failles informatiques à une vitesse inédite, ouvrant la voie à des attaques contre des infrastructures critiques (réseaux électriques, banques, administrations).

Début mai, le gouvernement a annoncé des accords avec Google, Microsoft et xAI pour évaluer les capacités de leurs modèles avant leur mise sur le marché.

Ces accords et le projet de décret ont notamment été déclenchés par Mythos, un modèle d'Anthropic, dont l'existence a été dévoilée début avril mais dont l'accès est limité à un cercle de partenaires qui s'en servent pour renforcer leur cybersécurité.

Début mai, David Sacks avait jugé légitimes les inquiétudes suscitées par Mythos, tout en accusant les partisans d'une régulation d'exploiter la situation.

"Les approbations" gouvernementales avant mises sur le marché "résolvent un problème qui n'existait pas vraiment", a-t-il déclaré dans son podcast All-In, les entreprises d'IA gardant déjà leurs plus puissants modèles hors de portée du public.

Selon lui, des "idéologues de l'IA ou des catastrophistes" se servent de Mythos pour "créer un appareil administratif permanent à Washington".

La capacité de l'IA à découvrir des failles "monte depuis six mois de manière linéaire, prévisible, chez tout le monde en même temps", a déclaré mi-mai Arthur Mensch, le patron du laboratoire français Mistral AI, devant des députés. Ironisant, sans nommer Anthropic, sur un "concurrent américain qui sait très bien faire du +marketing de la peur+".

Vendredi, Anthropic a publié un premier bilan du consortium testant Mythos, baptisé Glasswing.

Mythos et ses quelque 50 partenaires, essentiellement américains, auraient identifié plus de 10.000 vulnérabilités graves ou critiques "dans les logiciels les plus stratégiques de la planète", et près de 6.200 dans des projets "open source" (dont le code de programmation est en accès libre), selon Anthropic.

Le puissant laboratoire d'IA de San Francisco cite les bilans de plusieurs partenaires réputés, comme la fondation Mozilla, qui dit avoir corrigé 271 failles dans son navigateur Firefox, dix fois plus qu'avec le modèle précédent.

Pour l'AI Security Institute, une institution britannique, Mythos est le premier modèle à venir à bout de ses simulations d'attaques.

Anthropic, en conflit avec l'administration Trump, assume pour l'heure de décider seul à qui accorder cet "avantage asymétrique" en cybersécurité.

L'entreprise indique désormais vouloir l'étendre à des "gouvernements américain et alliés", sans citer de pays, poussant pour une coordination entre État et industrie qui divise toujours la Maison Blanche.