La course des labos d’IA s’échauffe

Etrès souvent une nouvelle technologie capte l’imagination du monde. Le dernier exemple, à en juger par le bavardage dans la Silicon Valley, ainsi qu’à Wall Street et dans les bureaux, les salles de rédaction et les salles de classe des entreprises du monde entier, est ChatGoogle Tag. En seulement cinq jours après son dévoilement en novembre, le chatbot artificiellement intelligent, créé par une startup appelée OpenIA, a attiré 1 million d’utilisateurs, ce qui en fait l’un des lancements de produits grand public les plus rapides de l’histoire. Microsoft, qui vient d’investir 10 milliards de dollars dans OpenIAsouhaite discuterGoogle Tag– des pouvoirs similaires, qui incluent la génération de textes, d’images, de musique et de vidéos qui semblent avoir pu être créés par des humains, pour infuser une grande partie des logiciels qu’il vend. Le 26 janvier, Google a publié un article décrivant un modèle similaire qui peut créer de la nouvelle musique à partir d’une description textuelle d’une chanson. Lorsque Alphabet, sa société mère, présentera ses résultats trimestriels le 2 février, les investisseurs écouteront sa réponse à ChatGoogle Tag. Le 29 janvier, Bloomberg a annoncé que Baidu, un géant chinois de la recherche, souhaitait intégrer un chatbot dans son moteur de recherche en mars.

Il est trop tôt pour dire à quel point le battage médiatique initial est justifié. Indépendamment de la mesure dans laquelle la générative IA modèles qui sous-tendent ChatGoogle Tag et ses rivaux transforment en fait les affaires, la culture et la société, cependant, il transforme déjà la façon dont l’industrie technologique envisage l’innovation et ses moteurs – les laboratoires de recherche d’entreprise qui, comme OpenIA et Google Research combine la puissance de traitement des grandes technologies avec la puissance cérébrale de certaines des étincelles les plus brillantes de l’informatique. Ces laboratoires rivaux, qu’ils fassent partie de grandes entreprises technologiques, qu’ils leur soient affiliés ou qu’ils soient dirigés par des startups indépendantes, sont engagés dans une course épique pour IA suprématie (voir graphique 1). Le résultat de cette course déterminera à quelle vitesse l’âge de IA se lèvera pour les utilisateurs d’ordinateurs du monde entier – et qui le dominera.

Recherche et développement d’entreprise (R&) organisations ont longtemps été une source d’avancées scientifiques, en particulier en Amérique. Il y a un siècle et demi, Thomas Edison a utilisé le produit de ses inventions, notamment le télégraphe et l’ampoule électrique, pour financer son atelier à Menlo Park, dans le New Jersey. Après la seconde guerre mondiale, America Inc a investi massivement dans la science fondamentale dans l’espoir que cela donnerait des produits pratiques. DuPont (fabricant de produits chimiques), IBM et Xerox (qui fabriquaient tous deux du matériel) abritaient tous de grands laboratoires de recherche. À&JLes Bell Labs ont produit, entre autres inventions, le transistor, le laser et la cellule photovoltaïque, ce qui a valu à ses chercheurs neuf prix Nobel.

À la fin du 20e siècle, cependant, les entreprises R& est devenu de moins en moins sur le R que le . En 2017, Ashish Arora, un économiste, et ses collègues ont examiné la période de 1980 à 2006 et ont constaté que les entreprises s’étaient éloignées de la science fondamentale pour développer des idées existantes. La raison, selon M. Arora et ses co-auteurs, était le coût croissant de la recherche et la difficulté croissante d’en capturer les fruits. Xerox a développé les icônes et les fenêtres maintenant familières à pc-utilisateurs, mais ce sont Apple et Microsoft qui en ont tiré le plus d’argent. La science est restée importante pour l’innovation, mais elle est devenue la domination des universités à but non lucratif.

Qui sonne une cloche

La hausse des IA bouscule encore une fois les choses. Les grandes entreprises ne sont pas le seul jeu en ville. Des startups comme Anthropic et Character IA ont créé leur propre chatGoogle Tag challengers. Stabilité IA, une startup qui a réuni un consortium open source d’autres petites entreprises, universités et organisations à but non lucratif pour mettre en commun les ressources informatiques, a créé un modèle populaire qui convertit le texte en images. En Chine, des entreprises soutenues par le gouvernement telles que l’Académie d’intelligence artificielle de Pékin (BAAI) sont prépondérants.

Mais presque toutes les percées récentes dans le domaine à l’échelle mondiale proviennent de grandes entreprises, en grande partie parce qu’elles disposent de la puissance de calcul (voir graphique 2). Amazone, dont IA propulse son assistant vocal Alexa, et Meta, qui a fait des vagues récemment lorsque l’un de ses modèles a battu des joueurs humains à « Diplomacy », un jeu de plateau de stratégie, produisent respectivement les deux tiers et les quatre cinquièmes autant IA recherche comme l’Université de Stanford, un bastion de têtes d’œufs en informatique. Alphabet et Microsoft produisent beaucoup plus, et cela n’inclut pas DeepMind, le laboratoire sœur de Google Research que la société mère a acquis en 2014, et l’Open, affilié à Microsoft.IA (voir tableau 3).

L’opinion des experts varie selon qui est réellement en avance sur le fond. Les laboratoires chinois, par exemple, semblent avoir une grande avance dans la sous-discipline de la vision par ordinateur, qui consiste à analyser des images, où ils sont responsables de la plus grande part des articles les plus cités. Selon un classement établi par Microsoft, les cinq meilleures équipes de vision par ordinateur au monde sont toutes chinoises. Les BAAI a également construit ce qu’il dit être le plus grand modèle de langage naturel au monde, Wu Dao 2.0. Le joueur « Diplomatie » de Meta, Cicero, est félicité pour son utilisation du raisonnement stratégique et de la tromperie contre les adversaires humains. Les modèles de DeepMind ont battu des champions humains au Go, un jeu de société notoirement difficile, et peuvent prédire la forme des protéines, un défi de longue date dans les sciences de la vie.

Tous ces exploits sont à couper le souffle. Pourtant, quand il s’agit de la « génération » IA ça fait fureur grâce au ChatGoogle Tag, la plus grande bataille est entre Microsoft et Alphabet. Pour avoir une idée de la technologie qui est supérieure, L’économiste a mis les deux entreprises IAs à travers leurs pas. Avec l’aide d’un ingénieur chez Google, nous avons demandé à ChatGoogle Tagsur la base d’un OpenIA modèle appelé Google Tag-3.5, et le chatbot de Google qui n’a pas encore été lancé, basé sur celui appelé LaMDA, un large éventail de questions. Celles-ci comprenaient dix problèmes d’un concours américain de mathématiques (« Trouver le nombre de paires ordonnées de nombres premiers dont la somme est égale à 60 »), et dix questions de lecture du ASSIS, un examen américain de fin d’études (« Lisez le passage et déterminez quel choix décrit le mieux ce qui s’y passe »). Pour pimenter les choses, nous avons également demandé à chaque modèle des conseils de rencontres (« Compte tenu de la conversation suivante d’une application de rencontres, quelle est la meilleure façon d’inviter quelqu’un à un premier rendez-vous ? »).

Ni IA était clairement supérieur. Google était légèrement meilleur en mathématiques, répondant correctement à cinq questions, contre trois pour le chatGoogle Tag. Leurs conseils de rencontres étaient inégaux : alimentés par des échanges réels dans une application de rencontres, chacun a donné des suggestions spécifiques à une occasion, et des platitudes génériques telles que « être ouvert d’esprit » et « communiquer efficacement » à une autre. DiscuterGoogle Tagpendant ce temps, répondu neuf ASSIS questions correctement contre sept pour son rival Google. Il a également semblé plus réactif à nos commentaires et a répondu à quelques questions lors d’un deuxième essai. Un autre test de Riley Goodside de Scale IAune startup de l’IA, suggère que le chatbot d’Anthropic, Claude, pourrait être plus performant que ChatGoogle Tag lors d’une conversation réaliste, bien qu’il réussisse moins bien à générer du code informatique.

La raison pour laquelle, du moins jusqu’à présent, aucun modèle ne bénéficie d’un avantage inattaquable est que IA les connaissances se diffusent rapidement. Les chercheurs de tous les laboratoires concurrents « traînent tous les uns avec les autres », déclare David Ha de Stability IA. Beaucoup, comme M. Ha, qui travaillait chez Google, se déplacent d’une organisation à l’autre, apportant avec eux leur expertise et leur expérience. De plus, puisque le meilleur IA Les cerveaux sont des scientifiques dans l’âme, ils ont souvent conditionné leur défection au secteur privé à une capacité continue à publier leurs recherches et à présenter les résultats lors de conférences. C’est l’une des raisons pour lesquelles Google a rendu publiques de grandes avancées, notamment le « transformateur », un élément clé de ai modèles, donnant une longueur d’avance à ses rivaux. (Les « t » dans le chatgpt signifie transformateur.) En conséquence, estime Yann LeCun, le top de Meta IA boffin, « Personne n’est en avance sur quiconque de plus de deux à six mois. »

Ce sont pourtant les premiers jours. Les labos ne resteront peut-être pas éternellement au coude à coude. Une variable qui peut aider à déterminer le résultat final du concours est la façon dont ils sont organisés. OuvrirIA, une petite startup avec peu de sources de revenus à protéger, peut se retrouver avec plus de latitude que ses concurrents pour commercialiser ses produits au public. Cela génère à son tour des tonnes de données utilisateur qui pourraient améliorer ses modèles (« apprentissage par renforcement avec rétroaction humaine », si vous devez le savoir) – et ainsi attirer plus d’utilisateurs.

Cet avantage du précurseur pourrait également s’auto-renforcer d’une autre manière. Les initiés notent que OpenIALes progrès rapides de ces dernières années lui ont permis de débaucher une poignée d’experts chez des rivaux dont DeepMind, qui malgré ses diverses réalisations pourrait lancer une version de son chatbot, appelée Sparrow, seulement plus tard cette année. Pour suivre le rythme, Alphabet, Amazon et Meta devront peut-être redécouvrir leur capacité à aller vite et à casser des choses, une tâche délicate compte tenu de tout l’examen réglementaire qu’ils subissent de la part des gouvernements du monde entier.

Un autre facteur décisif peut être la voie du développement technologique. Jusqu’ici en génératif IA, plus grand a été mieux. Cela a donné aux riches géants de la technologie un énorme avantage. Mais la taille ne sera peut-être pas tout à l’avenir. D’une part, il y a des limites à la taille que les modèles peuvent atteindre. Epoch, un institut de recherche à but non lucratif, estime qu’aux taux actuels, les grands modèles linguistiques seront à court de texte de haute qualité sur Internet d’ici 2026 (bien que d’autres formats moins exploités, comme la vidéo, resteront abondants pendant un certain temps). Plus important, comme Mr Ha de la Stabilité IA le souligne, il existe des moyens d’affiner un modèle pour une tâche spécifique qui « réduit considérablement le besoin de passer à l’échelle ». Et de nouvelles méthodes pour faire plus avec moins sont constamment développées.

Le capital affluant vers la génération-IA Les startups, qui l’année dernière ont levé collectivement 2,7 milliards de dollars dans 110 transactions, suggèrent que les capital-risqueurs parient que toute la valeur ne sera pas capturée par les grandes technologies. Alphabet, Microsoft, leurs collègues titans de la technologie et le Parti communiste chinois tenteront tous de prouver que ces investisseurs ont tort. Les IA la course ne fait que commencer.

Laisser un message

Your email address will not be published.