OpenAI o3 : un pas de plus vers l’intelligence artificielle générale
Coup de tonnerre dans le domaine de l’intelligence artificielle : OpenAI, avec son tout nouveau modèle « o3 » annoncé le 20 décembre 2024, vient de repousser les limites connues en réalisant une performance spectaculaire sur le test ARC-AGI, un des benchmarks les plus exigeants pour évaluer les capacités adaptatives des IA. Alors que pour les non-experts, tout cela peut paraitre anodin, c’est pourtant le signal d’une nouvelle ère où tout est possible, et plus encore… Je vous offre un décryptage pas à pas du sujet et des concepts qui l’entourent pour l’occasion !
De ChatGPT à o3 : la route vers l’intelligence
Depuis la sortie de ChatGPT en novembre 2022, les capacités des modèles d’intelligence artificielle générative ont connu une progression fulgurante. ChatGPT, le premier à populariser les IA conversationnelles, a ouvert la voie à une révolution technologique sans précédent. Les mois qui ont suivi ont vu une explosion du nombre de modèles de grande taille (LLM), transformant le paysage technologique à une vitesse vertigineuse. En seulement deux ans, ces modèles ont trouvé des applications dans des domaines aussi variés que la santé, l’éducation, et le commerce en ligne.
À la fin de 2024, on estime qu’il existe plus de 200 modèles LLM actifs à l’échelle mondiale, développés par des acteurs majeurs comme OpenAI, Google DeepMind ou Anthropic, ainsi que par des initiatives open source. Ces modèles, bien que variés dans leurs architectures et usages, partagent un objectif commun : repousser les limites de ce que l’intelligence artificielle peut accomplir. Si l’on inclut les modèles plus petits rendus disponibles par des plateformes comme Hugging Face, on recense plus de 1,5 million de variantes, témoignant de l’enthousiasme mondial pour cette technologie.
Cette croissance exponentielle illustre le potentiel incroyable des LLM à répondre à des problématiques complexes et à s’adapter à des environnements variés. Par exemple, dans le domaine médical, ces modèles permettent de générer des résumés automatisés de dossiers ou d’assister les professionnels dans leurs diagnostics. Dans l’éducation, ils offrent des solutions d’apprentissage personnalisé à grande échelle.
Mais cette expansion ne va pas sans poser des questions cruciales. Les défis éthiques, environnementaux et sociétaux sont nombreux : quel est le coût énergétique de ces technologies ? Qui en contrôle l’accès ? Et surtout, comment garantir qu’elles profitent au plus grand nombre ? Alors que nous explorons ces questions, une chose est claire : le chemin parcouru entre ChatGPT et o3 est le signe d’une avancée spectaculaire, mais ce n’est que le début d’une transformation encore plus profonde.
ARC-AGI : un benchmark pour l’intelligence adaptative
Pour comprendre les défis auxquels sont confrontés les modèles d’IA actuels, il faut s’arrêter sur l’importance des benchmarks, et plus particulièrement sur ARC-AGI. Ces tests jouent un rôle central dans l’évaluation des capacités des modèles, en mesurant leur aptitude à s’adapter à des situations nouvelles. Pour les non-initiés, un benchmark est semblable à un examen standardisé pour les élèves, conçu pour comparer les performances. Tout comme un test scolaire peut révéler les forces et les faiblesses des apprenants, ARC-AGI pose des défis uniques aux IA pour tester leur capacité à résoudre des problèmes qu’elles n’ont jamais rencontrés. En ce sens, il constitue une étape essentielle vers la création d’une intelligence artificielle capable de rivaliser avec les capacités humaines.
ARC-AGI, reconnu comme le benchmark de référence dans le domaine, teste la capacité des systèmes d’intelligence artificielle à s’adapter à des tâches inédites. Contrairement à d’autres benchmarks plus traditionnels, il présente des problèmes complexes mais intuitifs pour les humains, comme identifier des motifs cachés ou compléter une suite logique. Ces problèmes exigent des IA une compréhension abstraite et adaptative, au-delà de la simple reconnaissance de modèles appris. Ce niveau d’exigence permet de mesurer l’intelligence adaptative des IA, une qualité cruciale pour progresser vers une intelligence générale.
Le test ARC-AGI (Abstraction and Reasoning Corpus for Artificial General Intelligence) est conçu pour évaluer la capacité des IA à généraliser et à résoudre des problèmes inédits. Contrairement à d’autres benchmarks saturés, il se concentre sur des tâches difficiles pour les machines mais triviales pour les humains. Depuis 2020, les progrès des modèles GPT sur ce test étaient limités, avec un score initial de 0 % pour GPT-3 et de seulement 5 % pour GPT-4o en 2024.
Une tâche typique d’ARC-AGI peut inclure l’identification de motifs visuels manquants dans une grille ou la découverte de relations logiques complexes à partir d’exemples. Pour un humain, ces problèmes reposent sur une intuition naturelle et une capacité à généraliser rapidement. Pour une IA, cela exige une combinaison complexe de raisonnement abstrait, d’analyse des données d’entrée et de création de réponses adaptées. Ces compétences, cruciales pour des applications comme la conduite autonome ou la robotique, illustrent pourquoi les benchmarks comme ARC-AGI sont fondamentaux pour l’évolution de l’IA.
Le modèle o3 a changé la donne en atteignant un score de 75,7 % sur l’ensemble semi-privé avec une configuration de calcul élevée (mais conforme à la limite de coût de 10 000 $ de l’ARC Prize) et un score impressionnant de 87,5 % dans une configuration de calcul plus intensive. Selon les experts, cette avancée marque un tournant dans la progression vers des systèmes d’IA généralisables (à lire ici : ARC Prize).
Pour les puristes, une petite précision quand même pour modérer ces propos. Bien que ARC-AGI ait réussi à devenir un benchmark clé, il est important de rappeler qu’il n’est pas universellement accepté comme mesure de l’intelligence générale. Des benchmarks comme SuperGLUE ou MMLU (Massive Multitask Language Understanding), qui testent des capacités variées, sont également utilisés dans le domaine. SuperGLUE comprend des tâches variées telles que la résolution de coréférences et le questionnement à choix multiple. Une description détaillée et les ressources associées sont disponibles sur le site officiel. Et MMLU évalue les modèles sur 57 sujets académiques, allant des mathématiques à la philosophie, en passant par le droit et la médecine.
Une évolution qualitative des modèles IA
Ce résultat illustre un saut qualitatif spectaculaire dans les capacités de l’intelligence artificielle. Pour la première fois, un modèle comme o3 a montré sa capacité à s’adapter à des tâches qu’il n’avait jamais rencontrées auparavant, tout en combinant des connaissances préexistantes pour créer de nouvelles solutions. En comparaison, les modèles précédents, tels que GPT-4o, atteignaient difficilement 5 % sur le test ARC-AGI en 2024, évoquant leur limite à généraliser au-delà des données d’entraînement. Cette rupture est ce qui distingue o3 et marque une avancée significative vers des IA plus flexibles et générales.
La capacité d’o3 repose sur une stratégie innovante appelée recherche active et adaptative. Inspirée par des techniques comme la recherche Monte-Carlo AlphaZero, cette méthode permet à l’IA d’explorer un espace immense de solutions potentielles, tout en affinant ses réponses au fur et à mesure. La recherche Monte-Carlo AlphaZero, c’est une méthode où un programme d’intelligence artificielle apprend à jouer à des jeux en testant plein de coups possibles (comme des essais virtuels), tout en s'améliorant grâce à un système d’apprentissage qui lui permet de reconnaître les meilleures stratégies au fil du temps. Imaginez un joueur d’échecs planifiant ses coups plusieurs tours à l’avance, à partir de millions de scénarios possibles : c’est ainsi qu’o3 opère dans son espace de programmes en langage naturel.
Un des concepts-clés ici est celui des chaînes de pensée (Chains of Thought). Dans ce modèle, l’IA décompose chaque problème en une série d’étapes logiques. Chaque étape est testée, ajustée et combinée pour produire une réponse finale cohérente. Cette approche donne à o3 une capacité unique à raisonner de manière adaptative et à créer des solutions dynamiques, même lorsque les données précédentes ne suffisent pas à elles seules.
Ce n’est pas qu’un simple progrès technique. Cette capacité à s’adapter transforme la manière dont les IA pourront être appliquées à des problèmes concrets. Prenez l’exemple de la santé : un modèle comme o3 pourrait générer des protocoles de traitement personnalisés pour des maladies rares en analysant les données de chaque patient. En robotique, cette même capacité permettrait à des systèmes d’évoluer dans des environnements inconnus, en improvisant des solutions en temps réel.
En ouvrant la voie à une intelligence dynamique et généralisée, o3 ne se contente pas de répondre à des benchmarks. Il démontre qu’il est possible d’atteindre une qualité d’intelligence autrefois considérée comme exclusivement humaine, jetant les bases pour des applications bien au-delà des limites actuelles.
Les coûts et l’efficacité en question
Au-delà des performances techniques impressionnantes d’o3, il est indispensable d’évaluer l’impact global de ces avancées sur notre société et notre planète. Si les modèles comme o3 incarnent le potentiel extraordinaire des technologies émergentes, ils ne peuvent être dissociés de leur coût énergétique et social, qui soulève des interrogations majeures sur leur durabilité et leur accessibilité.
Les configurations de calcul intensives requises par o3 consomment des quantités massives d’énergie, souvent issues de sources non renouvelables. Chaque tâche accomplie par le modèle contribue à une empreinte carbone qui, cumulée à l’échelle mondiale, pourrait contredire les objectifs climatiques ambitieux fixés par les gouvernements et les entreprises. Cette réalité oblige les acteurs du secteur à adopter une démarche proactive en investissant dans des infrastructures plus durables, basées sur les énergies renouvelables, et en développant des architectures IA plus sobres en ressources.
Mais cela ne s’arrête pas là. La production des matériels nécessaires, comme les processeurs haute performance, entraîne des impacts collatéraux, notamment en matière d’exploitation minière et de gestion des déchets électroniques. Ces aspects exigent une réflexion sur le cycle de vie complet des technologies IA, au-delà de leur simple phase opérationnelle.
Sur le plan social, le développement de modèles comme o3 soulève des questions d’équité. À qui profite réellement cette technologie ? Les coûts actuels rendent son utilisation inaccessible pour la majorité des pays en développement, amplifiant les disparités technologiques déjà existantes. Cette fracture numérique pourrait se transformer en un fossé économique, dans lequel seules les nations et entreprises les mieux dotées pourraient exploiter pleinement les bénéfices de l’IA avancée.
L’automatisation croissante des tâches autrefois réalisées par des humains pose également la question de l’emploi. Si des modèles comme o3 permettent de résoudre des problèmes d’une complexité inédite, ils risquent également de redéfinir les compétences requises sur le marché du travail. Les emplois les plus standardisés pourraient disparaître, créant une urgence : celle d’investir massivement dans la requalification et le développement de compétences adaptées à cette nouvelle réalité technologique.
Ces enjeux ne doivent pas être vus comme des obstacles, mais comme des opportunités pour concevoir une IA véritablement inclusive. En intégrant des principes de responsabilité sociétale (RSE), il est possible d’imaginer un avenir où les bénéfices de l’IA sont partagés équitablement, sans compromettre l’équilibre environnemental. Cela passe par la conception de politiques publiques favorisant l’accès inclusif aux technologies IA. Mais cela passe également par la collaboration internationale pour garantir une diffusion équitable des avancées technologiques, et la mise en œuvre d’une taxation écologique sur les modèles énergivores pour financer des solutions durables. Voilà, c’est dit !
Vers ARC-AGI-2 et au-delà
La prochaine étape, déjà très attendue, sera le lancement d’ARC-AGI-2 en 2025. Conçu pour être encore plus exigeant, ce benchmark redéfinira les standards de l’industrie. Il permettra d’identifier avec précision les limites actuelles des modèles IA, tout en mettant en lumière les domaines qui nécessitent de nouvelles approches ou paradigmes. Son rôle ira au-delà du simple diagnostic technique : il servira de catalyseur pour orienter les recherches vers des solutions véritablement adaptatives et à même de généraliser les compétences.
ARC-AGI-2 est aussi une opportunité unique pour stimuler la collaboration internationale. Réunir les chercheurs autour de problèmes encore irrésolus pourrait non seulement accélérer le développement technologique mais également créer une vision partagée des enjeux liés à l’AGI. Ce genre de benchmark incarne l’idée qu’aucune nation ou organisation ne peut progresser seule dans un domaine aussi transformateur.
En parallèle, il reste primordial de s’interroger sur les applications pratiques de ces avancées. Comment une IA capable d’une telle adaptabilité peut-elle servir directement la santé, l’éducation ou l’environnement ? Imaginez une IA adaptative capable de révolutionner la médecine en personnalisant les traitements en fonction des besoins uniques de chaque patient, ou encore en apportant des réponses en temps réel dans des situations imprévisibles comme les catastrophes naturelles. Ce potentiel, bien qu’encore à concrétiser, redéfinit déjà nos ambitions.
L’intelligence artificielle générale, ou AGI, pourrait bien arriver en 2025, maintenant c’est une possibilité, et non plus de la fiction.
La prochaine étape sera le lancement du benchmark ARC-AGI-2 en 2025, qui promet d’être encore plus difficile et de redéfinir les standards de l’industrie. Son impact potentiel est double : d’une part, il permettra d’identifier les limites actuelles des modèles IA, mettant en lumière les domaines nécessitant des approches nouvelles; d’autre part, il servira de catalyseur pour orienter les recherches vers des solutions plus générales et adaptatives. ARC-AGI-2 pourrait également stimuler une collaboration internationale en réunissant les chercheurs autour de problèmes encore irrésolus, renforçant ainsi la progression collective vers l’AGI.
En parallèle, la question des applications pratiques reste centrale. Comment ces avancées bénéficieront-elles aux secteurs comme la santé, l’éducation ou l’environnement ? Par exemple, une IA capable de s’adapter dynamiquement pourrait révolutionner la médecine en personnalisant les traitements ou en intervenant en temps réel dans des environnements imprévisibles. Pour suivre ces évolutions, accédez aux ressources mises à jour sur le site officiel : ARC Prize 2025.
Conclusion
Le développement d’o3 par OpenAI incarne une avancée décisive, non seulement sur le plan technologique mais aussi dans la quête de repenser ce que signifie véritablement l’intelligence. Ce modèle, avec sa capacité à naviguer dans des problématiques inédites et à créer des solutions dynamiques, ne se contente pas d’élargir le champ des possibles. Il redéfinit les ambitions mêmes de l’humanité en matière de technologie adaptative.
Pourtant, o3 n’est pas une fin en soi. C’est un jalon, un point d’appui dans un parcours encore semé d’interrogations. Les limites actuelles du modèle — sa dépendance à des cadres explicites, ses besoins énergétiques élevés, et son incapacité à égaler la fluidité cognitive humaine — rappellent que chaque progrès est une invitation à la réflexion. Une réflexion sur ce que nous voulons atteindre, et sur les conséquences que nous sommes prêts à accepter.
Mais l’histoire d’o3 dépasse ses caractéristiques techniques. Elle symbolise un moment de bascule où les technologies ne sont plus seulement des outils, mais des partenaires dans la résolution de nos défis globaux. De la personnalisation des traitements médicaux aux solutions pour la durabilité environnementale, ces IA nous offrent l’opportunité de repenser nos systèmes à grande échelle.
Il nous revient maintenant, collectivement, de faire en sorte que ces avancées servent un objectif plus grand. Intégrer l’éthique, garantir l’équité d’accès, et promouvoir des usages responsables sont les conditions nécessaires pour que cette transformation ne soit pas seulement une prouesse technologique, mais un pas vers un futur durable, juste et inclusif. Car si l’intelligence artificielle peut multiplier nos capacités, c’est avant tout notre humanité qui doit guider son chemin.
— —
[Article créé le 21 décembre 2024, par Jérémy Lamri avec le soutien des modèles Claude 3.5 Sonnet, Perplexity, GPT4o et o1 pour la structuration et l’enrichissement, et GPT4o pour l’illustration. L’écriture est principalement la mienne, tout comme la plupart des idées de cet article].
— —
Suivez mon actualité avec Linktree
Si vous vous intéressez à la combinaison du web 3 avec les RH, et plus généralement aux enjeux sociétaux du futur du travail liés à l’émergence du métavers, de l’IA, de la blockchain, de l’informatique quantique et des autres technologies émergentes, je vous invite à vous abonner à la newsletter dédiée que je tiens sur le sujet, et à lire les articles que j’écris régulièrement :
- Newsletter Future of Work & HR (14 000+ abonnés)
- Articles Medium
- Site public Tomorrow Theory
- Page Linkedin Tomorrow Theory (abonnez-vous !!!)
- Mon compte Instagram
- Film EXPLORER
- Podcast CODEX