la Fin Des Interfaces Web
Dans les applications de demain, il suffira de parler pour accomplir ce que l'on souhaite
L’IA a déjà remplacé notre travail au bureau.
Ce n’est pas qu’elle accomplit toutes nos tâches au quotidien. C’est juste que nous ne faisons qu’en parler à longueur de journée et nous ne travaillons déjà plus.
Nous avons remplacé notre productivité et nos tâches d’humain par un bla bla quotidien autour de l’IA. Enfin c’est le cas dans ma boîte.
Le monde géopolitique évolue, l'économie est en attente et les nouveaux projets se font rares. Surtout, pourquoi commencer un projet aujourd’hui avec des humains, alors que dans quelques mois, voire quelques semaines, chatGPT fera tout le boulot ?
J’ai alors rejoint à mon tour un groupe de discussion débattant des applications multi-agents. Mon intuition, aiguisée par mon humble expérience, me dit que ce domaine est bien le futur du petit monde des professionnels de l’informatique. A minima, je sens qu’il s’agit d’une piste sérieuse pour l’évolution de ma carrière. Dans la tech, il faut parfois monter dans certains trains (et aussi rester sur le quai lorsque l’on ne le sent pas).
Alors qu’est-ce qu'un agent IA ?
Pourquoi construire des applications avec plusieurs agents IA et les affubler de ce nom intriguant de “multi-agents app” ?
Pour résumer un agent AI simplement, je dirai que c’est une application à qui on donne un objectif très précis. Une action la plus restreinte possible. Un objectif simple permet de maximiser les chances de réussite.
Pour réaliser cet objectif, l’agent peut percevoir son environnement. C'est-à-dire que l’agent peut prendre des informations d’un utilisateur, d’une base de données, d’Internet ou d’un autre agent. Enfin, on laisse l’agent prendre la décision sur la manière de réaliser l’objectif. Il ne s’agit pas d’un workflow prédéfini (étape 1, étape 2, si OK passer à l'étape 3, sinon revient à l'étape 2 etc…). Non, on laisse l’agent intelligent choisir les étapes jusqu’à son objectif.
Exemple : un agent pour la transcription de vidéos youtube. Son seul objectif est de me fournir le texte complet de ce qui est dit dans une vidéo youtube. L’entrée est le lien de la vidéo, la sortie est le texte complet de transcription.
Alors pour réaliser cette action, l’agent intelligent va décider de la procédure à suivre. Il va en fait demander à son petit chatgpt interne comment il doit faire. Il va demander à son chatgpt interne quelles sont les étapes pour réaliser la transcription, comment télécharger l’audio de la vidéo, quels sont les meilleurs outils de reconnaissance vocale et il peut aussi aller sur Internet pour vérifier dans des dictionnaires les fautes d’orthographes dans le texte final.
Simplement, l’agent va faire comme vous et moi. Il va aller sur Google pour chercher des tutos, il va demander à chatgpt de lui faire un plan d’action et pour chaque action il va demander comment on fait. Il ne fera donc pas systématiquement les mêmes actions ou il n’utilisera pas toujours les mêmes outils mais le résultat final sera toujours celui attendu : le texte de la vidéo.
Un agent IA, c’est comme un collègue au bureau, chacun ayant son périmètre d’action. Il y a le collègue qui s’occupe de la compta, et bien il y aura aussi l’agent IA qui s’occupera de la compta. Sauf que l’agent, on lui demandera un tout petit périmètre pour être sûr qu’il ne se trompe pas.
Vous apercevez alors la logique d’une application multi-agents. Ces applications sont au final une équipe d’agents. C’est une petite entreprise avec plein de petits employés qui sont des agents IA. L’entreprise a un objectif commun plus global et plus important et chaque agent à sa mission précise dans ce but commun.
Exemple : une application multi-agents pour créer un site d’information sur les technologies.
Pour réaliser ce but commun, je vais avoir toute une série d'agents interconnectés entre eux pour accomplir cette mission.
Il y a tout d’abord l’agent chef, celui qui organise les autres, le manager, il va dicter la cadence.
Un autre agent va définir les étapes à réaliser (en utilisant chatgpt bien sûr).
Un agent va concevoir le site web (toujours avec chatgpt).
Un agent va uploader le code source de l’agent précédent sur un site d'hébergement de site web.
Un agent suivant va aller sur youtube, X et Instagram pour obtenir une liste des 10 sujets tendances autour de la technologie.
Un agent écrivain va écrire 10 articles de blog sur les 10 sujets trouvés par l’agent qui fait les recherches.
Un autre agent va publier ces articles sur le site web créé par les agents précédents en sélectionnant les 3 meilleurs articles.
L’agent manager va définir que la stratégie de publication pour maximiser l’engagement doit être de publier tous les deux jours, alors tous les deux jours il va demander à l’agent qui fait les recherches de bosser un peu puis l’agent écrivain va pondre les articles et l’agent qui publie, va publier…
Vous comprenez la logique, une application multi-agents est une entreprise virtuelle composée de plusieurs agents IA. C’est une équipe d'agents. Plus vos agents sont entraînés et efficaces, plus votre entreprise accomplira bien sa mission.
Un ou plusieurs agents de cette équipe peuvent être humains, il y a aura des équipes hybrides ou robots et humains bosseront ensemble. Même si les humains seront principalement au début et à la fin de la chaîne.
Avec ce genre d'applications où tout un tas de petits chatgpt se parlent entre eux et s’échangent des information, la puissance de l’IA est décuplée. Cela permet de réaliser une mission juste en demandant. L’IA se charge de savoir quelles sont les étapes, qui fait quoi, comment, etc… Alors bien-sûr il y a une première phase de configuration pour concevoir votre application mais une fois que cela tourne, vous pouvez vous reposer et attendre les résultats.
Les meilleurs agents IA peuvent être réutilisés dans d’autres applications. Si vous avez un agent qui est très bon pour faire la compta, vous pouvez le réutiliser dans toutes les autres applications multi-agent où faire de la compta est nécessaire. Il y aura un marché de l’emploi pour les meilleurs agents IA… Et donc un business pour ceux qui développent des agents ultra efficaces.
Alors pourquoi la fin des interfaces web ?
Que vont vouloir les utilisateurs et entreprises de demain ? Pourquoi acheter des applications avec une interface graphique ou un site web avec des trucs à cliquer dedans alors qu’une application où il suffit de dire ce que l’on veut est possible ?
Prenons l’exemple de mon comptable (je déteste la compta). Si je suis une entreprise qui doit faire sa compta, je ne vais pas acheter Excel et payer un comptable pour le faire, je vais préférer avoir une application ou mon unique tâche sera de parler ou d’écrire ce que je veux : fais ma compta, quel est l’état de mes comptes, paye ce fournisseur, quelles sont les transactions avec telle société…
Plus besoin d’une interface graphique pour aller chercher les infos ou faire les actions nécessaires. Plus vraiment besoin d’humain également…
Sam Altam prédit que nous verrons prochainement un entrepreneur seul devenir milliardaire, the one billion man company. Cela semble possible dorénavant qu’un seul homme avec des applications multi-agents : pour faire son marketing, une autre pour ses finances et tout un tas d’autres pour produire sa chaîne de valeur puisse faire tourner un business générant 1B. Bien entouré avec des équipes d’agents IA performantes, pourquoi pas en effet.
Les bons vieux sites web avec des fenêtres à menu déroulant, avec des cases à cocher ou avec plusieurs pages se succédant, c’est terminé ! Nous aurons des applications avec des prompts pour dire ce que nous voulons et ensuite le résultat nous sera renvoyé par texte, images, audio ou vidéo.
Les plus jeunes d’entre nous auront même la flemme de taper sur un clavier. Vous savez ces jeunes qui ne font que des whatsapp audio parce que “écrire c’est pour les vieux”, et bien ça sera pareil avec les applications multi-agents. La commande vocale sera l'interaction principale avec les machines (sauf si Neuralink nous met à tous des puces wifi dans le cerveau).
Alors laissez tomber vos applications web et autres saas en développement. Passez au multi agent avec interface conversationnelle.
Dernier exemple, si vous voulez créer une plateforme saas pour aider à la génération de tunnel de vente. Laissez tomber l’interface web avec site builder etc. Mettez juste une belle fenêtre de prompt et laissez votre application multi-agent générer le code des tunnels suite aux souhaits de l’utilisateur, puis un autre agent va publier les tunnels, un agent va écrire les textes d’accroches, un autre agent va faire des campagnes de pub, un autre agent va faire l’analyse des résultats…
D’ailleurs ces tunnels de vente, je suppose que bientôt il faudra réussir à les insérer directement dans les recherches chatgpt, DeepSeek et autres Google Gemini. En effet c’est là bas que les gens y exposent leurs problèmes donc très certainement nous verrons arriver des pubs dans les versions gratuites de chatgpt.
Si une personne demande à chatgpt comment réaliser une vidéo youtube et qu’en plus de la réponse classique il y a un lien vers une formation, cela peut être lucratif pour le formateur. Disons que le principe des liens sponsorisés de Google se retrouvera très certainement dans les chatgpt like de demain.
À vous d’anticiper pour y proposer vos solutions, si vous en avez. Sinon, pensez à demander à votre équipe d’agents IA d’en construire pour vous.
Vladimir