Un robot qui range ma chambre

"ça serait bien un robot qui range ma chambre !"

Ceux qui me connaissent un peu ou qui m'ont croisé cette dernière décennie, ont déjà entendu cette phrase et savent que pour moi, elle a été un élément déclencheur et un leitmotiv. Avec des hauts et des bas dans la motivation, les espoirs…

Mais force est de constater qu'aujourd'hui de nouveaux événements permettent de considérer l'idée sous un nouvel angle, avec de nouveaux outils, de nouvelles perspectives, et par la même occasion de nouvelles opportunités.

En effet cette phrase, c'est mon fils Simon qui me l'a décochée, un samedi matin de ménage, ou des tonnes de LEGO, de Kapla, de petites voitures, d'éléments de constructions et autres jouets entiers ou parfois en morceaux jonchaient le sol de la chambre qu'il partageait avec ses frères. Au milieu de cette multitude de formes et de couleurs, trônais le RoboSapiens que je me rappelle lui avoir acheté d'occasion sur LeBonCoin. Faisant preuve de la plus mauvaise volonté qui soit et voyant ce robot au milieu de ce fatras, en réponse à ma sollicitation d'au moins dégager un passage pour que l'on puisse traverser, il m'envoyant cette phrase ça serait bien un robot qui range ma chambre de manière tout à fait anodine.

Je ne reviendrais pas ici sur la manière dont cette phrase a drivé nombre de mes actions depuis lors. Les curieux pourrons se référer à cet article Notion, aux articles du Blog smag0.blogspot.fr, ou à mes premiers dépôt et wiki github

Mais ce n'est pas le sujet qui nous amène aujourd'hui... Comme je le disais dans ces articles en 2015, j'attendrais que les machines deviennent quelque peu intelligentes, ou auraient un semblant de compréhension, le moment que l'on puisse communiquer aisément avec pour investiguer cet partie de l'énorme projet que j'avais entrepris d'explorer.

l'IA dans tous ses états

Et vous l'aurez certainement remarqué, depuis l'arrivée de ChatGPT qui nous donne le moyen de discuter avec une intelligence artificielle, les choses que nous connaissons jusque alors se trouvent en grand nombre "légèrement" modifiées, et avec elles, notre façon de travailler, et de vivre. Si vous ne l'avez pas encore testé ChatGPT ou Mistral pour ceux qui préfèrent le “made in France”. L'arrivée de cet outil a fait grand bruit même dans les médias mainstream, depuis l'étudiant qui demande à ChatGPT de lui rédiger ses devoirs ou de résumer un livre, jusqu'à la possibilité pour une entreprise de stocker ses connaissance sous une forme particulière et de pouvoir interroger ses données en langage courant, et demander à l'IA de restituer ses données sous tel ou tel format. Cette activité, sera englobée dans la suite de ce document sous le nom de "Génération de texte", à noter ici que dans le même temps, d'autres outils sont apparus de manière plus ou moins liée, notamment dans le domaine de la "génération d'images " et même maintenant dans la génération ou reconnaissance de sons et de vidéo.

Tout ceci n'existait pas, ou du moins n'était pas accessible au grand public il y a deux ans, et aujourd'hui, on ne compte plus les artistes et personnalités publiques qui se plaignent d'avoir été fakées, leur tête ayant été mises sur un autre corps, dans un autre contexte, que ce soit en image ou en vidéos, c'est même devenu le sport favoris de certains ados qui diffusent sur les réseaux sociaux des fakes de leurs camarades.

Par simplification, nous regrouperons ces outils sous le termes d' "IA génératives", même si nous le verrons par la suite, le terme d'intelligence est légèrement surfait et galvaudé, mais c'est aujourd'hui, la dénomination qui retranscrit le mieux ce que nous pouvons comprendre du phénomène.

Il n'est pas une semaine sans que la presse spécialisée ne parle d'un nouveau modèle plus performant que les précédents, de nouvelle technique pour augmenter leur efficacité ou réduire leur taille. On entend également parler d'intégration dans les outils existants comme le moteur de recherche Bing, dans Excel ou Notion, dans VSCode pour la génération de code et nous assister dans le développement d'applications. Et avec nos outils du quotidien, ce sont nos méthodes de travail qui changent et donc les qualifications, connaissances et compétences nécessaires pour être efficaces et compétitifs. Le monde du travail change.

Le "Large Language Model" ou LLM

La question maintenant qui parait importante pour savoir si c'est outils sont vraiment exploitables et utiles, est de comprendre comment cela fonctionne.

Derrière ChatGPT et les outils du même ordre permettant la génération de texte, on trouve en général un Large Modèle de Language, Large Langage Model en anglais ou LLM en abrégé. Ce LLM peut être assimilé à une base de données gigantesque dans laquelle on aurait fait entrer la majeur partie des connaissances numériques existantes (Wikipédia, livres, articles de journaux, blogs, publications scientifiques, statistiques...). Et forcément, pour faire entrer tout ça dans une machine, il a fallu ruser et user de chausse-pieds de taille conséquente. Des ordinateurs très puissants, avec des cartes graphiques permettant le travail en parallèle de manière intense sont chargés, pendant des mois de compiler tous ces documents et de les vectoriser, selon des millions de paramètres.

La Vectorisation

La vectorisation (embeddings en anglais), et l'acte de transformer les documents précités (wikipédia, livres...) en une forme utilisable par une machine, mais la machine ne comprend pas le texte de la même manière que nous.

Petit aparté ici: il est courant d'appeler "machine", tout ce qui ressemble à un ordinateur dans son fonctionnement (pc, smartphone...)

Le but de la vectorisation étant de regrouper des concepts qui se ressemblent au plus proche de ce que fait le cerveau humain.

Petite expérience,