S’agit-il d’IA ?

/ by
Reading Time: 7 minutes
Y a-t-il une différence entre les systèmes basés sur l’IA et les solutions utilisant les réseaux de neurones ? Et, si oui, laquelle de ces approches est à la base du service d’extraction de données CloudTrade ? Dans ce blog, le deuxième dans une trilogie expliquant la solution de saisie de données de CloudTrade, Richard Develyn, directeur technique de CloudTrade, répond à ces questions en décrivant de façon colorée le rôle des réseaux de neurones depuis l’époque des dinosaures.

Au milieu de la Seconde Guerre mondiale, un comportementaliste américain, professeur de psychologie à Harvard, appelé B.F. Skinner, « entraînait » des pigeons pour qu’ils dirigent des missiles spécialement modifiés vers leurs cibles, en picorant sur les petites fenêtres à l’avant du missile par lesquelles les pauvres créatures étaient autorisées à regarder. Ce projet s’appelait « Project Pigeon » et, bien qu’il n’ait jamais dépassé le stade du bêta test, il s’est révélé très prometteur et a même reçu 25 000 dollars de financement de l’État américain.

Je dis que les pigeons étaient « entraînés », entre guillemets, parce qu’ils n’étaient jamais vraiment assis dans des salles de classe avec des cahiers d’exercices et qu’on leur expliquait patiemment comment reconnaître la cible d’une bombe. Les pigeons ont été entraînés de la même manière que les réseaux neuronaux, c’est-à-dire : « picorez sur la fenêtre où la cible est devant vous et vous obtenez de belles friandises ; si vous ne le faites pas, ou si vous vous trompez, alors aucune friandise pour vous ». Finalement, les pigeons ont compris, d’une manière ou d’une autre, de la même manière que les réseaux neuronaux trouvent les réponses à leurs problèmes.

Déterminer comment guider un missile vers sa cible ne semble pas être un problème trop difficile – pour un pigeon. On pourrait le comparer au problème de trouver une date de facture dans une facture qui n’a jamais été vue auparavant – pour un réseau neuronal.

En juin 2018, le plus grand réseau de neurones, construit sur des supercalculateurs, comptait environ 16 millions de neurones. C’est à peu près la taille du cerveau d’une grenouille. Je suis sûr qu’il y en a de plus grands aujourd’hui (des réseaux de neurones, pas des grenouilles) mais à l’époque, c’était le plus grand du monde entier, et tout ce que nous pourrions obtenir aujourd’hui est probablement au moins un ordre de grandeur plus petit que cela. Bien sûr, il n’est pas possible d’établir une comparaison directe entre les réseaux de neurones organiques et synthétiques, mais pour les besoins de l’argumentation, supposons que tout réseau de neurones sensible avec lequel nous pourrions jouer aujourd’hui aura à peu près la taille du cerveau d’une grenouille.

Le cerveau d’un pigeon est en fait environ vingt fois plus grand que celui d’une grenouille.

Dans les années quarante, bien sûr, B.F. Skinner avait un avantage certain pour l’entraînement des pigeons. Le cerveau des pigeons n’est pas totalement non entraîné au départ.

Charles Darwin avait une fascination particulière pour les pigeons lorsqu’il faisait des recherches sur « L’Origine des Espèces ». Il les a élevés lui-même et a utilisé son élevage comme une analogie pour décrire ce qui se passe dans la nature. Tous les pigeons d’aujourd’hui descendent des pigeons biset, que l’on trouve partout dans le monde et que les humains ont entraînés depuis l’aube de la civilisation. Les Grecs de l’Antiquité utilisaient des pigeons pour envoyer les résultats des Jeux Olympiques de ville en ville dès le VIIIe siècle avant J.-C. Gengis Khan a créé le premier Internet basé sur les pigeons dans tout son empire dès le 12ème siècle.

Cependant, si vous voulez vraiment savoir depuis combien de temps un cerveau de pigeon « apprend », vous devez probablement remonter à ses racines, qui s’avèrent être le, désormais notoire, Velociraptor trouvé à l’époque jurassique (et dans les films de Steven Spielberg). En supposant que notre humble pigeon ait changé d’avis à la fin de cette époque particulière et qu’il ait redéfini son réseau neuronal pour se concentrer davantage sur les choses du pigeon plutôt que sur l’arrachage d’autres animaux, alors notre cerveau de pigeon a eu environ 150 millions d’années pour se perfectionner, ce qui est assez long pour former un réseau neuronal, et explique en partie pourquoi les pigeons sont à peu près trois fois plus rapides que les êtres humains pour traiter les informations visuelles (même si le cerveau humain est environ trois cents fois plus grand – vous serez heureux de l’apprendre).

Si tout cela semble aller à l’encontre des réalisations tant vantées des réseaux de neurones aujourd’hui, alors prenez un peu de temps pour gratter sous la surface des gros titres. La reconnaissance faciale fonctionne bien lorsque les gens ne se ressemblent pas trop, n’essaient pas de se déguiser, par exemple en portant des masques en papier, ne font pas de choses ennuyeuses comme porter des t-shirts avec le visage d’autres personnes sur eux, ou portent du maquillage intéressant que l’on peut trouver sur Internet et qui est conçu pour brouiller les algorithmes. La traduction linguistique fonctionne bien lorsqu’il n’est pas nécessaire de comprendre le sens réel des phrases traduites ; le changement radical de difficulté entre la traduction de style de substitution de texte et ce qu’on pourrait appeler la traduction « cognitive » est immense.

La montée en puissance des réseaux de neurones au cours des dernières années n’est pas tant due à une augmentation de la puissance de calcul qu’à une augmentation de la quantité de matériel de formation que notre société basée sur Internet a rendu possible. Cette montée en puissance a alimenté un intérêt croissant pour les réseaux neuronaux, une augmentation des ressources financières et de la recherche et, j’en ai peur, un vœu pieux sur ce que les réseaux neuronaux pourraient faire pour nous à l’avenir. Nous avons tous cette vision de l’ordinateur, basée sur la science-fiction, selon laquelle il n’a plus besoin d’être programmé, mais qu’il peut se programmer lui-même par magie si on lui donne la bonne quantité de bonnes réponses. Les réseaux neuronaux, cependant, ne sont pas des ordinateurs autoprogrammés ; ce sont de vastes et complexes moteurs de reconnaissance de formes, en fait assez incompréhensibles. Leur beauté est qu’ils peuvent être « enseignés » de la même manière que nous entraînons les animaux, c’est-à-dire non pas par des instructions, mais en leur montrant de nombreux exemples de ce qui est bien et de ce qui est mal. Leurs inconvénients sont que (a) ils ont besoin de beaucoup de formation et (b), là encore, tout comme les animaux, ils se trompent parfois de toute façon sans prendre la peine de nous fournir une explication.

En fin de compte, c’est la raison pour laquelle les expériences de B.F. Skinner avec des pigeons entraînés dans des missiles n’auraient jamais décollé (si vous voulez bien excuser le jeu de mots). Personne n’allait être particulièrement heureux de voir des armes de destruction massive guidées vers leur cible par une bande de pigeons picorant un écran.

Ce problème d’ « explicabilité », tel qu’il est connu dans le monde de l’IA, est appelé le Problème de la Boîte Noire IA, bien qu’il devrait en réalité être appelé le Problème de la Boîte Noire des Réseaux Neuronaux car l’IA et les réseaux neuronaux ne sont pas la même chose. L’ « explicabilité » n’est qu’une partie de l’histoire ; la véritable exigence est l’ « instructabilité ». Malheureusement, nous ne pouvons demander aux réseaux neuronaux de se comporter d’une manière particulière pas plus que nous pouvons demander à notre chien de ne pas faire pipi sur le canapé. Nous pouvons l’entraîner (eux) et espérer qu’ils finissent par comprendre le message, mais nous ne pouvons pas les programmer de la même manière que nous pouvons programmer les ordinateurs.

Cela ne veut pas dire que les réseaux neuronaux n’ont pas un rôle à jouer dans la résolution des problèmes rencontrés par les technologies de l’information aujourd’hui, y compris, dans une certaine mesure, ceux qui consistent à identifier des données à partir de documents comme nous le faisons dans le cadre de CloudTrade. Si vos besoins sont simples, que votre ensemble de données de formation est important, que vous ne vous souciez pas de savoir s’il se trompe et que vous n’allez pas lui demander de s’expliquer, alors un réseau neuronal pourrait bien être la solution qu’il vous faut. En ce qui concerne l’avenir de notre technologie de base, cependant, qui consiste à augmenter la sophistication plutôt qu’à la diminuer, ce n’est pas si merveilleux pour nous, bien qu’elle ait toujours un rôle à jouer en tant que conseiller dans nos derniers développements, le projet Grandalf. Les réseaux de neurones sont parfaits pour suggérer aux humains où chercher des choses ou alors où trouver des idées. En tant que conseillers, cela ne vous dérange pas s’ils se trompent, toute aide est utile, mais il est hors de question que vous leur remettiez les rênes.

Cependant, l’IA n’a jamais été uniquement une question de réseaux de neurones. Si vous me posiez la question « Ce que vous faites ici à CloudTrade s’agit-il d’IA ? », je vous répondrais « Oui, mais pas la saveur de réseau neuronal de l’IA ».

John McCarthy, un informaticien américain qui a été l’un des fondateurs de la discipline de l’intelligence artificielle, a estimé que les machines n’avaient pas du tout besoin de simuler la pensée humaine, mais devaient plutôt essayer de mettre en œuvre l’essence du raisonnement abstrait et de la résolution de problèmes, indépendamment du fait que les gens utilisent les mêmes algorithmes. Pamela McCorduck, dans son article de 2004 intitulé « Machines who Think », le résume comme suit, en écrivant qu’il existe « deux grandes branches de l’intelligence artificielle : l’une visant à produire un comportement intelligent indépendamment de la manière dont il a été accompli, et l’autre visant à modéliser les processus intelligents présents dans la nature, en particulier les processus humains ».

Si vous pensez au problème humain traditionnel que l’IA a été conçue comme un défi – gagner une partie d’échecs contre un grand maître – la réponse ne vient finalement pas de la construction de l’équivalent en réseau neuronal d’un cerveau humain (ce qui est de toute façon bien au-delà de nos capacités) mais plutôt de la programmation d’un ordinateur normal à l’aide d’un logiciel normal qui met en œuvre des algorithmes très compréhensibles découverts par les personnes qui ont étudié la façon dont le jeu est joué. C’est ainsi que la plupart de l’IA se déroule.

La technologie de CloudTrade fonctionne exactement de la même manière. Nous utilisons une variante du traitement du langage naturel pour programmer notre moteur central, « Gramatica », afin de comprendre les documents de la même manière que nous les comprenons en tant qu’humains, c’est-à-dire au sens cognitif, plutôt que d’essayer de simuler la manière dont nos neurones dans nos réseaux de neurones se tirent dessus. Tout comme les programmes de jeu d’échecs dont nous disposons aujourd’hui, Gramatica est le moyen évident de résoudre ce problème. Il comporte la tâche fastidieuse de devoir programmer la chose pour traiter chaque type de document individuellement, mais les rêves d’avoir un moteur de style réseau neuronal qui s’auto-programme pour produire une réponse par magie sont loin de la réalité. Les rêves sont séduisants, bien sûr, mais les entreprises sont construites sur ce qui est pratiquement réalisable aujourd’hui.

CloudTrade utilise le traitement du langage naturel pour résoudre le problème de la compréhension et de l’extraction de données significatives à partir de documents. Le traitement du langage naturel est une branche reconnue de l’IA. Pour l’instant, CloudTrade n’utilise pas les réseaux de neurones dans sa solution, mais nous avons l’intention de l’introduire dans la prochaine génération de notre logiciel appelé « Project Grandalf ». L’IA est en effet au cœur de ce que fait le CloudTrade, et c’est intéressant et excitant pour nous. Nous aimons à penser que nous avons contribué à faire avancer cette technologie avec notre brevet initial, et qu’elle nous a permis d’en faire une entreprise prospère avec des centaines de clients satisfaits. Qui sait, peut-être qu’avec Grandalf et d’autres avancées en matière de réseaux neuronaux, d’autres brevets suivront.

Catégories : Blog