Grandalf, l’apprentissage machine automatisée et les solutions hybrides

/ by
Reading Time: 3 minutes

Le « Projet Grandalf » de Cloudtrade offre un système de l’apprentissage machine avec une précision de 100% pour la reconnaissance du contenu des documents. Richard Develyn, directeur technique, vous en dit plus, notamment sur la façon dont vous pouvez intégrer ce système à votre entreprise et sur le moment où vous pouvez le faire. 

Mettre en œuvre une solution d'apprentissage machine dans votre organisation est un peu comme recruter un apprenti : vous ne savez jamais exactement combien de temps vous allez devoir attendre avant de voir quelque chose d'utile en sortir, ou même si quelque chose d'utile en sortira un jour ! En attendant, cependant, vous devez exercer votre activité principale de manière efficace et fiable. 

De nos jours, l'efficacité et la fiabilité passent par l'informatique - pas l'étrange, nouvelle, informatique de type réseau de neurones, mais l'informatique traditionnelle qui tient le monde ensemble depuis 50 ans. 

L'apprentissage machine automatisée, aussi passionnant soit-il, est encore très loin de pouvoir prendre le relais de l'informatique dans son ensemble, et bien qu'il existe une catégorie de problèmes où il est difficile d’utiliser linformatique traditionnelle, telles que celles qui nécessitent de l’assistance humaine, auxquelles l'apprentissage machine peut utilement participer, la plupart des solutions informatiques sont encore fournies selon la méthode traditionnelle de « programmation » informatique. 

Cependant, les solutions hybrides peuvent combiner toutes ces approches afin de tirer le meilleur de tous les mondes, à condition de le faire avec précaution. Le jugement humain est lent à faire et l'apprentissage machine est lent à apprendre, de sorte que le traitement doit encore passer par les méthodes de l’informatique traditionnelles autant que possible si l'on veut atteindre des niveaux d'automatisation à la vitesse de l'informatique. Les êtres humains et les réseaux neuronaux peuvent cependant configurer le système pour qu'il fonctionne de manière plus précise ou plus efficace, sans essayer de prendre complètement le relais. 

Grandalf est la solution hybride de CloudTrade au problème de la reconnaissance du contenu des documents. L'extraction de données correctement identifiées à partir de documents lisibles par une personne humaine est un problème compliqué à résoudre. Le produit phare de CloudTrade, Gramatica, y parvient en mettant en œuvre un moteur de règles qui permet d'écrire des règles spécifiques pour chaque format de document à traiter. Il est extraordinairement puissant, et Gramatica peut répondre à toutes les exigences et à toutes les complexités, à condition de disposer de bonnes règles écrites pour ce faire. 

Toutefois, certains documents ne sont pas suffisamment compliqués, ou traités en quantité suffisante, pour justifier l'effort de rédaction de règles qu'exige Gramatica. 

C'est là qu'intervient Grandalf. 

Le moteur d'apprentissage machine de Grandalf, qui fonctionne chaque nuit sur l'ensemble de l'activité de capture de documents de CloudTrade, alimente sa base de données de connaissances des algorithmes d'extraction de données. Cette collection d'algorithmes est ensuite appliquée à chaque nouveau document qui arrive au service, un opérateur étant invité à préciser quel algorithme a produit les bonnes réponses. 

Les réponses de l'opérateur sont conservées dans une base de données, de sorte que les documents reçus ultérieurement du même expéditeur sont automatiquement adressés par le bon algorithme, et produisent ainsi les bonnes réponses, sans qu'il soit nécessaire de recourir à une intervention supplémentaire de l'opérateur. En cas de variation d'un document,  les bonnes réponses ne sont pas trouvées, la base de connaissances et le processus de l'opérateur sont à nouveau invoqués afin que toute alternative puisse être traitée avec précision. C'est cette combinaison d'apprentissage machine, d'informatique traditionnelle et d'intervention humaine qui constitue le principal avantage apporté par Grandalf. 

Le marché a toujours eu tendance à chercher un remède miracle. Les remèdes miracles sont faciles à vendre (par exemple : « vous avez ce problème, vous devriez donc utiliser ce remède miracle »). Cependant, il est rare qu'il existe vraiment un remède miracle. Une combinaison de remèdes est généralement requise pour trouver une solution à un problème. 

Chez CloudTrade, nous sommes convaincus que l'approche hybride de Grandalf est la meilleure façon d'aborder le problème de la reconnaissance du contenu des documents, au-delà des documents qui sont si compliqués qu'ils nécessitent l'écriture de règles spécifiques pour les comprendre (c'est-à-dire Gramatica). C'est cette combinaison hybride d'approches qui permet à Grandalf de trouver le point idéal pour résoudre le problème : l'apprentissage machine et l'assistance humaine en plus de l'informatique traditionnelle, déterministe.  

Le système Grandalf est caractérisé par les éléments suivants : 

- Il apprend à partir d'un seul exemple 

  • Grandalf dispose d'une vaste base de connaissances sur les règles de saisie de données 
  • Données qui sont appliquées à chaque document, un opérateur étant ensuite invité à aider via un simple formulaire de questions-réponses 

- Il est précis à 100% 

  • Une fois choisies, les règles n'exercent pas de jugement ou ne renvoient pas à une base de données d'apprentissage machine pour obtenir des valeurs possibles et des niveaux de confiance ; les règles de Grandalf sont totalement déterministes 

- C'est rapide 

  • Une fois qu'un opérateur a aidé Grandalf à déterminer les règles à utiliser, les documents passent à travers lui à la vitesse de l'informatique 

- Il gère les variations de documents 

  • Grandalf retourne à un opérateur si les règles pour un document donné ne trouvent pas de valeur, en relançant sa base de connaissances pour offrir plus d'alternatives 

- Il devient de plus en plus intelligent avec le temps 

  • L'ensemble de l'activité de CloudTrade alimente en arrière-plan un algorithme d'apprentissage machine qui, chaque nuit, met à jour la base de connaissances des règles de Grandalf avec de nouvelles possibilités de saisie de données 

- Il est extensible 

  • Grandalf peut être facilement étendu si les clients ont des exigences supplémentaires en matière de saisie de données