samedi 2 avril 2016

Préjugé numéro 3: La méthode rationnelle est supérieure à l'intuition

J'ai longtemps hésité à parler d'empirisme plutôt que d'intuition dans le titre de cet article, surtout après avoir lu cet article du blog de Quentin. J'ai finalement opté pour "intuition" car l'empirisme que je vais illustrer dans cet article n'est pas l'empirisme scientifique, mais bien l'empirisme intuitif, celui dont l'humanité et le monde naturel font preuve depuis des millions d'années.

L'intuition est un phénomène psychologique qui est le sujet de maintes études, et dont on ne comprend pas encore le fonctionnement.
Dans l'article précédent, j'ai parlé du jeu de Go et j'ai expliqué pourquoi ce jeu constituait un défi pour l'intelligence artificielle.
Lorsqu'on demande à un joueur d'échec de dire pourquoi il joue un coup, il est capable d'expliquer sa stratégie et son raisonnement pour les x coups suivants (plus x est grand et plus le joueur est fort).
Mais lorsqu'on demande à un joueur de Go de dire pourquoi il joue un coup, il répond simplement que "ça semble correct". (1)
C'est cette forme d'intuition, dont les joueurs de Go font preuve, que les concepteurs de DeepMind ont essayé de reproduire en implémentant les concepts de l'apprentissage profond, dans leur machine d'intelligence artificielle AlphaGo.

Le réseau de neurones d'AlphaGo a été préparé notamment avec un apprentissage par renforcement, qui est un apprentissage de type empirique: l'ordinateur joue contre lui-même et apprend à trouver les stratégies gagnantes en fonction du résultat obtenu (victoire ou défaite).
Mais comment il apprend, on ne sait pas. Lorsque le réseau de neurones est très complexe, on ne sait même pas démontrer que cet apprentissage est efficace, c'est pourquoi la confrontation d'AlphaGo a un champion humain est un événement important pour la communauté de l'intelligence artificielle.
L'hypothèse que le réseau de neurone apprend (c'est-à-dire s'améliore), est fondée sur une propriété non démontrée de l'apprentissage profond: la capacité de généralisation. Cette propriété n'est, pour le moins, pas démontrée pour les structures complexes de réseaux de neurones multicouches propres au Deep Learning (2).
En effet, on suppose que, ayant joué un grand nombre de parties, le réseau de neurones d'AlphaGo sera capable de généraliser ou d'extrapoler correctement sur des parties nouvelles. Au cours de la partie de Go contre Lee Sedol, il est arrivé plusieurs fois qu'AlphaGo joue un coup dont les spécialistes du Go ne savaient dire si c'était une erreur ou un coup de génie. Et force est de constater qu'AlphaGo est capable des deux, puisqu'il a gagné la première partie sur un coup inattendu qui s'est révélé être un coup de génie, mais il a également perdu la quatrième partie sur un coup du même genre.

Cette hypothèse de l'existence d'une capacité de généralisation dans les réseaux de neurones multicouches ressemble fort à ce que nous nommons "intuition" et qui, à défaut d'être expliquée et démontrée, nous semble parfois magique.
Issus d'une culture soumise au paradigme scientiste, nous avons tendance à nous méfier de ce qui est inexpliqué.

Pourtant, nous fonctionnons naturellement par intuitions.
Voici quelques exemples qui démontrent la puissance de cette capacité et son antériorité sur bien des raisonnements scientifiques.
Les marchands du souk empilent leurs oranges de manière pyramidale depuis des générations.
Mais c'est 1610 que Kepler pose le problème et se demande quelle est la forme optimale pour mettre un maximum d'oranges dans un minimum d'espace.

Et ce n'est qu'en 1998 que Thomas Hales démontre mathématiquement qu'il s'agissait bien de la forme pyramidale.

De même, la forme étrange des alvéoles des abeilles fut repérée en -400 av. JC par Aristote.
C'est 2000 ans plus tard (en 1611) que Kepler émet l'hypothèse que cette forme (hexagonale adossée à 3 formes rhomboïdales au fond) est optimale du point de vue économique:
- Pour optimiser la quantité de cire nécessaire pour stocker le miel, la cire étant un matériau cher à produire pour les abeilles
- Pour que ce "dépôt de miel" prenne le moins de place possible


Et ce n'est qu'en 1964 que le mathématicien hongrois László Fejes Tóth montre qu'il existe une forme encore plus optimale que les rhombes qui aurait pu économiser 0.35% de cire aux abeilles, mais il ne parvient pas à le démontrer.
C'est finalement en 1999 de Thomas Hales démontre la conjecture du nid d'abeille.

On voit que les mathématiciens, intrigués par la mystérieuse forme conçue par les abeilles, sont finalement venus à bout d'un problème résolu naturellement et depuis longtemps par les abeilles (pour l'optimiser de seulement 0.35%)

C'est le principal inconvénient de la méthode rationnelle par rapport aux systèmes adaptatifs (intuitifs et empiriques): elle est potentiellement meilleure, mais elle est aussi beaucoup plus lente. Choisir celle-ci au détriment de celle-là relève d'un aveuglement irrationel et scientiste, surtout lorsque le temps est un facteur important.
Cela fait bien longtemps que les marchands du souk empilent leurs oranges sous forme de pyramide et que les abeilles fabriquent des alvéoles sans qu'aucun des deux aient eu besoin d'aucune démonstration mathématique.

Je ne dénigre pas ici la démonstration mathématique, qui est évidemment intéressante car elle révèle des principes généraux qui peuvent avoir d'autres applications: par exemple, elle trouve aujourd'hui de nombreuses applications dans l'étude géométrique des cristaux, mais il ne nous faut pas oublier que la découverte de cette forme optimale a été l'oeuvre conjointe des abeilles et des scientifiques.
Il aurait fallu probablement encore plus de temps aux scientifiques pour trouver une forme de stockage optimale s'ils n'avaient étudié celle pré-existante des abeilles.
Bref, la démonstration mathématique/scientifique est utile mais elle n'est pas la seule manière de trouver des solutions à un problème.

Dans le monde de l'entreprise (sujet de la saison 3 de ce blog), un jeu, issu de la culture des serious game et de l'agilité, est destiné à illustrer la capacité d'adaptation des individus à un problème complexe sans planification et coordination: comment placer un ensemble de X points de manière à ce que chaque point forme un triangle isocèle avec deux autres points?
Pour la méthode scientifique, je vous laisse poser le problème mathématiquement et revenir soutenir votre thèse sur ce blog.
Mais voici une manière empirique de résoudre ce problème complexe: prenez un groupe de X personnes et demandez-leur de se placer de manière à être toujours à égale distance d'au moins 2 autres personnes (voir schéma ci-dessous)

C'est une solution auto-adaptative qui se met en place très rapidement par une suite de petits ajustements.
Voici ce qu'il faut retenir de l'expérience:
- Vous n'obtenez pas une solution parfaite
- Vous n'obtenez pas l'ensemble des solutions possibles
Mais:
- Vous obtenez une solution très rapidement
- Vous pouvez obtenir rapidement une deuxième solution, il suffit de pousser l'une des personnes et tout le monde se déplace de manière à former une nouvelle solution géométriquement satisfaisante du point de vue de la contrainte.
Et surtout, c'est très amusant.

A l'opposé, on trouve la méthode pseudo-rationnelle qui serait utilisée dans le monde de l'entreprise:
On nommerait un chef, qui commencerait par étiqueter les personnes avec un chiffre ou une lettre-matricule (sinon comment se souviendrait-il avec qui chaque personne est supposée former un triangle), puis il ferait sûrement un tableau Excel, dans lequel il placerait le nom des personnes, leur matricule ainsi que les deux personnes avec qui elles sont censées former un triangle.
Ensuite, il imprimerait le tout et viendrait placer les personnes une à une (en leur criant dessus car elles auront bougé sans son accord).
Admettons que non seulement c'est inhumain, mais en plus c'est très chiant.

C'est tout comme si on imaginait que la manière rationnelle de régler la circulation sur la place de l'étoile à Paris consistait à placer un policier au sommet du rond point pour dire à chacun s'il peut passer ou non.




Le Marshmallow challenge est un autre de ces petits jeux qui illustre l'efficacité de la méthode empirique/adaptative (et un tas d'autres choses intéressantes sur la psychologie et la sociologie) lorsqu'il faut résoudre des problèmes complexes en peu de temps.
Dans ce jeu, une équipe de 4 personnes doit construire la structure en spaghetti la plus haute possible pouvant supporter le poids d'un marshmallow en 18 minutes.

Chaque équipe dispose de 20 spaghettis, du scotch, de la ficelle et un marshmallow. (voir la vidéo)

Il est intéressant de constater que les enfants des écoles primaires surpassent largement les étudiants en école de commerce (qui font les moins bons scores), ainsi que les juristes et les équipes de dirigeants d'entreprises.

On peut noter aussi qu'avec l'aide d'une adjointe, les dirigeants d'entreprises parviennent tout de même à faire un petit peu mieux que les enfants...

Références:
(1) Demis Hassabis - The Future of Artificial Intelligence
(2) Yann Lecun au Collège de France
(3) Jeu des spaghettis
(4) Tas d'oranges
(5) Alvéoles d'abeilles

Aucun commentaire:

Enregistrer un commentaire