Automates
Intelligents utilise le logiciel
Alexandria.
Double-cliquez sur chaque mot de cette page et s'afficheront
alors définitions, synonymes et expressions constituées
de ce mot. Une fenêtre déroulante permet aussi
d'accéder à la définition du mot dans une
autre langue.
17 fevrier 2011
par Jean-Paul Baquiast et Christophe Jacquemin
Le match Watson/humains
dans le jeu Jeopardy!
Ce que l'on pourrait en conclure concernant l'intelligence
artificielle
Dans
notre présentation du livre de Martin Ford, The Lights
in the Tunnel [voir notre rubrique Biblionet], nous insistions
sur son argument principal : une grande majorité des travailleurs
actuels, quels que soient leurs professions et leurs grades, seront
remplacés dans les prochaines décennies par des applications
de l'Intelligence artificielle, des automatismes et de la robotique.
Et contrairement à ce que l'on croit, les personnes les plus
menacées seront celles qui font aujourd'hui appel aux formes
élaborées de la compréhension du langage naturel
et du jugement, en s'appuyant sur des quantités considérables
de connaissances accumulées aussi bien dans leurs cerveaux
que dans les sources de documentation qu'ils utilisent.
Dans
un premier temps, on cite en exemple les documentalistes qui répondent,
notamment par téléphone ou en ligne, aux questions
posées par des clients. Une bonne partie des centres serveurs
qui avaient été créés ces dernières
années dans des pays à bas salaires sont en train
de disparaître, du fait du relais pris par des systèmes
d'intelligence artificielle, fonctionnant sur le mode du système-expert.
Mais la contagion ne risque-t-elle pas de s'étendre très
rapidement à de nombreuses professions où l'expertise
repose en grande partie sur la consultation d'informations mémorisées,
fussent-elles complexes : médecins, avocats, enseignants
?
Aujourd'hui,
chacun peut en faire l'expérience en consultant les bases
de données immenses, en nombre et en contenus, qui constituent
la puissance cognitive d'entreprises à moteurs de recherche
telles que Google. Des algorithmes de plus en plus efficaces permettent
au moteur de comprendre rapidement le sens des questions posées
et d'offrir les réponses statistiquement les plus appropriées,
même si ces questions sont ambiguës ou partielles. Le
moteur n'invente évidemment rien de nouveau ce faisant. Il
s'appuie sur les références qui ont été
accumulées sur des centaines de serveurs répartis,
qu'il peut consulter en quelques dixièmes de seconde. Les
réponses mentionnent en premier lieu les sites ou données
les plus consultées.
On peut le constater à propos de ce que les chercheurs en
Intelligence artificielle ont appelé "le paradoxe Paris
Hilton". Si l'on tape ce terme sur Google, on obtient une dizaine
de réponses concernant la star (photo). Il n'est fait mention
de l'hôtel Hilton à Paris qu'au 12e ou 15e rang. Ceci
tient au fait que les questions sont principalement posées
par des Américains connaissant la star et ne s'intéressant
qu'épisodiquement à l'hôtel parisien. Si cependant
un processus de recherche plus performant était utilisé
par Google ou par un autre système de question-réponse
professionnel, il aurait pu déduire d'un certain nombre de
connaissances plus subtiles accumulées à propos du
sujet posant la question que c'était l'adresse de l'hôtel
que ce dernier cherchait.
Ce
sont de telles performances que prétendent accomplir les
responsables du mega système-expert géré par
l'ensemble de super-ordinateurs IBM baptisé"Watson",
en honneur du fondateur de la firme. L'actualité s'est beaucoup
intéressée au match qui vient d'opposer ce système
aux gagnants d'un jeu intitulé "Jeopardy!",
très populaire aux Etats-Unis. Après plusieurs épisodes
suivis de près par les médias (fortement orchestrés
par les relations publiques d'IBM), Watson vient de l'emporter sur
ses concurrents humains. Il s'agissait de faire face à des
questions lourdes d'ambiguïtés, avec la meilleure pertinence
et dans les meilleurs délais.
Le
match se déroulait en deux manches et opposait le superordinateur
Watson à deux opposant de poids : Ken Jennings, détenteur
du record du plus grand nombre de victoires consécutives
au Jeopardy! (74), et Brad Rutter, gagnant du plus gros gain
à ce jeu.
Le premier match, diffusé le 14 février dernier,
a été sans appel : 4.800 $ pour Jennings, 10.400
$ pour Rutter, et 35.734 $ pour Watson, grâce notamment
à deux bonnes réponses aux questions bonus qui
rapportaient plus d'argent.
Bien que Watson a été mené durant la
seconde manche, il finira par la remporter avec 77.147 $,
devant Jennings avec 24.000 $ et Rutter avec 21.600 $.
Sur les 94 réponses données par Watson, il ne
s'est trompé que neuf fois. Le programme s'est abstenu
de répondre à 26 occasions, n'étant pas
assez sûr de lui pour tenter sa chance (il avait pourtant
la bonne réponse dans 5 de ces cas, soit 19,2 %).
Avec cette compétition, Watson remporte un million
de dollars, qu'IBM a reversé à des uvres
caritatives.
Pour
préparer Watson à l'épreuve, les chercheurs
et ingénieurs d'IBM(1) ont entré dans le système,
pendant des semaines (voire des mois), des données de toutes
sortes susceptibles de répondre avec le plus de pertinence
et le plus de rapidité possibles aux types de questions posées
par les humains dans le jeu Jeopardy!. La base de données,
qui inclue des millions de documents - par exemple les archives
du New York Times, la Bible , des dictionnaires, thesaurus,
encyclopédies (y compris l'intégralité de Wikipedia
et l'Internet Movie Database) - occupe quatre téra-octets
sur les disques durs du superordinateur Watson.
Progrès
apportés par Watson
C'est
sur la base de ces informations que s'applique la technologie de
question-réponse développée par IBM. Elle ne
paraît pas très différente de celle utilisée
par les systèmes IBM joueurs d'échecs. Face à
une occurrence nouvelle imposée par le partenaire humain,
l'ordinateur recherche, parmi les milliers ou centaines de milliers
de réponses possibles qu'il a mémorisées, celle
qui paraît la plus adaptée.
Les
performances obtenues sont impressionnantes. De plus les domaines
intéressés pourraient être étendus indéfiniment,
en fonction des capacités de mémorisation du système
et de la variété des expertises qui seraient rassemblées.
IBM est donc légitime à prétendre que Watson
ou ses successeurs pourront progressivement s'investir dans tous
les champs du savoir, à condition encore une fois que les
actuels détenteurs des compétences acceptent de les
charger dans le système. Relations publiques obligeant, IBM
insiste évidemment sur le fait que ces experts ne seront
pas dépossédés de leur rôle social. Ils
seront seulement sollicités à un niveau supérieur,
leur permettant d'appliquer les ressources de leurs cerveaux à
des questions non triviales.
Ceux qui ont connu le début de l'utilisation des systèmes-experts
retrouveront les inquiétudes ressentis par les experts de
l'époque, face à l'éventualité de se
voir remplacer par de tels systèmes dans certains professions
supposant, comme par exemple la médecine, la formulation
de diagnostics à partir de milliers de données précédemment
mémorisées par la profession.
En fait, à l'époque, les craintes des professionnels
les plus avertis se sont apaisées, compte tenu des faibles
performances des «moteurs d'inférence» utilisés
par les systèmes experts. Ceux-ci ne se sont généralisés
que dans les systèmes où le champ des questions-réponses
restait limité (comme dans les annuaires téléphoniques
en ligne) ou dans ceux supportant une grande approximation, que
l'utilisateur peut corriger lui-même. C'est le cas des moteurs
de recherche modernes, Google et autre Yahoo.
Il
est indéniable qu'en ce qui concerne les performances, Watson
se rapproche beaucoup plus de celles déployées par
les humains, y compris dans le langage courant. Avec ce qui semble
être une grande aisance, il "comprend" des questions
posées en langage naturel, c'est-à-dire sans l'obligation
de respecter des formalismes permettant au système de ne
pas s'égarer dans des voies adjacentes inutiles. Il peut
fournir des réponses faisant appel à diverses sortes
de données non structurées, documents ou discours.
Il met en oeuvre une grande variété de méthodes
d'analyses permettant d'évaluer la façon dont les
réponses qu'il propose répondent aux questions. Et
tout ceci, répétons-le, à grande vitesse, ce
qui lui permet de satisfaire à l'une des contraintes du jeu
: actionner une sonnerie annonçant la réponse avant
le partenaire humain.
Une forme avancée d'Intelligence
augmentée
On peut donc considérer que Watson est une forme non pas
d'Intelligence artificielle (Artificial Intelligence) mais d'Intelligence
augmentée (Intelligence Augmentation). Dans le premier cas,
l'Intelligence artificielle incarne l'ambition de simuler le fonctionnement
intelligent du cerveau humain incorporé, y compris dans des
tâches comme l'imagination ou l'invention (poser des questions
plutôt que répondre à des questions). Dans le
second cas, l 'Intelligence augmentée s'efforce de rassembler
et confronter les connaissances de nombreux esprits distingués
dans leurs disciplines.
Même
si, outre le recueil d'un nombre illimité de connaissances,
elle permet la mise en oeuvre de capacités d'inférence
propres - voire supérieure - à celles de l'esprit
humain, l'Intelligence augmentée telle que celle de Watson
semble intrinsèquement incapable de répondre aux questions
bien plus complexes que se pose ou se posera l'Intelligence artificielle.
Reste à savoir si Watson nous éclaire en quoi que
ce soit sur le fonctionnement effectif des cerveaux humains, y compris
de ceux manifestement très "robotisés" des
compétiteurs attirés par le jeu Jeopardy!. Nous employons
ici ce mot "robotisés" en ce sens que ces humains,
comme tous ceux participant à ces sortes de "quizz",
quelles que soient leurs grandes qualités en termes de mémorisation
ou d'association, sont sans doute loin de pouvoir aborder avec beaucoup
de valeur ajoutée les grandes questions que se posent la
science, la philosophie ou la création artistique. Ceci étant,
ils font l'admiration justifiée de leurs contemporains par
l'étendue de leurs connaissances et leur alacrité
intellectuelle.
Or comment fonctionne leur cerveau ? Watson peut-il nous éclairer
en quoi que ce soit à cet égard ?
On peut en douter. Les cerveaux de ces humains ont enregistré
un grand nombre de données, qu'ils peuvent restituer sur
demande. Mais les bases neurales de leurs systèmes de mise
en mémoire, d'association, de recherche et de restitution
sont sans doute bien plus complexes que ne le sont les mémoires
informatiques de Watson. Quoi qu'en disent les ingénieurs
d'IBM, ces dernières ne ressemblent en fait quà des
bibliothèques accessibles par des catalogues plus ou moins
limités.
On
ne voit pas comment les mémoires informatiques de Watson,
même mises en oeuvre par des algorithmes complexes dont IBM
conserve le secret, pourraient intégrer les innombrables
processus associatifs, révélés notamment par
l'Imagerie fonctionnelle, s'établissant entre aires cérébrales
multiples, elles-mêmes en relation avec un grand nombre de
réseaux neuronaux intéressant la mémoire tout
entière d'un corps en situation.
Ce
sont ces associations - hors de portée des ordinateurs actuels
- qui entrent en jeu pour répondre aux questions posées
par Jeopardy!. Certes elles prennent plus de temps et peuvent fournir
de mauvaises réponses, contrairement à Watson. Ce
qui fait que l'humain est battu dans le jeu tel qu'il est organisé.
Mais cela ne veut pas dire que Watson, intrinsèquement, met
en oeuvre des processus plus riches que ceux de l'humain. A plus
forte raison, on ne voit pas comment Watson pourrait effectivement
imaginer et créer de façon pertinente, c'est-à-dire
faire face à des questions originales dont il n'aurait pas
déjà mémorisé les grandes catégories
de réponse.
Le
lecteur objectera que les meilleurs systèmes d'Intelligence
artificielle ou de robotique évolutionnaire ne se montrent
à ce jour guère plus convaincants. Ils peinent à
simuler l'intelligence créative. Ils n'éclairent guère
non plus la façon sans doute spécifique dont le cerveau
humain se comporte lorsqu'il fait montre de ce que nous appelons
l'intelligence, la conscience de soi et la créativité.
Nous
répondrons à cette objection justifiée que
rien n'interdit à l'avenir que les chercheurs en Intelligence
artificielle et en robotique améliorent les capacités
d'invention de leurs systèmes et permettent alors, avec l'appui
d'autres disciplines, notamment les neurosciences observationnelles,
de mieux comprendre le fonctionnement du cerveau.
Mais il faudra pour cela faire appel à une véritable
inventivité, et non à la «force brute»
déployée par les grands calculateurs.
C'est une ambition de cette ampleur qui anime le projet
évoqué sur notre site par Alain Cardon.
Dans
ce domaine, IBM semble céder à la même illusion
que nous avions signalée en évoquant son
projet Blue Brain. Ce ne sera pas en reconstituant une
mini-colonne de cortex avec la force brute de millions de composants
informatiques que l'on pourra obtenir les performances d'un cortex,
fut-ce celui d'un rat. De même les Watson et super-systèmes
experts à venir auront beau être chargés jusqu'à
étouffer de millions de connaissances, ils ne pourront jamais
en faire un usage aussi intelligent que le ferait un rat confronté
à la nécessité de sortir d'un labyrinthe.
PS.
Dans un article un peu technique publié sur son blog, http://blog.stephenwolfram.com/,
Stephen Wolfram compare à celles de Watson les méthodes
qu'il a utilisées sur son propre système de questions-réponses,
Wolfram/Alpha. Nous ne reprendrons pas l'argumentaire ici, mais
les spécialistes de la documentation automatique auront tout
intérêt à s'y référer.
(1)
Notons que le prix Turing (équivalent d'un prix Nobel de
linformatique) vient d'être décerné au
britannique Leslie Valiant, professeur à l'université
de Harvard, remarqué pour ses recherches autour de lintelligence
artificielle. Leslie Valiant a participé à la création
de Watson.