Automates
Intelligents s'enrichit du logiciel
Alexandria.
Double-cliquez sur chaque mot de cette page et s'afficheront
alors définitions, synonymes et expressions constituées
de ce mot. Une fenêtre déroulante permet aussi
d'accéder à la définition du mot dans une
autre langue.
Diplômé
en économie, Dominique Dutoit est aussi titulaire d'un
doctorat ès Science. S'intéressant à
la linguistique et à l'informatique, il a cofondé
avec Patrick de Torcy la société Memodata en
1989, société qui propose aujourd'hui le logiciel
Alexandria (qui a retenu toute l'attention d'Automates Intelligents).
Ayant été à l'initiative de quelques
projets de recherche européens (dont CRISTAL, en 1993,
qui fut le premier projet en matière d'indexation sémantique
et de désambiguïsation) Dominique Dutoit considère
fondamentalement que maintenant, pour le français,
la première phase de description linguistique pour
l'ordinateur est achevée. Il s'agit donc désormais
d'entamer une deuxième phase dans laquelle chaque mot
deviendrait activateur d'algorithmes spécifiques. Dans
ce cadre, un premier objet de recherche est la réintégration
de tout ou partie des descriptions métalinguistiques
dans le coeur actif des dictionnaires électroniques.
Le chercheur prépare actuellement sa HDR (Habilitation
à diriger les recherches) dans le contexte de sa contribution,
en tant que membre des laboratoires du CNRS GREYC (informatique,
université de Caen) et CRISCO (informatique, Université
de Caen).
Christophe
Jacquemin (C.J) : Vous êtes le concepteur d'Alexandria, fantastique
logiciel d'aide contextuelle [aide à la compréhension
(définitions, traductions...] qui mérite bien aussi
le terme d'agent intelligent puisque ce service est disponible en
chaque lieu où il est installé. Quelle est la genèse
de la conception de ce logiciel ?
Dominique
Dutoit (D.T) : J'ai créé la société
Memodata avec mon collègue Patrick de Torcy il y a 16 ans,
c'est à dire il y a fort longtemps si lon considère
lambiance de révolution permanente qui existe dans
les technologies de linformation....
Notre objectif visait le développement d'un dictionnaire
du français qui augmenterait de façon sensible les
liens analogiques entre les mots, de telle façon que la recherche
de termes précis, pertinents, soit facilitée. L'idée
générale, toujours en grande partie vraie aujourd'hui
étant d'apporter une sorte de réponse à la
célèbre phase de Boileau "Ce qui se conçoit
bien s'énonce clairement et les mots pour le dire viennent
aisément" : ce qui est dit avec facilité
montre une belle maîtrise des mots, et le discours clair favorise
une bonne conception. Il sagit de faciliter lexpression
par une meilleure transmission des vocabulaires, précis ou
riches.
C.J
: En se replaçant 16 ans en arrière, on peut dire
que ce projet n'était pas lié au web... D.T : Oui, 1988/89 c'était bien avant l'apparition
des réseaux...
CJ
: Il s'agissait donc de concevoir un logiciel qui permette à
chacun de disposer d'un dictionnaire "amélioré"
? D.T : Oui, mais un dictionnaire que l'on a appelé
très rapidement "dictionnaire intégral ",
c'est à dire quelque chose, qui de façon massive,
ait lié les mots d'une même langue au moyen de composantes
sémantiques.
CJ
: Sentiez-vous déjà à cette époque toutes
les richesses potentielles de cette idée et l'ensemble des
domaines d'applications qu'elle pouvait couvrir ? D.T : En fait non. Nous n'avions pas
compris qu'une grosse partie de ce travail pouvait avoir d'autres
destinations, dans un secteur dont nous ne connaissions pas seulement
le nom. Il sagit du "traitement automatique des langues
". Nous avons réalisé bien après que ce
que nous étions en train de tricoter à la main pouvait
s'appliquer à différentes activités de ce domaine,
qu'il s'agisse de recherche documentaire, de correction orthographique
ou dintelligence artificielle...
CJ
: Donc deux composantes alors, l'une tournée vers l'utilisateur
humain, l'autre vers l'utilisateur machine... D.T : Oui, et ceci raconte finalement les
deux activités de notre société depuis plus
de 15 ans. Nous n'avons jamais bien su dire si nous travaillions
pour la machine ou plutôt pour l'humain, considérant
certainement qu'un bon modèle devait rendre service aux deux.
CJ
: Comment avez-vous réalisé ce dictionnaire ? D.T : Vous savez, les processus n'ont pas
énormément changé depuis des siècles.
D'un côté, il faut une méthodologie, dans notre
cas une série de logiciels conçus pour la tâche
CJ
: Oui, mais avant cela, sur quoi vous-êtes vous basés
pour prendre un mot et lui donner une définition ? D.T : La première version de ce qui était alors
Dicologique ne comportait pas encore de définitions, mais
seulement des quasi-définitions : des éléments
sémantiques qui permettent au lecteur de reconstituer le
sens, avec fort peu dénoncés complets. Nous
construisions un réseau associatif, un réseau analogique
riche, du français. Je me rappelle du tout début,
en 1989. Le premier mot qui ma vraiment intéressé
a été "abattre" (ce verbe étant au
début de lalphabet). Et six mois après nous
constations avec inquiétude que le travail sur "abattre"
progressait encore découvrant de nouvelles propriétés,
de nouvelles connivences, de nouvelles associations En fait,
depuis "abattre" cétait une grande partie
du lexique français qui était abordé...
CJ
: Un travail d'inspiration structuraliste... D.T : Exactement. Selon une approche très simple et
complète en apparence, mais qui a révélé
depuis quelques limites qui nous amène aujourdhui à
repenser une forme de déconstruction. Cette approche consistait
à dire : un mot recèle certains traits qui le définissent,
traits que l'on appelle en interne des "concepts", cest-à-dire
des objets non lexicaux. Et pour chacun des concepts qui définissent
ce mot-là, je vais faire en sorte que tous les mots qui utilisent
le même concept soient également donnés dans
la foulée, au moment de la déclaration des concepts.
CJ
: Par exemple ? D.T : Revenons au mot "abattre", faire tomber,
faire aller vers le bas, coucher. Ces notions entraînent celles
de mouvement, de causation, de haut et de bas, de verticalité,
dhorizontalité etc. Toutes ces notions décrivant
« abattre » décrivent également de nombreux
autres mots. Il faut leur fournir ces mots. Mais structuralement
ces notions appellent dautres notions plus abstraites : la
causation, la géométrie dans lespace, le mouvement
etc. Il faut encore remplir ces notions de nouveaux mots. Et ces
mots peuvent être très précis. Ils causent alors
la constatation de nouvelles notions, qui entraînent par analyse
la définition de nouveaux concepts. Le travail nest
pas sans fin. Mais il fallut plusieurs années pour que ce
big-bang qui a été pour nous « abattre »
finisse par voir son expansion faiblir, jusquà
aujourdhui, où les choses sont maintenant plutôt
stables. Je voudrais ajouter que cette respiration «notion»
/«artefact : concept» /«mot» est fondamentalement
au cur des mécanismes qui ont abouti au logiciel Alexandria.
CJ
: En fait, vous
êtes en train de me dire qu'avant l'heure, et bien avant internet,
ce logiciel revenait à faire de l'hypertexte... D.T : Oui, mais finalement, je ne dirais pas tout à
fait cela car avec ce logiciel, depuis pratiquement tous les nuds,
on arrivait à un très grand nombre de nuds.
Un lien hypertexte reste quand même un lien de 1 à
1, alors que là, ce sont en permanence des relations de 1
à n.
CJ
: Et vous n'étiez que deux pour faire tout cela ? Sans aucune
subvention ?
D.T : Vous savez, à cette époque, en France, ces
travaux très empiriques nintéressaient pas beaucoup.
On sintéressait alors à divers idéaux
à travers des objets comme l'analyse syntaxique, la logique
des prédicats etc. Mais nous avons reçu une subvention
du ministère de la Recherche. Ainsi, même si l'idée
de ce dictionnaire analogique n'était pas alors dans le vent
du fait de la difficulté d'en voir des applications, le projet
a été jugé intéressant. Les conseillers
ont dû se dire : on ne sait jamais, et peu d'autres sont sur
ce créneau. Peut-être un jour cela aura-t-il une importance...
Nous avons ainsi recruté un linguiste (Philippe Herr) qui
est resté presque 5 ans avec nous et a énormément
contribué à ce travail. Travail qui, pour l'humain,
s'appelle un "thésaurus" ou "ontologie lexicale",
et qui, en traitement des langues, s'appellerait "réseau
sémantique".
Ainsi, dès 1992, nous possédions une des plus grosses
fondations ontologiques et associatives au monde sur une langue
donnée.
CJ
: Un vrai travail
de bénédictins ! D.T : Oui, tous ces travaux de dictionnaire, d'un certain
point de vue sont des travaux de fourmis, chaque chose venant après
l'autre. Mais finalement, avec une approche très organisée
comme la nôtre, le travail de fourmi aboutit à une
structure. Aujourd'hui, lorsque je place un mot de plus dans le
dictionnaire intégral, il est immédiatement en relation
avec des milliers d'autres.
CJ
: Mais finalement,
comment cela se construit-il ? A la main ? On cherche les mots,
et autour d'un mot, on cherche toutes les idées et mots qui
s'y rapportent ? Quelle est la part d'automatisation dans ce travail
? D.T : En
fait, on ne les cherche pas parce qu'on les trouve dans nos connaissances
mais aussi et surtout... dans les dictionnaires ordinaires. Nous
essayons "simplement" d'avoir une vision critique et de
modéliser un contenant, d'organiser, de structurer. Et effectivement,
aujourd'hui, nous arrivons à automatiser certaines tâches.
Mais c'est parce qu'une grande masse de travail a été
faite préalablement. Il existe désormais une sorte
de socle, qui grandit et qui donne peu ou prou une certaine forme
de compétence de lecture ou d'"interprétation",
à la machine.
Mais au départ, la machine ne nous assistait pas du tout
puisqu'il n'y avait rien Il fallait bien lui déclarer
qu'il existe des mots, des noms, des verbes, le verbe "tomber",
le "haut", le "bas" Aujourd'hui, parce
qu'une infrastructure existe, cela va bien plus vite lorsque nous
avons besoin de reprendre une chose déjà existante.
CJ
: Ainsi, vous
avez commencé à la main et cela vous a donné
un modèle de la façon de coupler l'ensemble, puis
de le faire exécuter par la machine... D.T : Oui, mais nous sommes loin de l'automatisation complète
car celle-ci serait le dictionnaire qui se construit tout seul.
Je veux croire quune telle perspective soit envisageable,
pour quenfin nous puissions mettre un point final à
notre travail... mais il faut considérer que si à
un moment donné une telle automatisation était possible,
à un degré avancé, je me rends compte que nous
discutons ici sur le site dAutomates intelligents, cest
quune machine symbolique universelle aura été
conçue.
CJ
: Mais cela peut
devenir un objectif... D.T : Avec le langage, cest bien sûr lenjeu
qui fait encore rêver quelques uns dentre nous. Dont
nous. Peut-être pour dans vingt ans, pour un peu avant notre
retraite ? Mais pour le moment, il est très difficile de
travailler cette question. Nous connaissons finalement le même
genre de contradictions quen 1989. A lépoque,
les équipes sérieuses faisaient essentiellement de
la syntaxe, laissant sémantique et pragmatique aux discours
théoriques. Aujourdhui, des équipes sérieuses
travaillent de la sémantique mais dans des domaines très
limités. Mais nous ne croyons pas en la notion de domaine.
Je parlais tout à lheure de «déconstruction».
Disons que lenjeu actuel est encore le décloisonnement,
et quil reste très difficile de financer des recherches
sémantiques générales et empiriques.
CJ
: A quel moment
avez-vous pu viabiliser votre société ? D.T : Au début, nous maintenions notre entreprise
en diversifiant nos offres, en proposant aussi de la formation en
informatique, activité que nous avons définitivement
arrêtée à partir de 1995.
CJ
:Vous
avez Alexandria comme dictionnaire instalable sur un ordinateur.
Mais finalement, de quoi vivez-vous puisque
- même si c'est un peu différent - le logiciel peut
aussi être téléchargé gratuitement pour
une utilisation dans ses propres pages web ? Comment avez-vous pu
vous structurer et pérenniser l'entreprise ? D.T :
On peut en gros distinguer une succession de trois phases, certaines
plus tournées vers la recherche et d'autres vers le grand
public.
Pendant 15 ans nous avons assez peu ciblé la recherche pré-compétitive,
c'est-à-dire celle destinée à une utilisation
précise, dotée d'un marché. Nous avons tout
de même beaucoup travaillé en sous-traitance pour des
entreprises ou des laboratoires effectuant des recherches un peu
plus basiques et un peu plus fondamentales, et qui avaient besoin
d'un certain outillage pour effectuer ces recherches. Nous avons
donc conçu et vendu cet outillage destiné au développement
d'applications dans le domaine du traitement automatique des langues.
Ces entreprises (des grands groupes) venaient nous chercher puisque
nous avions accumulé une compétence qui était
inscrite... dans les disques durs. Cette activité, qui a
tourné à plein entre 1997 et 2003, donnait soit du
chiffre d'affaires parce que l'on avait vendu quelque chose, soit
des participations à des grands projets européens
ou autres. Mais à partir de 2003/2004, les financements des
grands projets déclinant un peu, nous enregistrions moins
de commandes. Nous avons alors regardé ce que nous avions
accumulé dans nos cartons qui pourrait être lancé
assez rapidement sur le marché, sachant que l'on ne pouvait
plus travailler - au moins pendant un certain temps - dans ces environnement
de recherche difficiles.
CJ
:Vous
êtes alors passé à une activité "grand
public"... D.T : Nous sommes alors passés à nouveau à
une activité grand public. Nous avions depuis longtemps un
projet dénommé "Village Langage", lequel
avait été proposé à la Commission Européenne
en 2000. Avec Alexandria vous avez une réalisation de ce
projet qui pourtant avait été rejeté.
CJ
:Quel
en est l'originalité ? D.T : Tout d'abord, son mode de distribution. En fait, c'est
quelque chose qui est strictement informatique, d'une grande originalité
puisque nous sommes ici en face d'un contenu directement destiné
aux auteurs de contenus et qui les valorise dans leur relation avec
les utilisateurs.
CJ
:Vous
parlez ici de l'application web ... D.T : Oui. Et c'est une application importante parce qu'Alexandria
conduit à un mode d'applications très diversifiées.
Exemple : je suis réparateur d'avions et mon collègue
m'envoie un mail me disant qu'il faut appliquer la procédure
MT-25-4... Je n'irai jamais dans mon moteur de recherche pour vérifier
cette procédure MT-25-4 si je crois m'en rappeler vaguement.
Tandis qu'avec ce que propose Alexandria (il suffit de cliquer sur
le mot pour avoir tout de suite le résultat), les langues
de spécialités (MT-25-4) et les langues générales
finissent par converger. On est ainsi toujours en situation d'apprenant,
mais en plus, encouragé par le système à être
cet apprenant-là.
CJ
:Un
logiciel qui permet, sans se déplacer, d'établir une
relation individuelle de formation permanente... D.T
: Oui. Une autre façon de dire les choses est que les
dictionnaires ne sont pas utilisés, ou relativement peu.
Alexandria permet de les rapprocher vraiment du moment où
ils peuvent être utilisés. Ces moments sont ceux de
la lecture d'un document. Là, il y a quelque chose d'intéressant...
CJ
:Est-ce
le seul outil de ce type existant au monde ? D.T : A ma connaissance, au niveau du modèle de diffusion
de l'information, il n'existe pas d'équivalent à ce
jour, en tous cas appliqué au transfert de connaissances.
Avec Alexandria, nous déplaçons
la relation : ce n'est pas moi qui prend la décision d'acheter
un dictionnaire, ou d'aller sur un site où l'on en trouve
un, ou de consulter un moteur de recherche pour trouver une information.
Ce sont ces objets-là qui sont ramenés directement
vers moi, non hors contexte mais dans le contexte de ma lecture
ou de mon travail. Autrement dit, Alexandria établit un espace
dans lequel l'information du dictionnaire n'est pas la même
d'une page à une autre : il forunit une information dépendante
du lieu où on la rencontre... (au contraire des implémentations
de barre d'outils dans Explorer qui fournissent la même information
quelle que soit la page - et quel que soit le profil du lecteur
- ndlr). En gros, le discours aujourd'hui est un discours en étoile
: il existe une source d'information, google par exemple, qui est
situé à un certain emplacement, et je vais à
cette source d'information pour y chercher quelque chose. Avec Alexandria,
nous sommes-là en présence d'une source d'informations
en réseau. Cette source qui se déplace de point en
point change potentiellement de contenu en fonction de l'endroit
où on la trouve. Des fonctions de profilage orientée
documents sont maintenant à inventer.
CJ
:Changeant
de taille et de contenu par rapport à quoi? Par rapport aux
mots que l'on peut rentrer nous mêmes dans le système
? D.T : Oui, par exemple. Mais il existe aussi des travaux
chez-nous ou dans des partenariats à l'étranger, qui
cherchent à appeler ou sélectionner des contenus qui
sont directement en relation avec la page (par exemple la bonne
traduction dans le contexte, mais également un certain niveau
de discours ou d'explication en fonction de la technicité
du document environnant).
CJ
:Par
moment, en cliquant sur une définition, on arrive sur un
lien... D.T : Oui. C'est un aspect complémentaire. Alexandria
n'édite pas uniquement les contenus dictionnairiques de Memodata.
C'est un média orienté vers les dictionnaires. Son
contenu est en réalité la propriété
d'un grand nombre d'ayant droits : une bonne vingtaine aujourd'hui,
essentiellement universitaires, mais pas uniquement. Selon les cas,
pour certains de ces contenus qui ne sont pas "langue générale
", est fourni immédiatement le lien vers le système
documentaire (car généralement il s'agit de tels systèmes)
ayant fourni cette définition.
CJ
:Le
fait de pouvoir éditer des contenus de très grande
qualité, plutôt institutionnels et de les rendre accessibles
sur un grand nombre de sites au travers d'Alexandria pourrait être
une dimension essentielle... D.T : Oui et ceci a donné
lieu au projet européen COHESION, projet de e-content auquel
nous avons postulé en Novembre 2005. COHESION est un acronyme
pour «Contextual Hypermedia Enhancing Dissemination».
Si dimportantes ressources ont été distribuées
aux établissements scolaires, scientifiques et culturels
pour développer des contenus internet, alors même que
ces contenus ont été élaborés, il savère
que ces derniers sont peu consultés par les internautes.
Exemple : si je tape "impressionnisme" sur google, le
musée d'Orsay arrive en 15ème ou 20ème page
écran ! Et bien avant, arrive en fait un peu de tout, voire
même des sites X. Avec un objet comme Alexandria - et c'est
l'idée qu'il y a dans "COHESION", ces contenus
institutionnels qui sont associés à des mots ou à
des thématiques extrêmement particulières seraient
référencés dans notre logiciel qui en proposerait
la découverte au cours de la lecture.
CJ
:Ceci
veut dire que si dans une
page web figurait le mot "impressionniste", un lien Alexandria
mènerait sur des définitions et proposerait suivant
la langue un lien vers les sites intéressants ? D.T : Non seulement la définition, mais on pourrait
aussi imaginer une fiche de présentation du musée
d'Orsay, celle-ci étant implémentée par le
responsable du site. Et ceci peut être traduit aujourd'hui
dans les faits à destination de plusieurs milliers de sites
web... Jai une bonne nouvelle, toute fraîche, à
annoncer à vos lecteurs. Je viens dapprendre ce matin
que COHESION est éligible. Cest une grande joie pour
nous de voir que ce projet que nous pilotons, qui groupe 12 partenaires
de douze pays européens, dont 10 universités ou académies,
est en passe dêtre définitivement accepté.
Cest une étape importante pour le succès à
long terme, européen, dAlexandria.
CJ
:Vous
vendez aussi le logiciel à des sociétés ? D.T
:Nous
commençons en effet à le vendre à des sociétés
souhaitant en disposer dans leur réseau intranet, l'objectif
étant d'y fournir aussi leur propre vocabulaire d'entreprise
en incorporant par exemple des éléments qui décrivent
l'organigramme, des processus ou procédures de tous types
(administratives ou techniques). Ainsi, au lieu de devoir se rendre
dans un système documentaire qui existe souvent par ailleurs,
mais qui n'est pas forcément consulté par les employés,
il vaut mieux que le système documentaire vienne à
eux.
Ceci pourrait aussi intéresser la fonction publique. Par
exemple en disposant d'Alexandria sur les sites du ministère
des Finances, avec un certain nombre d'explications concernant le
vocabulaire juridique et fiscal.
J'ai d'ailleurs remarqué qu'Automates Intelligents avait
commencé à créer ses propres fiches, notamment
pour le mot "Aibo" ou "mémétique",
puisqu'ils s'affichent en pointillés sur les pages où
ils apparaissent...
CJ
:Votre
système permet aussi de traduire un mot d'une langue à
l'autre. Ne
S'agit-il pour l'instant que de cela ? D.T
:
Tout dépend ici des langues. Notre entreprise Memodata est
par exemple le représentant en France du projet Wordnet (réseau
de mots) de l'université de Princeton http://wordnet.princeton.edu/,
projet américain qui a débuté un peu avant
notre Dictionnaire Intégral. Comme Memodata travaille depuis
15 ans plutôt sur un réseau conceptuel, Wordnet est
plutôt un réseau de mots. Ainsi, nous affichons dans
Alexandria des éléments de Wordnet puisque nous appartenons
à la même association. Donc si vous rechercher un mot
de l'anglais vers l'anglais, vous obtiendrez des définitions
en langue anglaise.
Par exemple, si vous tapez "chapeau" et demandez une traduction
de l'anglais vers l'anglais, vous verrez la définition "headdress
that protects the head from bad weather ; has shaped crown and usually
a brim". Et si vous cliquez dans l'un des mots de cette
définition, par exemple "head", vous arrivez alors
sur tout un monde...
Ce fonctionnement-là dépend exactement de l'évolution
des projets partenaires au nôtre. Donc potentiellement, le
but c'est que l'on puisse faire effectivement du wolof/wolof (langue
d'Afrique de l'ouest) et de pouvoir passer ensuite en coréen
par exemple.Il s'agit d'interconnecter toutes les langues pour passer
d'un discours de la langue vers elle-même à un discours
de la langue vers les autres langues à travers les différents
réseaux sémantiques.
CJ
:Quel
rapport voyez-vous entre votre outil Alexandria et un moteur de
recherche ? D.T
:
Je n'en vois aucun pour le moment, quoique, en en parlant ici avec
vous, me viennent évidemment certaines idées
Avec mozbot, qui travaille avec les données de google, existe
actuellement un projet basé sur le fait que les utilisateurs
ne connaissent pas forcément les termes idoines pour interroger
un moteur de recherche.
Eh bien chez-nous, dans cet ordre d'idée, et pour se placer
du côté d'une souveraineté européenne
en la matière, on pourrait imaginer une connexion entre le
moteur de recherche français Exalead (ndlr : qui doit
participer au projet européen Quaero, moteur dont le but
est de rivaliser avec Google) et Alexandria. L'internaute trouverait
le terme idoine à rechercher grâce à notre logiciel
(cf. l'encadré ci-dessous qui fournit des détails),
terme qui serait ensuite envoyé comme requête
dans le moteur. Donc là, il y a déjà cette
sorte de relation organique qui va s'établir entre les deux
: le mot et les idées qui vont avec et puis le service de
recherche sur le web.
Ce qu'Alexandria
essaie aussi d'établir, c'est une toile de sites de référence
sur des sujets précis (on rejoint le projet COHESION dont
je vous parlais plus haut) et là, d'une façon très
vigilante, il ne s'agit pas de la couverture du web en entier, mais
celle de certains lieux - totalement dignes de confiance parce que
c'est leur métier - qui ont traité étroitement
de certains sujets. Il s'agirait de proposer ces liens privilégiés
au fur et à mesure de la navigation.
Avec
Alexandria, retrouvez le terme exact.
Exemple : comment appelle-t-on le chapeau du pape ?
Vous
ne vous rappelez plus du mot définissant le chapeau
du pape, pourtant vous l'avez sur le bout de la langue...
Alors cliquez sur n'importe quel mot dans cette page pour
ouvrir la fenêtre Alexandria. Tapez alors, dans la
fenêtre en haut à gauche le mot chapeau, puis
cliquez sur le bouton OK.
Cliquez
ensuite sur le premier mot chapeau, qui apparaît en
gras, tout en haut de la fenêtre. Vous obtenez alors
une autre fenêtre (voir ci-dessous), vous faisant
pénétrer au coeur d'un réseau sémantique
qui vous propose de nouvelles entrées :
Choisissez
ensuite sur le dossier " coiffure de forme assez rigide".
En effet, même si vous ne vous rappelez pas du nom
du chapeau du pape, vous savez qu'il s'agit d'un truc en
hauteur avec une forme assez rigide. S'affiche alors la
fenêtre suivante :
Choisissez
ensuite "coiffure rigide d'homme" : le pape est
bien sûr un homme... Et là, apparaît
un dossier "tiare papale". Voilà le mot
que j'avais sur le bout de la langue.... : c'était
"tiare".
Si vous
cliquez dans le dossier "tiare papale" vous obtiendrez
alors cette fenêtre :
Puis,
en cliquant sur le mot "tiare" et en cliquant
encore sur le mot, vous obtiendrez sa définition
(que vous auriez pu aussi obtenir dès l'affichage
"tiare papale", simplement en tapant "tiare"
dans la petite fenêtre de recherche en haut à
gauche) :
CJ
:Parlons
maintenant de politique. N'existe-t-il pas un risque potentiel de
voir un tel outil récupéré un jour par une
puissance qui souhaiterait imposer à la planète son
dictionnaire mondial, mis au service des intérêts de
cette puissance ? D.T
: Vous
avez raison, il faut y penser. Au plan de l'interaction entre la
technologie et les sociétés, Alexandria est annonciateur
de quelque chose d'inéluctable, à savoir l'existence
de ressources de références, finalement peu nombreuses,
qui risquent de couvrir le monde entier. Et avec un système
comme Alexandria, on peut se retrouver avec une ressource de référence
pour quelque 200 langues.
Ainsi, se pose le problème de savoir quel va être le
statut juridique d'une telle ressource. Aujourd'hui, les internautes
savent bien que le web donne à la fois de l'information mais
aussi du bruit. Le web ne se présente pas comme un dictionnaire.
Or ici, nous sommes en face d'une construction qui peut techniquement
devenir hégémonique. Mais contrairement au web, il
sagit demblée dune ressource, voire dun
« savoir » réputé exact, de quelque chose
considéré comme étant le reflet direct de la
« vérité » Ne me demandez pas si
le dictionnaire dit la vérité, je ne le crois pas.
Mais c'est ce que la plupart d'entre nous croient. C'est le dictionnaire
qui va trancher. Et c'est un grave problème. Dans un tel
système, quelle sera à long terme la définition
du mot "démocratie" ou du mot "préservatif".
Quel pouvoir politique aura celui qui possède un tel logiciel
? Je pense ici à celui qui va donner le sens des mots pour
tous ceux qui n'auront pas à redéfinir un sens. Car
la plupart des gens ne vont pas redéfinir tous les mots
CJ
:Pouvez-vous
nous expliquer cela à partir d'un exemple ? D.T
:
Citons par exemple Google. Nombre de citoyens se sont inquiétés
(et je crois savoir qu'Automates Intelligents en fait partie) de
son projet de numériser les bibliothèques. Google
veut indexer TOUTES les bibliothèques, TOUS les bouquins
dans TOUTES les éditions, pour la planète entière.
On comprend bien cette inquiétude, mais dans une certaine
mesure, Google ne va pas changer le texte d'un philosophe comme
Pascal. Parce que ce serait d'abord un gros travail et puis, s'il
était fait (je ne vois d'ailleurs pas pourquoi), cela serait
immédiatement repérable. Tout ce que peut faire Google,
c'est augmenter sa fréquentation au détriment de celle
des bibliothèques. Il peut aussi éventuellement faire
varier l'ordre d'affichage des réponses, et donc exercer
une sorte de "biais politique" au profit d'objectifs particuliers
et privés. Je ne dis pas que ce n'est pas important, mais
ici, avec un logiciel comme le nôtre, nous nous trouvons en
face de quelque chose de beaucoup plus dangereux à long terme
: se servir du système pour présenter des choses qui
seraient réputées comme vraies, alors qu'elles ne
manifestent qu'un point de vue.
Comprenez-moi bien : je ne suis pas en train de dire qu'il faut
que les dictionnaires soient neutres. Mais si, par exemple, Wikipédia
(ndlr : encyclopédie libre sur le web, gratuite et multilingue
http://fr.wikipedia.org/wiki/Accueil)
affirme "on est neutres, il faut des articles neutres",
à mon avis on ne peut pas être neutre et il est faux
d'affirmer que l'on peut l'être. Plus encore, cette recherche
de la neutralité, si elle est sincère, aboutirait
à un appauvrissement généralisé. La
seule chose vraiment neutre est le néant. En cela, le neutre
soppose directement à la vie. Bref, il y a plusieurs
dangers à affronter. Comment ne pas permettre la manipulation.
Comment ne pas être neutre. A lépoque du politiquement
correct, ces deux notions se rapprochent dailleurs dangereusement.
Dans cette perspective, je ferai davantage confiance à lEurope,
du fait de toutes ses merveilleuses contradictions, quà
aucune nation pour encadrer un projet comme Alexandria. En tout
cas, il ne faut pas quAlexandria devienne le projet dune
très grosse entreprise. Au contraire, il faudrait quAlexandria
devienne une fédération. Un groupement dintérêts
de plusieurs natures, contradictoires, qui serait garant des libertés,
je veux dire de labsence de planification trop centralisée.
Memodata travaille jour et nuit à cette fin. Le succès
final de COHESION nous donnera un premier espoir.
CJ
:Ce
que vous voulez finalement dire, même s'il s'agit ici d'une
image de ma part pas forcément réaliste (quoique ?),
c'est que Google, avec les énormes moyens dont il dispose,
et fort des appuis dont il dispose (DARPA(1)), pourrait très
bien se voir un jour confier la mission de définir l'ensemble
des mots pour la planète entière ? Et ceci dans toutes
les langues, y compris bien sûr avec sa bonne définition
du mot "démocratie" ou du mot "préservatif
" ? Et ceci aux services d'intérêts d'une seule
puissance ? D.T
:
Oui, c'est exactement le fond de ma pensée. Alors vous imaginez
la catastrophe... Parce que là, nous sommes sur des contenus
qui ne peuvent pas dire la vérité, mais dont les internautes
croient à 99% qu'il s'agit bien d'elle. Je pense donc que
notre projet Alexandria devrait bien sûr être aidé
(pour les développements informatiques), mais plus encore
être très soigneusement entouré, encadré.
Et donc, nous essayons d'établir un comité scientifique,
un comité éthique multiculturel, avec nombre d'universités
et de chercheurs différents qui ont bien cela en tête.
Aujourd'hui cela ne paraît pas très important puisque,
avec 50 ou 100000 pages affichées par jour, nous n'avons
pas encore un gros impact. Mais un jour cela ne sera peut-être
plus de cette nature...
CJ
:Combien
êtes-vous dans ce réseau ? D.T
: Alexandria
est relié à une vingtaine d'établissements
dans le monde entier.
CJ
:Vous
avez évoqué Quaero, projet de moteur de recherche
européen destiné à concurrencer Google... D.T
: Oui, c'est
un besoin important, mais je pense qu'il ne faut pas se contenter
de refaire un produit comme Google, qui d'ailleurs, dans une certaine
mesure, a construit quelque chose de très intéressant.
Quaero doit être là pour obliger Google à continuer
d'être bon, mais pas forcément avec l'idée d'essayer
de prendre sa place.
Il faut que cela soit l'occasion de nous donner une certaine indépendance
dans un secteur vraiment stratégique. Un peu comme Galileo
par rapport au GPS, pour prendre ici un exemple dans un autre secteur.
L'Europe, avec ses 40 langues et sa diversité, pourrait avoir
quelque chose de très important à dire, un message
très clair et très important à donner au monde
à travers un système comme Alexandria. Et ceci actuellement
peut venir d'Europe, et pas d'outre Atlantique.
(1) Darpa : Defense Advanced Research Project
Agency. Département du DoD américain (Department of
Defense) particulièrement concerné par les recherches
en informatique.