Umap
Cartographie
dynamique
des données
|
Agent intelligent et
méta-moteur,
Umap interroge plusieurs moteurs de recherche et propose
une représentation graphique des données
(carte thématique)
à partir de mots-clés extraits des pages
Web.
Edité par TRIVIUM
|
|
Du choix de
líutilisateur (nombre de mots, niveau
díexpertise) Umap choisit un ensemble de mots
clés dont il élimine les mots outils
(articles...), il associe à chaque mot un coefficient
puis retient les mots ayant les coefficients les plus
élevés. Il associe à chaque texte la
liste de ses mots classés par fréquence
d'apparition puis détermine ensuite des groupes de
mots devant former une partition de l'ensemble des mots et
les ordonne les uns par rapport aux autres.
Enfin, il crée une image de la répartition
relative de ces groupes de mots permettant de
découvrir la structure díordre entre ces
groupes.
|
Liste des
Mots-clés
Permet de vous rendre compte du contenu des documents
(síaffinera en fonction de vos actions sur la
carte).
La
Carte
Visualise la nature, le contexte, la cohérence des
textes et les thèmes qui leur sont associés.
Liste des
Documents
Résultat de la requête.
|
|
|
La carte
- Formée de zones
colorées (une zone est un mot de la liste), la
carte représente la proximité des mots
à partir de leur importance relative dans chaque
document. La couleur de chaque élément est
fonction du nombre de documents qui contiennent le
mot.
- En regroupant les mots
dans des zones de proximités (petites îles,
presquíîles, couches concentriques) elle
visualise les parentés des thèmes
abordés par les documents.
- En repérant les
thèmes communs à certains textes, on peut
sélectionner les textes intéressants et
éliminer ceux qui sont inutiles.
- La structure de la carte
reflète la structure des listes de mots
associés à chaque texte. Líeffet de
structuration de ces listes est double :
- Chaque liste propose
un ordre entre les mots
- Les listes partagent
certains mots.
|

|
La représentation
- Le point focal est le
point vide de la carte autour duquel se positionne
líensemble des îles de la carte.
- Le groupe de mots est le
niveau díorganisation de la carte.
- Le groupe de premier
ordre, dans une île, est celui qui est le plus
proche du point focal.
- Un groupe est
díautant plus proche du point focal quíil y
aura beaucoup de pages dont la liste commence par un des
mots de ce groupe.
- A
líintérieur de chaque groupe le
positionnement de chaque mot tient compte de ses liens
avec le groupe précédent.
Une carte semble
avoir du sens si les mots se positionnent de
façon claire les uns par rapport aux
autres :
|
-
|
nombreuses
îles (indépendance des
thèmes principaux),
|
-
|
nombreuses
presquíîles (indépendance
des thèmes secondaires),
|
-
|
peu de mots dans
les groupes (pas de conflits dans
líordonnancement des
thèmes).
|
Mais ce type de
carte donne souvent des indications de faible
qualité. Il importe donc
díapprendre à interpréter
des cartes moins évidentes.
|
|

|
Analyse d'une carte
- La couleur indique si
les mots sont contenus dans de nombreux ou dans peu de
textes.
- Les amorces des
îles (groupes de premier ordre) indiquent les
thèmes dominants. Si le taux díerreur est
faible, chacune díelles regroupe les thèmes
dominants díun ensemble particulier de textes qui
peut être formé de plusieurs sous ensembles
traitant de problèmes différents.
Dans les îles très éloignées
du point focal, les amorces permettent de repérer
díéventuels signaux faibles et ainsi de
découvrir quíun unique texte aborde un
thème absent dans tous les autres.
- Une bifurcation, au sein
díune île, souligne des sous
thématiques différentes. Quand elle
engendre une presquíîle très longue
et de couleur faible, cela souligne la présence
díun texte particulièrement long contenant
un vocabulaire spécifique (souvent un
catalogue).
- Les mots présents
dans un groupe plus proche du point focal sont plus
fréquents dans les textes que les mots díun
groupe plus éloigné, pouvant souligner la
relativité des thèmes les uns par rapport
aux autres.
- En augmentant les
curseurs, la carte se transforme (cette transformation
fait évoluer la liste de mots clés), elle
devient plus facile à interpréter, mais il
faut être plus attentif aux erreurs
possibles.
- Le fait
d'éliminer les mots à forte
fréquence permet de déceler des signaux
faibles pouvant faire voir des choses très
intéressantes.
|
http://www.umap.com/
|
D'un abord un peu
déroutant Umap ne demande qu'une à deux heures
d'apprentissage. Avant même d'ouvrir un seul document,
de lire une seule ligne, on se doit de "travailler" la masse
d'informations ... Le résultat de cette phase est une
représentation facile à appréhender en
un coup d'oeil. Les cartes ainsi créées
peuvent être sauvegardées et des copies
distribuées aux possesseurs d'une version d'Umap. Il
serait judicieux que la société Trivium
envisage la possibilité de créer des cartes
auto-exécutables.
Conclusion
La masse d'informations que
le documentaliste, l'enseignant ou l'élève
doit manipuler croît de façon vertigineuse
rendant illusoire l'idée même d'un accès
rapide à l'information pertinente. Dans ce contexte,
la représentation graphique des données, dont
Umap est un de ses représentants, devrait tendre
à se développer.
|