Umap
Cartographie
dynamique
des données

Agent intelligent et méta-moteur,
Umap interroge plusieurs moteurs de recherche et propose
une représentation graphique des données (carte thématique)
à partir de mots-clés extraits des pages Web.
Edité par TRIVIUM

Umap

Du choix de líutilisateur (nombre de mots, niveau díexpertise) Umap choisit un ensemble de mots clés dont il élimine les mots outils (articles...), il associe à chaque mot un coefficient puis retient les mots ayant les coefficients les plus élevés. Il associe à chaque texte la liste de ses mots classés par fréquence d'apparition puis détermine ensuite des groupes de mots devant former une partition de l'ensemble des mots et les ordonne les uns par rapport aux autres.
Enfin, il crée une image de la répartition relative de ces groupes de mots permettant de découvrir la structure díordre entre ces groupes.

Liste des Mots-clés
Permet de vous rendre compte du contenu des documents
(síaffinera en fonction de vos actions sur la carte).

La Carte
Visualise la nature, le contexte, la cohérence des textes et les thèmes qui leur sont associés.

Liste des Documents
Résultat de la requête.

 La carte

  • Formée de zones colorées (une zone est un mot de la liste), la carte représente la proximité des mots à partir de leur importance relative dans chaque document. La couleur de chaque élément est fonction du nombre de documents qui contiennent le mot.
  • En regroupant les mots dans des zones de proximités (petites îles, presquíîles, couches concentriques) elle visualise les parentés des thèmes abordés par les documents.
  • En repérant les thèmes communs à certains textes, on peut sélectionner les textes intéressants et éliminer ceux qui sont inutiles.
  • La structure de la carte reflète la structure des listes de mots associés à chaque texte. Líeffet de structuration de ces listes est double :
    • Chaque liste propose un ordre entre les mots
    • Les listes partagent certains mots.

     

Carte et labels

 

La représentation

  • Le point focal est le point vide de la carte autour duquel se positionne líensemble des îles de la carte.
  • Le groupe de mots est le niveau díorganisation de la carte.
  • Le groupe de premier ordre, dans une île, est celui qui est le plus proche du point focal.
  • Un groupe est díautant plus proche du point focal quíil y aura beaucoup de pages dont la liste commence par un des mots de ce groupe.
  • A líintérieur de chaque groupe le positionnement de chaque mot tient compte de ses liens avec le groupe précédent.

    Une carte semble avoir du sens si les mots se positionnent de façon claire les uns par rapport aux autres :

    -

    nombreuses îles (indépendance des thèmes principaux),

    -

    nombreuses presquíîles (indépendance des thèmes secondaires),

    -

    peu de mots dans les groupes (pas de conflits dans líordonnancement des thèmes).

    Mais ce type de carte donne souvent des indications de faible qualité. Il importe donc díapprendre à interpréter des cartes moins évidentes.


Analyse d'une carte

  • La couleur indique si les mots sont contenus dans de nombreux ou dans peu de textes.
  • Les amorces des îles (groupes de premier ordre) indiquent les thèmes dominants. Si le taux díerreur est faible, chacune díelles regroupe les thèmes dominants díun ensemble particulier de textes qui peut être formé de plusieurs sous ensembles traitant de problèmes différents.
    Dans les îles très éloignées du point focal, les amorces permettent de repérer díéventuels signaux faibles et ainsi de découvrir quíun unique texte aborde un thème absent dans tous les autres.
  • Une bifurcation, au sein díune île, souligne des sous thématiques différentes. Quand elle engendre une presquíîle très longue et de couleur faible, cela souligne la présence díun texte particulièrement long contenant un vocabulaire spécifique (souvent un catalogue).
  • Les mots présents dans un groupe plus proche du point focal sont plus fréquents dans les textes que les mots díun groupe plus éloigné, pouvant souligner la relativité des thèmes les uns par rapport aux autres.
  • En augmentant les curseurs, la carte se transforme (cette transformation fait évoluer la liste de mots clés), elle devient plus facile à interpréter, mais il faut être plus attentif aux erreurs possibles.
  • Le fait d'éliminer les mots à forte fréquence permet de déceler des signaux faibles pouvant faire voir des choses très intéressantes.

http://www.umap.com/

D'un abord un peu déroutant Umap ne demande qu'une à deux heures d'apprentissage. Avant même d'ouvrir un seul document, de lire une seule ligne, on se doit de "travailler" la masse d'informations ... Le résultat de cette phase est une représentation facile à appréhender en un coup d'oeil. Les cartes ainsi créées peuvent être sauvegardées et des copies distribuées aux possesseurs d'une version d'Umap. Il serait judicieux que la société Trivium envisage la possibilité de créer des cartes auto-exécutables.

Conclusion

La masse d'informations que le documentaliste, l'enseignant ou l'élève doit manipuler croît de façon vertigineuse rendant illusoire l'idée même d'un accès rapide à l'information pertinente. Dans ce contexte, la représentation graphique des données, dont Umap est un de ses représentants, devrait tendre à se développer.

[toc] [L'informatique alternative] [retour]