|

 | Text Mining et cartographie de l'information textuelle WordMapper permet d'identifier à l'aide de techniques statistiques, les thèmes abordés dans un ensemble de documents. Ces thèmes sont identifiés par la récurrence de certains mots clés. Ces thèmes et les mots associés sont représentés sur des graphiques interactifs.
|  |
| |
La méthode d'analyse : l'analyse des mots associés WordMapper adopte essentiellement une démarche statistique, (Text Mining). La méthode consiste à identifier les associations de mots dans les textes. Un calcul de cooccurrence est effectué pour identifier ces répétitions. Un puissant algorithme de classification permet de créer des clusters (ou agrégats homogènes de mots identifiant un thème). WordMapper représente sous la forme de graphiques ces clusters et les réseaux de relations entre les mots clés. Les clusters sont positionnés sur un graphique en fonction de leur indice de centralité et de densité. L'utilisateur peut revenir aux textes initiaux et consulter tous les segments de textes contenant les mots sélectionnés.
WordMapper fournit également tous les tableaux de résultats statistiques sur les mots et leurs cooccurrences.
WordMapper permet de lire de nombreux formats de documents : html, pdf, xml, texte, doc, xls, powerpoint...
|
 | Principales fonctionnalités de WordMapper Text : - Extraction des textes à partir d'une base documentaire importante
- Analyse linguistique et statistique du texte
- Analyse de gros volumes de données, des milliers de mots signifiants
- Import de documents html, MS-Word, RTF, texte, PDF, XML, forum, e-mails, base de données...
- Identification des mots composés
- Dictionnaires de mots à ignorer et de mots équivalents et de mots obligatoires
- Multilingue : anglais, français, allemand,...
- Puissants algorithmes de calcul (Text Mining), clusters, cartes, indexation du texte,...
- Navigation dans trois niveaux de cartes : thèmes, sous-thèmes, réseaux sémantiques
- Accès au texte initial à tout moment
- De nombreux résultats statistiques (matrice de cooccurrences, croisement avec les champs fermés, analyse factorielle...)
- Graphique des réseaux de collaboration en veille technologique ou en KM.
- Comparaison dans le temps de textes, pour identifier les signaux faibles
|
|



|