Outils et informations à propos de ce PAF

Objectif

A partir d'un corpus de documents issus du programme scolaire français, extraire les liens entre les documents, leurs similarités et les notions qui en ressortent. Le premier but de ce traitement est d'avoir une analyse statistique des mots dans un contexte (ici le corpus de documents défini autour du programme scolaire français)
Dans un second temps, l'objectif est d'extraire de cette masse de mots, sans véritable sens pour une machine, des informations pertinentes et éventuellement de les relier à des sources d'informations externes (Wikipédia...). On utilise aussi des ontologies (comme l'ontologie de Bloom) qui permettent de dégager des concepts d'un corpus.
Il s'agit donc de donner aux textes bruts, un sens, repérable par une machine (grâce à des métatags).

Outils et technologies utilisés

Notions abordées

Traitement des données

Visualisation des données

Vocabulaire