Sous-graphes de cooccurrences pour la détection de thématiques dans un corpus de taille moyenne.

Aurélien Lauf
RÉSUMÉ. Ce papier aborde la question de la classification non supervisée de documents, dans un contexte de veille sur le Web (corpus de taille moyenne). Notre but est d'assister le veilleur dans deux tâches : 1. dégager des thématiques à partir du corpus ; 2. ranger chaque texte dans une ou plusieurs de ces thématiques. Nous proposons une approche linguistique, reposant sur les plus proches voisins partagés dans un graphe de cooccurrences. Nos thématiques peuvent...
This data repository is not currently reporting usage information. For information on how your repository can submit usage information, please see our documentation.