Regroupements non-disjoints de mots pour la classification de documents.

Guillaume Cleuziou
RÉSUMÉ . La classification automatique de documents est un domaine d'étude en plein essor dans le domaine du Traitement et de la Recherche d'Information (RI). Dans un cadre supervisé, il s'agit alors d'entraîner un modèle de classifieur sur un corpus de documents étiquetés. La difficulté majeure consiste à représenter les documents par un nombre limité et suffisant d'attributs. Dans cet article, nous proposons une méthode de regroupement de mots, basée sur l'algorithme PoBOC (Pole-Based Overlapping...
This data repository is not currently reporting usage information. For information on how your repository can submit usage information, please see our documentation.