Amélioration d'un corpus de requêtes à l'aide d'une méthode non-supervisée.

Vincent Bouvier & Patrice Bellot
RÉSUMÉ. Cet article présente une méthode d'amélioration d'un corpus de requêtes par regroupe- ment des mots qui sont graphiquement similaires. L'approche utilisée est basée sur une distance d'édition normalisée et sur des propriétés statistiques distributionnelles; elle ne s'appuie sur aucune base de connaissances. Cette méthode a été développée pour résoudre un problème in- dustriel: l'amélioration d'un corpus de libellés de produits diversement orthographiés. Le but de l'algorithme est de retrouver l'écriture la plus compréhensible pour...
This data repository is not currently reporting usage information. For information on how your repository can submit usage information, please see our documentation.