Apprentissage d'un espace de concepts de mots pour une nouvelle représentation des données textuelles.

Young-Min Kim, Jean-François Pessiot, Massih-Reza Amini & Patrick Gallinari
RÉSUMÉ. Dans cet article nous proposons une technique à base d'apprentissage non-supervisé pour la réduction de dimension des données textuelles. Cette technique est basée sur l'hypo- thèse que les termes co-occurrants dans les mêmes documents avec les mêmes fréquences sont sémantiquement proches. Suivant cette hypothèse les termes sont d'abord regroupés avec l'al- gorithme CEM qui est une version classifiante de l'algorithme EM. Les documents sont ensuite représentés dans l'espace de ces groupes de termes. Nous...
This data repository is not currently reporting usage information. For information on how your repository can submit usage information, please see our documentation.