Apprentissage de conversion de documents semi-structurés à partir d'exemples.

Francis Maes, Ludovic Denoyer & Patrick Gallinari
RÉSUMÉ. Une majorité de travaux de Recherche d'Information dans les collections de documents semi-structurés se focalise sur le traitement de bases homogènes et ne sont pas utilisables sur des corpus de documents hétérogènes issus du Web par exemple. Nous présentons ici la mé- thode ISM (Incremental Structure Mapping) permettant la conversion de documents XML issus de sources hétérogènes dans un schéma de médiation. ISM est centrée document et permet la prise en compte simultanée de...
This data repository is not currently reporting usage information. For information on how your repository can submit usage information, please see our documentation.