Unnatural language detection.

Thomas Lavergne
RÉSUMÉ. Dans le contexte des moteurs de recherche sur le web, l'escalade entre les techniques de classement et les techniques de spamdexing a conduit à l'apparition de faux contenus dans les pages web. Si les séquences aléatoires de mots-clés sont facilement détectables, les pages web produites par des générateurs automatiques dédiés sont beaucoup plus difficiles à détecter. Motivé par cette application, on se concentrera sur le problème plus général de la détection du catactère peu-naturel...
This data repository is not currently reporting usage information. For information on how your repository can submit usage information, please see our documentation.