La catégorisation grammaticale automatique: adaptation du catégoriseur de Brill au français et modification de l'approche

Thibeault, Mélanie
Maître ès arts (M.A.)
Université Laval
FACULTÉ DES LETTRES
Maîtrise en linguistique

Directeur(trice) de recherche : Ladouceur, Jacques
2004-11

© Mélanie Thibeault, 2004

Résumé

La catégorisation grammaticale automatique est un domaine où il reste encore beaucoup à faire. De très bons catégoriseurs existent pour l’anglais, mais ceux dont dispose la communauté francophone sont beaucoup moins efficaces. Nous avons donc entraîné le catégoriseur de Brill pour le français pour ensuite en améliorer les résultats. Par ailleurs, quelle que soit la technique utilisée, certains problèmes restent irrésolus. Les mots inconnus sont toujours difficiles à catégoriser correctement. Nous avons tenté de trouver des solutions à ce problème. En somme, nous avons apporté une série de modifications à l’approche de Brill et évalué l’impact de celles-ci sur les performances. Les modifications apportées ont permis de faire passer les performances du traitement des mots inconnus français de 70,7% à 78,6%. Nous avons donc amélioré sensiblement les performances bien qu’il reste encore beaucoup de travail à faire avant que le traitement des mots inconnus français soit satisfaisant.


Table des matières

Liste des tableaux