Actes des Journées "Dictionnaires électroniques des XVIe-XVIIe s.", Clermont-Ferrand, 14-15 juin 1996 | | H. B.-Z. Shyldkrot, "Dictionnaires des verbes de l'ancien français" |
4. Corpus
L'étude de la syntaxe et du lexique des langues mortes doit être conduite sur des corpus. L'exploitation des textes par des méthodes manuelles est très longue. En plus, contrairement à l'analyse des langues modernes, où les phrases peuvent être soumises au jugement de grammaticalité des locuteurs natifs, aucune information n'est fournie en dehors du texte.
En préambule à la construction d'outils de traitement (dictionnaires et grammaires électroniques), il nous sera nécessaire de rassembler un corpus aussi étendu que possible. Cette tâche suppose:
- la normalisation informatique des textes déjà saisis, que des chercheurs ou éditeurs nous fourniront;
- la saisie directe de textes, soit par frappe soit par lecture optique.
Dans une première étape cette activité est prioritaire. Dans le cours des travaux son importance diminuera, mais il sera toujours nécessaire d'ajouter les textes qui sont nouvellement édités par des philologues.
On se limite à ce stade aux textes écrits avant 1350, date qui indique traditionnellement la fin de la période de l'ancien français et le début de celle du moyen français. On reviendra sur ce problème à la dernière partie.
[Suite] -- [Retour à la Table des matières]