Actes des Journées "Dictionnaires électroniques des XVIe-XVIIe s.",
Clermont-Ferrand, 14-15 juin 1996
I. Leroy-Turcan, "Intérêt d'une base informatisée pour le Dictionnaire Etymologique ou Origines de la Langue Françoise, 1694, de Gilles Ménage: les modalités de mise en oeuvre"

Préludes

Informatiser un texte écrit, imprimé ou manuscrit, qu'il soit littéraire ou dictionnairique, c'est reconnaître l'intérêt qu'offre la création d'une base de données. Mais il faut rester conscient que le choix du texte à saisir est prédéterminé par les modalités de l'utilisation envisagée pour cette base: de fait, il est impératif d'informatiser une édition originale -- en ayant toute la méfiance qui s'impose face aux risques inhérents aux contrefaçons --, et nous ne ne saurions nous contenter ni d'une édition banale -- où l'existence éventuelle de cartons n'est pas à négliger -- ni d'une édition corrigée par les anciens ou les modernes; de plus, tout en gardant conscience de la spécificité de chaque édition et de chaque volume imprimé au sein d'une famille d'éditions, nous ne pouvons envisager la prise en compte de la pluralité des livres pour la seule informatisation d'un titre de dictionnaire. Mais, pouvons-nous nous contenter d'une simple saisie au "kilomètre"?

Une base de données textuelles fondée sur un dictionnaire de langue et d'étymologies lui accorde le statut de texte à part entière avec ses spécificités stylistiques qui créent de multiples niveaux de significations: dès lors le lecteur est convié à aller bien au-delà de la simple consultation et devient plus que jamais un interlocuteur défiant les contingences de la temporalité. Une simple base au kilomètre ne permettrait pas au lecteur d'apprécier l'épaisseur historique de l'oeuvre.

1. Introduction: Pourquoi informatiser le Dictionnaire Etymologique ou Origines de la Langue Françoise = DEOLF (1694) de Gilles Ménage (1613-1692)?

1.1. Ce dictionnaire, resté longtemps dans l'ombre d'autres dictionnaires du XVIIe siècle, dictionnaires de langue, comme ceux de Richelet, Furetière et de l'Académie française, est difficile à classer dans une famille lexicographique définie, puisque tout en s'annonçant, par son titre, étymologique, il assure aussi en partie les fonctions d'un dictionnaire de langue[2] et en partie celles de dictionnaires spécialisés (parlers dialectaux[3], vocabulaire technique[4]), ouvrant presque vers une fonction à visée encyclopédique. Cet ouvrage est en réalité fondamental dans l'histoire des dictionnaires et dans celle des théories linguistiques qu'ils impliquent[5]; de plus, écrit par un savant, grammairien et érudit, qui s'est intéressé à la fois à l'histoire ancienne de la langue française au sein des langues romanes et à la fois à la synchronie des usages linguistiques concurrents, ce dictionnaire représente l'aboutissement de toute une vie de chercheur[6] et on ne peut plus ignorer le rayonnement de cette oeuvre dans les réflexions du XVIIème siècle sur la langue française, et au-delà, sur le traitement de l'histoire du lexique, des structures syntaxiques qui le portent, dans le genre du dictionnaire.

1.2. Nous avons déjà présenté en octobre 1993 au colloque de Toronto consacré aux bases de données de dictionnaires anciens[7] l'essentiel des modalités de fonctionnement du DEOLF, préalable indispensable permettant de discerner les différentes strates significatives de la micro-structure du texte.

1.3. Notre propos s'articulera ici d'abord autour de deux pôles: la présentation de nos bases thématiques et l'évocation des difficultés rencontrées pour la mise oeuvre des bases en vue d'une consultation automatique optimale.

1.3.1. Nos bases thématiques sont, quoique relativement modestes, représentatives et riches d'enseignement; elles ont déjà été mises en oeuvre à l'occasion d'études ponctuelles menées sur le DEOLF; à la faveur des différentes communications préparées pour des colloques, nous avons réalisé trois séries de bases: des bases thématiques, des bases dictionnairiques et des bases bibliographiques.

Les premières, les bases thématiques, présentent l'avantage de couvrir l'ensemble du dictionnaire[8]: nous avons déjà à notre disposition une base Végétaux[9], une base Danse[10] et une base Mort[11], une base Marine étant encore en préparation. Les bases plus proprement dictionnairiques, puisqu'elles correspondent au corpus de l'ensemble d'une lettre du dictionnaire dans sa continuité et sa logique interne, sont celles des lettres G, I, J, K et R[12]. Les dernières, qu'on peut nommer bibliographiques, correspondent aux articles dans lesquels Ménage fait référence à des auteurs en particulier comme Rabelais[13], ou réunis dans un ensemble comme c'est le cas pour "Messieurs de l'Académie française", selon la formule chère à Ménage[14]. Nous avons aussi réalisé une base plus orientée vers la grammaire, la base Locutions[15], dans laquelle nous avons réuni des articles concernant des collocations, unités lexicales complexes, séquences relevant de la phraséologie.

1.3.2. L'évocation des difficultés: l'itinéraire de l'idéal premier à une réalité d'essais de mise en oeuvre nous renvoie de cette réalité à un autre idéal, réalisable à l'échelle des volontés individuelles: il s'agit pour nous d'être décidée à utiliser, sans l'illusion de la fausse facilité, un outil extraordinaire. De fait, outre la difficulté matérielle consistant, en l'absence de moyens financiers extérieurs, à se transformer en dactylo pour la simple saisie du texte, et ce, au détriment logique d'autres travaux, nous devons rester fidèle au texte original dans sa forme et dans son essence, sa dimension historique et culturelle. Il nous faut donc choisir entre deux types de bases, soit une base minimale limitée au texte du dictionnaire, sans aucune marque de l'intervention du spécialiste pour tout ce qui concerne l'analyse du texte, soit une base plus riche, jalonnée par le spécialiste de façon à guider efficacement l'utilisateur de la base, à rendre plus attractive la consultation d'un texte ancien, parfois difficile à suivre. Le choix de base s'inscrit dans une réflexion plus large sur l'utilisateur potentiel de la base, simplement intéressé ou déjà bon connaisseur des dictionnaires anciens, du XVIIe siècle, etc., ce qui oriente non seulement les modalités de saisie et de balisage ou jalonnage, mais les perspectives d'enrichissement de la base.

1.4. La saisie

Elle doit se faire à partir d'un original identifié comme tel[16] et en respectant absolument le texte de l'exemplaire de référence, qu'il s'agisse des graphies, de la ponctuation, des majuscules, des alinéas, etc.[17] Pour les caractères grecs ou hébraïques présents dans le DEOLF, nous pratiquons la translittération en indiquant toujours au préalable entre barres obliques de quelle langue il s'agit par les abréviations /gr/ ou /hb/, mais nous distinguons deux cas de figure: les mots grecs ou hébreux nommés dans le cours de la discussion étymologique et les formes présentes dans des citations. En effet, pour des raisons pratiques, le nombre et l'ampleur des citations nous contraignent, dans un premier temps du moins, à couper certaines citations exagérément longues ou à en supprimer, et à ne laisser que l'indication matérielle de la coupure par l'abbréviation "cit." avec des points de suspension entre crochets [...] (cf. Annexe 1, c) Les références et citations).

Le but d'une saisie efficace, qui soit en mesure de satisfaire les exigences scientifiques et déontologiques d'historiens du dictionnaire, est d'abord de neutraliser les risques, les dangers d'une informatisation uniformisatrice, donc réductrice, donc infidèle: nous renvoyons aux notes proposées dans le prélude et à nos précédents travaux sur ce sujet, tout particulièrement dans le cadre de l'informatisation de la première édition du Dictionnaire de l'Académie française[18].

[Suite] -- [Retour à la Table des matières]


Notes

2. Dans la continuité avec les Observations de Ménage sur la langue françoise, dont la première édition parue en 1672 a été complétée et enrichie en 1675 et 1676: cet ouvrage constitue une étape importante dans l'élaboration du DEOLF. Le nombre important de références à Vaugelas, critiqué ou approuvé, et la présence d'un certain nombre d'exemples typiques du dictionnaire de langue confirment cette orientation du DEOLF. Pour la question de l'exemple en dictionnaire de langue on retiendra surtout les points suivants: les exemples donnés sans référence à un auteur précis laissent implicitement comprendre qu'il s'agit de "façons de parler": ils renvoient à un univers discursif considéré comme connu de tous à une époque donnée; l'expression formulée comme exemple appartient à un discours extérieur donné et largement compris, l'Usage ou les usages. Ces exemples apparemment non marqués -- le plus souvent limités à des syntagmes --, se trouvent dans des contextes permettant de déterminer les différentes sphères d'usages qu'ils représentent, régionalismes par opposition avec l'Usage de la Cour, vocabulaire technique ou spécialisé. Le statut sémiotique de ces formulations, autonymes et ayant pour seule fonction d'illustrer le mot vedette, rejoint celui des exemples construits. L'exemple permet de dégager les critères d'identification du mot vedette, comme s.v. GAGUI, 1650 et 1694, nom commun, féminin, à connotation péjorative (1650: "Comme quand on dit une grosse gagui pour dire une grosse dondon." et 1694: "comme quand on dit, une grosse gagui; cestadire une grosse jeune femme."); sa présence suffit à définir les conditions d'emploi de la forme rez dans l'expression lexicalisée rez de chaussée (s.v. REZ, 1650: "Comme quand on dit rez de chaussée."). De même s.v. NECESSITÉ, 1650 et 1694 ("pour pauvreté, comme quand on dit, cet homme est en grande necessité") et s.v. REQUÊTE, 1694 ("... On dit Cela est de requête pour dire Cela est à souhaiter , Cela est considérable; et de là Pâté de requête.") ou encore s.v. RIC-À-RIC, 1694 ("... Nous disons, faire quelque chose ric-à-ric pour dire faire quelque chose à la rigueur: ex rigida ratione juris... Mais nous disons aussi RIC pour dire coupe, taille, coupure jusqu'à la racine, jusqu'au fond, jusques au vif. TAILLE D'ARBRES A RIC: arborum defectio ad ipsum truncum; ad ipsam radicem: ROGNURES D'ONGLES RIC A RIC: ungium ad vivum exsectio."). L'utilisation du verbe "dire" impose un parallèle avec l'Académie. L'exemple permet aussi de préciser la construction syntaxique du mot vedette comme s.v. ABOUQUER ("Abouquer du sel, c'est mettre du sel nouveau sur le vieu. Voyez Pomey et Vénéroni.").

3. Cf. Horiot 1995 et Leroy-Turcan 1996a.

4. Cf. Leroy-Turcan 1995b, travail réalisé à partir de la création de la base végétaux; une base "vocabulaire de la marine" est en préparation.

5. Cf. notamment Leroy-Turcan 1991, 1993a, 1993b.

6. Cf. outre les titres précédemment cités, Leroy-Turcan 1995c et à paraître.

7. Cf. Leroy-Turcan 1994a.

8. Avec cependant la réserve concernant l'exhaustivité que nous ne pouvons pas garantir absolument, en l'absence d'une informatisation complète, tant que le travail de base n'est que manuel.

9. Pour le 5ème colloque international de dialectologie et de littérature tenu à Seillac en mai 1993 (cf. Leroy-Turcan 1995b).

10. Base saisie par Catherine Verdin, étudiante en Lettres à l'Université Jean Moulin de Lyon.

11. Base saisie par Christine Grosse, étudiante en Lettres à l'Université Jean Moulin de Lyon.

12. Ces lettres appartiennent à un corpus de lettres choisies en raison de leur pertinence pour un ensemble de travaux comparatifs sur les dictionnaires anciens (projet de travail établi en collaboration avec T.R. Wooldridge): il s'agit du corpus global des lettres A, G, I, N, O et R (= "AGINOR"). Nous avons commencé par G pour des raisons historiques et linguistiques, cette lettre regroupant des mots particulièrement intéressants du point de vue étymologique, cette lettre étant capitale pour les discussions ayant opposé Furetière à l'Académie; ce corpus de la lettre G est donc pertinent pour la diachronie et pour la synchronie du XVIIe siècle. Le corpus de la lettre R nous permet d'apprécier, pour le DEOLF de Ménage, les marques du travail des dernières années de vie de Ménage (cf. note 14). En vertu d'une logique de travail plus large, nous avons choisi de commencer nos travaux sur le Dictionnaire de l'Académie (1687 et 1694) sur les mêmes corpus (cf. Leroy-Turcan 1996b).

13. Notre base Rabelais a été préparée dans le cadre d'une réflexion sur le rôle des textes littéraires dans l'enrichissement d'un corpus de dictionnaire.

14. Notre base Académie a été préparée pour le colloque international sur le Tricentenaire du DEOLF de Ménage tenu à Lyon en mars 1994 (actes parus en 1995) et pour le colloque international du Tricentenaire de l'Académie française tenu à Paris en novembre 1994 (cf. Leroy-Turcan 1994b).

15. Base préparée pour notre contribution au colloque international sur la locution organisé à Saint-Cloud en novembre 1994 (actes à paraître).

16. Cf. Leroy-Turcan 1995a et 1996b.

17. En laissant telles quelles même les coquilles évidentes.

18. Cf. Leroy-Turcan & Wooldridge 1995a et Leroy-Turcan 1996b.