Actes des Journées "Dictionnaires électroniques des XVIe-XVIIe s.", Clermont-Ferrand, 14-15 juin 1996 | I. Leroy-Turcan, "Intérêt d'une base informatisée pour le Dictionnaire Etymologique ou Origines de la Langue Françoise, 1694, de Gilles Ménage: les modalités de mise en oeuvre" |
Une base de données textuelles fondée sur un dictionnaire de langue et d'étymologies lui accorde le statut de texte à part entière avec ses spécificités stylistiques qui créent de multiples niveaux de significations: dès lors le lecteur est convié à aller bien au-delà de la simple consultation et devient plus que jamais un interlocuteur défiant les contingences de la temporalité. Une simple base au kilomètre ne permettrait pas au lecteur d'apprécier l'épaisseur historique de l'oeuvre.
1.2. Nous avons déjà présenté en octobre 1993 au colloque de Toronto consacré aux bases de données de dictionnaires anciens[7] l'essentiel des modalités de fonctionnement du DEOLF, préalable indispensable permettant de discerner les différentes strates significatives de la micro-structure du texte.
1.3. Notre propos s'articulera ici d'abord autour de deux pôles: la présentation de nos bases thématiques et l'évocation des difficultés rencontrées pour la mise oeuvre des bases en vue d'une consultation automatique optimale.
1.3.1. Nos bases thématiques sont, quoique relativement modestes, représentatives et riches d'enseignement; elles ont déjà été mises en oeuvre à l'occasion d'études ponctuelles menées sur le DEOLF; à la faveur des différentes communications préparées pour des colloques, nous avons réalisé trois séries de bases: des bases thématiques, des bases dictionnairiques et des bases bibliographiques.
Les premières, les bases thématiques, présentent l'avantage de couvrir l'ensemble du dictionnaire[8]: nous avons déjà à notre disposition une base Végétaux[9], une base Danse[10] et une base Mort[11], une base Marine étant encore en préparation. Les bases plus proprement dictionnairiques, puisqu'elles correspondent au corpus de l'ensemble d'une lettre du dictionnaire dans sa continuité et sa logique interne, sont celles des lettres G, I, J, K et R[12]. Les dernières, qu'on peut nommer bibliographiques, correspondent aux articles dans lesquels Ménage fait référence à des auteurs en particulier comme Rabelais[13], ou réunis dans un ensemble comme c'est le cas pour "Messieurs de l'Académie française", selon la formule chère à Ménage[14]. Nous avons aussi réalisé une base plus orientée vers la grammaire, la base Locutions[15], dans laquelle nous avons réuni des articles concernant des collocations, unités lexicales complexes, séquences relevant de la phraséologie.
1.3.2. L'évocation des difficultés: l'itinéraire de l'idéal premier à une réalité d'essais de mise en oeuvre nous renvoie de cette réalité à un autre idéal, réalisable à l'échelle des volontés individuelles: il s'agit pour nous d'être décidée à utiliser, sans l'illusion de la fausse facilité, un outil extraordinaire. De fait, outre la difficulté matérielle consistant, en l'absence de moyens financiers extérieurs, à se transformer en dactylo pour la simple saisie du texte, et ce, au détriment logique d'autres travaux, nous devons rester fidèle au texte original dans sa forme et dans son essence, sa dimension historique et culturelle. Il nous faut donc choisir entre deux types de bases, soit une base minimale limitée au texte du dictionnaire, sans aucune marque de l'intervention du spécialiste pour tout ce qui concerne l'analyse du texte, soit une base plus riche, jalonnée par le spécialiste de façon à guider efficacement l'utilisateur de la base, à rendre plus attractive la consultation d'un texte ancien, parfois difficile à suivre. Le choix de base s'inscrit dans une réflexion plus large sur l'utilisateur potentiel de la base, simplement intéressé ou déjà bon connaisseur des dictionnaires anciens, du XVIIe siècle, etc., ce qui oriente non seulement les modalités de saisie et de balisage ou jalonnage, mais les perspectives d'enrichissement de la base.
1.4. La saisie
Elle doit se faire à partir d'un original identifié comme tel[16] et en respectant absolument le texte de l'exemplaire de référence, qu'il s'agisse des graphies, de la ponctuation, des majuscules, des alinéas, etc.[17] Pour les caractères grecs ou hébraïques présents dans le DEOLF, nous pratiquons la translittération en indiquant toujours au préalable entre barres obliques de quelle langue il s'agit par les abréviations /gr/ ou /hb/, mais nous distinguons deux cas de figure: les mots grecs ou hébreux nommés dans le cours de la discussion étymologique et les formes présentes dans des citations. En effet, pour des raisons pratiques, le nombre et l'ampleur des citations nous contraignent, dans un premier temps du moins, à couper certaines citations exagérément longues ou à en supprimer, et à ne laisser que l'indication matérielle de la coupure par l'abbréviation "cit." avec des points de suspension entre crochets [...] (cf. Annexe 1, c) Les références et citations).
Le but d'une saisie efficace, qui soit en mesure de satisfaire les exigences scientifiques et déontologiques d'historiens du dictionnaire, est d'abord de neutraliser les risques, les dangers d'une informatisation uniformisatrice, donc réductrice, donc infidèle: nous renvoyons aux notes proposées dans le prélude et à nos précédents travaux sur ce sujet, tout particulièrement dans le cadre de l'informatisation de la première édition du Dictionnaire de l'Académie française[18].
[Suite] -- [Retour à la Table des matières]
Notes
2. Dans la continuité avec les Observations de
Ménage sur la langue françoise, dont la
première édition parue en 1672 a été
complétée et enrichie en 1675 et 1676: cet ouvrage
constitue une étape importante dans l'élaboration du
DEOLF. Le nombre important de références
à Vaugelas, critiqué ou approuvé, et la
présence d'un certain nombre d'exemples typiques du
dictionnaire de langue confirment cette orientation du
DEOLF. Pour la question de l'exemple en dictionnaire de
langue on retiendra surtout les points suivants: les exemples
donnés sans référence à un auteur
précis laissent implicitement comprendre qu'il s'agit de
"façons de parler": ils renvoient à un univers
discursif considéré comme connu de tous à une
époque donnée; l'expression formulée comme
exemple appartient à un discours extérieur
donné et largement compris, l'Usage ou les usages. Ces
exemples apparemment non marqués -- le plus souvent
limités à des syntagmes --, se trouvent dans des
contextes permettant de déterminer les différentes
sphères d'usages qu'ils représentent,
régionalismes par opposition avec l'Usage de la Cour,
vocabulaire technique ou spécialisé. Le statut
sémiotique de ces formulations, autonymes et ayant pour
seule fonction d'illustrer le mot vedette, rejoint celui des
exemples construits. L'exemple permet de dégager les
critères d'identification du mot vedette, comme s.v.
GAGUI, 1650 et 1694, nom commun, féminin, à
connotation péjorative (1650: "Comme quand on dit une
grosse gagui pour dire une grosse dondon." et 1694:
"comme quand on dit, une grosse gagui; cestadire une
grosse jeune femme."); sa présence suffit à
définir les conditions d'emploi de la forme rez dans
l'expression lexicalisée rez de chaussée (s.v.
REZ, 1650: "Comme quand on dit rez de
chaussée."). De même s.v. NECESSITÉ,
1650 et 1694 ("pour pauvreté, comme quand on dit,
cet homme est en grande necessité") et s.v.
REQUÊTE, 1694 ("... On dit Cela est de
requête pour dire Cela est à souhaiter ,
Cela est considérable; et de là
Pâté de requête.") ou encore s.v.
RIC-À-RIC, 1694 ("... Nous disons, faire quelque
chose ric-à-ric pour dire faire quelque chose
à la rigueur: ex rigida ratione juris... Mais nous
disons aussi RIC pour dire coupe, taille, coupure jusqu'à
la racine, jusqu'au fond, jusques au vif. TAILLE D'ARBRES A
RIC: arborum defectio ad ipsum truncum; ad ipsam radicem:
ROGNURES D'ONGLES RIC A RIC: ungium ad vivum exsectio.").
L'utilisation du verbe "dire" impose un parallèle avec
l'Académie. L'exemple permet aussi de préciser la
construction syntaxique du mot vedette comme s.v. ABOUQUER
("Abouquer du sel, c'est mettre du sel nouveau sur le vieu.
Voyez Pomey et Vénéroni.").
3. Cf. Horiot 1995 et Leroy-Turcan 1996a.
4. Cf. Leroy-Turcan 1995b, travail réalisé à
partir de la création de la base végétaux; une
base "vocabulaire de la marine" est en préparation.
5. Cf. notamment Leroy-Turcan 1991, 1993a, 1993b.
6. Cf. outre les titres précédemment cités,
Leroy-Turcan 1995c et à paraître.
8. Avec cependant la réserve concernant
l'exhaustivité que nous ne pouvons pas garantir absolument,
en l'absence d'une informatisation complète, tant que le
travail de base n'est que manuel.
9. Pour le 5ème colloque international de dialectologie et
de littérature tenu à Seillac en mai 1993
(cf. Leroy-Turcan 1995b).
10. Base saisie par Catherine Verdin, étudiante en Lettres
à l'Université Jean Moulin de Lyon.
11. Base saisie par Christine Grosse, étudiante en Lettres
à l'Université Jean Moulin de Lyon.
12. Ces lettres appartiennent à un corpus de lettres
choisies en raison de leur pertinence pour un ensemble de travaux
comparatifs sur les dictionnaires anciens (projet de travail
établi en collaboration avec T.R. Wooldridge): il s'agit du
corpus global des lettres A, G, I, N, O et R (= "AGINOR"). Nous
avons commencé par G pour des raisons historiques et
linguistiques, cette lettre regroupant des mots
particulièrement intéressants du point de vue
étymologique, cette lettre étant capitale pour les
discussions ayant opposé Furetière à
l'Académie; ce corpus de la lettre G est donc pertinent pour
la diachronie et pour la synchronie du XVIIe siècle. Le
corpus de la lettre R nous permet d'apprécier, pour le
DEOLF de Ménage, les marques du travail des
dernières années de vie de Ménage (cf. note
14). En vertu d'une logique de travail plus large, nous avons
choisi de commencer nos travaux sur le Dictionnaire de
l'Académie (1687 et 1694) sur les mêmes corpus
(cf. Leroy-Turcan 1996b).
13. Notre base Rabelais a été préparée
dans le cadre d'une réflexion sur le rôle des textes
littéraires dans l'enrichissement d'un corpus de
dictionnaire.
14. Notre base Académie a été
préparée pour le colloque international sur le
Tricentenaire du DEOLF de Ménage tenu à Lyon
en mars 1994 (actes parus en 1995) et pour le colloque
international du Tricentenaire de l'Académie
française tenu à Paris en novembre 1994 (cf.
Leroy-Turcan 1994b).
15. Base préparée pour notre contribution au colloque
international sur la locution organisé à Saint-Cloud
en novembre 1994 (actes à paraître).
16. Cf. Leroy-Turcan 1995a et 1996b.
17. En laissant telles quelles même les coquilles
évidentes.
18. Cf. Leroy-Turcan & Wooldridge 1995a et Leroy-Turcan 1996b.