L. Dagenais, L'informatisation du D.C. : Saisie, post-édition et lecture. Conventions |
Il existe deux reproductions du Dictionaire critique, l'une microfichée par les Archives de la linguistique française (#155), l'autre publiée en fac-similé par la maison Niemeyer (1994). Pour des raisons de lisibilité, qui tiennent essentiellement à l'encrage, nous avons recours aux deux reproductions. Ainsi, l'exemplaire microfiché affiche plus nettement certains apostrophes, accents et plusieurs traits d'union [1] mais l'encrage abondant y rend plus difficile la lecture de certains passages.
Adresse = le lexème ou la série de lexèmes en tête de l'article.
Reprise d'adresse; sous-adresse = adresse en tête du macro-article reprise dans le corps de l'article et unité lexicographique, souvent syntagmatique, absente de la série en tête du macro-article mais traitée dans l'article.
Pour l'instant, côté « cuisine », le texte du Dictionaire critique est saisi en Word Perfect et nous recourons à Word Cruncher pour le traitement des données (indexation, concordances, statistiques, interrogation). Le traitement neutralise donc les majuscules et les minuscules de même que divers attributs du texte imprimé (italique, exposants, etc.). La saisie est toutefois conçue de façon monosémique et permettra, au fil des développements technologiques, de rétablir à moindre coût la plupart des attributs matériels de l'imprimé.
Nous envisageons de recourir à SGML pour la constitution de pavés (texte, « ADDITIONS ET CORRECTIONS » fin du T. 3 , para-texte) et le balisage de la macro- et de la micro-structure. Nous restons toutefois attentifs et ouverts aux innovations.
Nous rapportons dans la suite les diverses conventions de la saisie du texte et le détail des conventions de nature philologique qui guident les relectures.
Le texte compte deux sections; la première, « Saisie : conventions et remarques », explicite tant le protocole de saisie que diverses mises en garde utiles aux clavistes; dans la seconde, « Orthographe, typographie », nous compilons les décisions de nature philologique qui garantissent l'uniformisation des relectures partagées entre les différents chercheurs.
Deux annexes complètent le document. La première décrit diverses tâches soustraites à la saisie et que, dans l'état actuel, nous estimons souhaitable de traiter automatiquement par macro-commandes à l'étape de la post-édition, quitte à en rectifier le résultat manuellement sur un sous-ensemble de données. Nous groupons dans la seconde annexe un large inventaire de variantes orthographiques et quelques « erreurs » de l'imprimé décrites en tête de la section « Orthographe, typographie » et que nous respectons à la saisie.
[Table des matières] [Suite: Saisie]
Notes