DictA

Sur le balisage "objectif"

Libres propos de R. Wooldridge

Comme toute objectivité, celle d'un balisage typographique simple est relative et jamais innocente. La réalisation d'une saisie valide ou la mise en oeuvre effective d'une collaboration passent nécessairement par des compromis intelligents et opératoires vis-à-vis des textes individuels ou mis en commun.

Pour illustrer ce point de vue, j'examinerai quelques aspects de la première page de G de Richelet 1680 dont il est donné sur ce site la page originale en mode image et une transcription avec balisage typographique. Les difficultés dont il est question se rencontrent aussi, bien sûr, dans d'autres dictionnaires.

Soit

1.
<page n="360">
<col n="0">
<omit=image>
<c><lc>G</lc></c>

Ce grand G marque le début de la section du dictionnaire des mots commençant par la lettre g. C'est sa fonction sémiotique. L'information donnée par sa taille est donnée aussi par sa position hors colonne en début de page et par la décoration en haut de la page; le balisage spécifique de sa taille ("très grande" ou "très très grande"?) n'est donc pas nécessaire au niveau sémiotique.

2.
<col n="1">
<p>
<sc>G</sc>, <i>SUBSTANTIF MASCULIN</i>.

2.1. Ce deuxième grand G a deux propriétés: l'une esthétique -- c'est une lettre ornée (sans l'ornement des premiers temps de l'imprimerie); l'autre sémiotique -- c'est une capitale de mot-vedette. Comme les mots-vedettes de Richelet 1680 sont imprimées en petites capitales (<sc>Gaban</sc> équivaut en surface à GABAN), ce deuxième grand G fonctionne sémiotiquement comme <sc>G</sc>.

2.2. Alors que la séquence "SUBSTANTIF MASCULIN" est en italique, le "U" de substantif est en fait un grand u romain minuscule et le "U" de masculin est un u romain majuscule; on pourrait parler d'autres "irrégularités". Le compromis consiste à ne considérer que le fonctionnement de l'ensemble.

3.
<i>G</i>. Cette lettre s'écrit dans quelques mots, & ne s'y
prononce pas; comme en ces mots, <i>assigner, résigner,
signer</i> qui se prononcent <i>siner, resiner,
assiner</i>.

L'on convient généralement de considérer la différence entre s long et s court comme non pertinente et de saisir les deux par "s".

4. (2e colonne)
<sc>Gâche</sc>

La petite capitale A circonflex est en fait un a circonflex. J'ai choisi, dans le modèle de balisage, de représenter GÂCHE, plutôt que GâCHE.

Conclusion. Il est donc toujours nécessaire de s'entendre avec soi-même ou avec ses collaborateurs sur la frontière à établir entre saisie typographique "simple" fonctionnelle et saisie typographique "complexe" esthétique pour cantonner la matérialité du texte dans des limites raisonnables. (Autant de termes à définir.)