La lexicographie et la Toile

Russon Wooldridge

University of Toronto

© 2007-2008 R. Wooldridge

(Article tiré d'une communication faite dans le cadre d'un colloque tenu à Nancy en janvier 2008.)


Introduction

Les conditions d'usage des dictionnaires ont changé. Pour prendre l'exemple des membres de l'Université de Toronto, et par extension celui de la plupart des étudiants et universitaires des pays développés, le point de départ dans la recherche d'informations n'est plus la bibliothèque mais Internet. Tous les étudiants et enseignants de l'Université de Toronto ont une connection Internet chez eux et c'est surtout chez eux qu'ils travaillent en dehors des cours en salle de classe. Pour l'apprenant d'une langue seconde, par exemple, l'écoute, la lecture et l'expression écrite sont avant tout des activités inviduelles, qui se font de plus en plus à l'aide des outils d'Internet. Par conséquent, ce sont les dictionnaires en ligne et les informations de la Toile, nom québécois du World Wide Web, qui servent en premier lieu à informer les étudiants canadiens.

Dans cette communication je voudrais évoquer trois types de dictionnaires de langue en ligne : les dictionnaires statiques, les dictionnaires dynamiques et les dictionnaires ou encyclopédies mi-statiques, mi-dynamiques. Dans les exemples de mots cherchés dans des ressources en ligne, je parlerai aussi des informations non-dictionnairiques qui peuvent se trouver dans le Web en général. [1]

Les dictionnaires statiques

Le mentionnerai ici deux dictionnaires en ligne accessibles aux étudiants et enseignants de l'Université de Toronto : le Trésor de la langue française informatisé (ou TLFI), librement accessible dans le Web, et le Petit Robert sur CD-ROM (ou PR), accessible en ligne avec mot de passe aux membres de l'Université.

Il s'agit de dictionnaires statiques dans le sens que leur contenu ne change pas d'une édition à l'autre, alors que le lexique et la langue sont dynamiques. On peut noter que la lexicographie traditionnelle, par sa nature statique, a le désavantage d'être obsolescente. Les dictionnaires dynamiques étant, comme la langue, dynamiques, pluriels et anonymes sont à même de suivre l'évolution du lexique tout en n'ayant pas l'autorité conférée par la rédaction professionnelle des dictionnaires statiques.

Les dictionnaires dynamiques

La macrolexicographie dynamique n'est possible qu'à travers un réseau électronique tel qu'Internet et y est devenue réalité grâce à ce qu'on appelle le Web 2.0, c'est-à-dire le Web interactif, et ce grâce au wiki. Selon le Wiktionnaire (dont je parlerai plus loin), un wiki est un "Site web dynamique dont les pages peuvent être modifiées par tout visiteur. Un wiki permet non seulement de communiquer et diffuser rapidement des informations, mais aussi de les structurer pour permettre de naviguer aisément. Wikipédia est l'exemple le plus célèbre d'un wiki."

Wikipedia, toutes langues confondues, serait, d'après les statistiques du 3 octobre 2007 de la page "Top 500" d'Alexa, compagnie d'informations sur le Web, le neuvième site web le plus consulté dans le monde, derrière des sites comme Yahoo!, Google, YouTube ou Facebook. Pour la France, Wikipédia, logiquement surtout dans sa version française, était au rang du treizième site le plus consulté. [2]

Les critiques adressées à l'endroit de Wikipedia ont été et sont restées nombreuses, surtout au sujet de l'anonymat des articles. Cependant, une étude sur échantillonnage menée par la prestigieuse revue scientifique Nature en décembre 2005 conclut que la qualité des articles de Wikipedia est à peu près la même que celle des articles de l'Encyclopaedia Britannica. [3]

Wikipédia, en principe une encyclopédie mais en réalité un dictionnaire encyclopédique, a été lancé, dans sa version française, en mars 2001. À la date du 3 octobre 2007, la version française contenait 565 248 articles (contre 2 034 274 pour la version anglaise). On peut suivre, du moins depuis un an et demi environ, sur le site de Wikipédia l'évolution de l'article consacré à un terme donné, en comparant les différentes versions et en lisant le détail des modifications apportées à tel ou tel état de l'article.

Le Wiktionnaire, application dérivée de Wikipédia, comme son nom le suggère, est un dictionnaire et non une encyclopédie, « un dictionnaire libre et gratuit que chacun peut améliorer » (page d'accueil du Wiktionnaire). Tout comme Wikipédia, le Wiktionnaire est dynamique et permet de retrouver les différents états antérieurs d'un article. [4]

Les solutions intermédiaires

Pour l'instant, il n'y a pas d'autres solutions pour le français. Du côté de l'anglais, il y en a deux que je mentionnerai ici : le Oxford English Dictionary (ou OED) et Citizendium.

Le OED en ligne fait des mises à jour régulières tous les trois mois. Les modifications et ajouts sont le fait des éditeurs mais, comme du temps de James Murray, éditeur en chef de la première édition, les contributions des lecteurs bénévoles sont toujours sollicitées. Aujourd'hui, sur le site web du OED, les lecteurs sont invités à soumettre des mots pour inclusion et à contribuer de nouvelles attestions de mots déjà enregistrés dans le dictionnaire. [5]

Citizendium a été lancé publiquement en mars 2007 par un des fondateurs de Wikipedia, Larry Sanger, qui voulait, pour contrer l'anonymat de Wikipedia, que tous les articles de cette nouvelle encyclopédie en ligne soient signés par une personne reconnue, du moins par le conseil de rédaction de Citizendium, comme spécialiste du domaine en question. L'encyclopédie croît ainsi en autorité mais en même temps court le danger d'être moins complète et moins dynamique. [6]

Quelques exemples de mots cherchés dans les ressources en ligne

1. peoplisation / peopolisation / pipolisation

Ce mot récent que l'on rencontre partout des les médias est absent des deux dictionnaires statiques en ligne mentionnés ci-dessus, le TLFI et le PR.

Il est enregistré par Wikipédia, l'article du mot évoluant avec le temps. En juin 2006, l'essentiel de l'article était comme suit :

Le 5 septembre 2006, l'article commençait de la façon suivante :

Le 3 octobre 2007 enfin, l'article commençait comme suit :

On notera, en plus de l'évolution du sens, celle des graphies. À la date du 15 janvier 2008, l'article du Wiktionnaire était comme suit :

Pour se donner une idée plus précise de la fréquence relative des graphies, on peut regarder dans le Web global les chiffres affichés par Google :

2. doudou

Le chanteur québécois Richard Desjardins dit à la jeune fille Caroline, dans sa chanson Caroline, qu'elle n'est plus enfant et qu'il est temps qu'elle quitte la maison de ses parents. Il lui enjoint :

Voici l'article doudou tel qu'il est donné par le TLFI et le PR :

Caroline aurait-elle une femme de chambre? C'est peu probable. C'est le Web qui donne le vrai sens du mot dans ce contexte.

3. douet

Sillonnant les petites routes de l'Auge en Normandie en 2003, j'ai été intrigué par le panneau "Route des Douets" qui se rencontrait plusieurs fois au bord de la route. Ayant fui un instant la canicule en nous installant sur la terrasse ombragée de l'auberge de Saint-Hymer à côté du ruisseau qui nous rafraîchissait en même temps qu'il alimentait un joli lavoir, j'ai demandé à la jeune serveuse ce que voulait dire ce mot de douet. Elle nous a répondu que c'était le nom du ruisseau.

De retour à la maison, j'ai eu confirmation de la nature régionale du mot en ne le trouvant ni dans le Petit Robert, ni dans le TLF / TLFI. Je l'aurais sûrement trouvé à la bibliothèque dans un dictionnaire spécialisé ou un glossaire, mais le Web m'a informé tout de suite et de façon plus complète que n'importe quel dictionnaire imprimé. J'ai trouvé une dizaine de pages pertinentes, plusieurs accompagnées d'images, dont une consacrée à Saint-Hymer qui me disait que

Une autre sur Villers-sur-Mer m'informait que

Wikipédia, depuis août 2007, contient l'article suivant :

Conclusion

On parle d'une mise à jour du TLF / TLFI, mais la volonté politique et un personnel adéquat sembleraient manquer. La solution intermédiaire offerte par le modèle du OED (voir ci-dessus), où on demanderait aux lecteurs de proposer à un conseil de rédaction des mots à ajouter avec attestations de ces mots, pourrait permettre à la situation d'évoluer. De toute façon, il ne faut pas oublier que ce sont les dictionnaires dynamiques en ligne et le Web en général que les étudiants consultent en premier.


Notes

1. La seule contribution que l'auteur de la présente communication a faite aux dictionnaires mentionnés ici est la rédaction de la première mouture de la partie dite « synchronique » des articles intestin (nom et adj.) et intestinal du Trésor de la langue française.

2. Alexa Top 500 se trouve à http://www.alexa.com/site/ds/top_500. Wikipedia se trouve à l'adresse http://www.wikipedia.org/.

3. Voir les détails de l'étude sur le site de Nature à http://www.nature.com/nature/journal/v438/n7070/full/438900a.html. Les modalités de l'étude ont été très contestées ; voir, par exemple, le reportage qui en a été fait sur le site de la BBC à http://news.bbc.co.uk/2/hi/technology/4840340.stm.

4. Le Wiktionnaire est à l'adresse http://fr.wiktionary.org/wiki/Wiktionnaire:Page_d%27accueil.

5. Le site web du Oxford English Dictionary est à http://www.oed.com/.

6. Citizendium se trouve à http://en.citizendium.org/wiki/Main_Page.