Edition Numérique Collaborative
et CRitique de l'
Encyclopédie
Retour en haut
Le projet ENCCRE / Présentation générale / La structure de données de l'édition ENCCRE

La structure de données de l'édition :
principes et enjeux

Les données de notre édition sont de deux types. D'un côté, les données textuelles ou encyclopédiques (ce qui recouvre aussi bien le texte publié dans les volumes de « discours », les planches que leurs explications) correspondent à la version collationnée et spécifiée, conformément à l'original, du contenu de l'Encyclopédie. De l'autre, les données critiques sont partiellement ou totalement le fruit d'un apport extérieur (celui de l'éditeur, sous forme de notes, de commentaires ou de notices), et supposent donc un certain degré d'interprétation. À quels critères de spécification ces données répondent-elles cependant, et quels types de liens ou de connexions entretiennent-elles les unes avec les autres ? Ces questions relèvent d'une étape cruciale de notre démarche éditoriale, celle de la structuration des données.

Les données encyclopédiques

Commençons par les données liées au contenu de l'édition originale de l'Encyclopédie. L'établissement du texte (entendu au sens large, ce qui inclut donc les planches) implique la définition des modalités d'une transposition minimisant la déperdition d'information entre son support matériel d'origine et le support numérique. Il repose également sur l'élaboration d'une procédure d'encodage approprié qui rende compte de son caractère polysémiotique intrinsèque : un texte n'est pas un simple ensemble de données, mais un assemblage de données structurées qui font système entre elles. Il s'agit donc d'abord de se demander quels éléments de l'Encyclopédie doivent être décrits, de quelle façon, et comment ils sont reliés entre eux.

Cette première étape d'identification des données encyclopédiques nécessite de définir deux types de structure. La première, dont nous ne donnerons pas le détail, décrit l'organisation matérielle générale de l'Encyclopédie en termes d'édition, d'exemplaire, de volumes et de pages : elle correspond à ce que nous pourrions appeler la structure macroscopique des données encyclopédiques. La seconde s'attache, quant à elle, à la spécification du contenu à l'échelle locale, c'est-à-dire à l'échelle d'un article, d'une planche ou de son explication. Voyons plus précisément en quoi elle consiste en prenant l'exemple de l'article PORISTIQUE (Enc., XIII, p. 126a) :

PORISTIQUE, adj. (Mathém.) quelques auteurs appellent méthode poristique la maniere de déterminer par quels moyens, & de combien de différentes façons un problème peut être résolu. Voyez Problème, Déterminé, Equation, Racine, Solution. Chambers. (O).

On peut repérer un certain nombre d'objets particuliers dans cet article :

Le texte de l'article peut ainsi être linéairement décrit grâce à un certain nombre de données (les mots) et de métadonnées (les mots possédant un statut particulier).

Le principe consiste ensuite à regrouper formellement ces dernières au sein d'un ensemble de catégories encyclopédiques considérées comme des métadonnées possédant le même statut, ou pouvant plus généralement être rattachées à un seul et même type d'élément descriptif du contenu d'un article dans l'édition originale de l'Encyclopédie. L'article PORISTIQUE sera dès lors finement décrit par l'instance d'une catégorie de type « adresse », d'une catégorie « indication grammaticale », « désignant », « ensemble de renvois », « mention » et « signature », ainsi que d'une dernière catégorie correspondant au « texte par défaut » (c'est-à-dire à l'ensemble des mots de l'article sans spécification particulière).

Bien entendu, ces différentes catégories sont liées entre elles par un certain nombre de connexions qu'il convient pareillement de décrire avec la plus grande précision. Les catégories « indication grammaticale », « désignant », « ensemble de renvois », « mention », « signature » et « texte par défaut » entretiendront par exemple un lien d'appartenance à la catégorie « adresse » dans la mesure où les instances de ces différentes catégories décrivent le contenu du texte appartenant à une adresse particulière. De la même façon, l'instance de la catégorie « ensemble de renvois » dans l'article PORISTIQUE, parce qu'elle contient elle-même cinq renvois à cinq articles distincts, doit à son tour être décrite grâce à cinq instances d'une autre catégorie encyclopédique : la catégorie « renvoi ». Chacune de ces cinq instances possède un premier lien d'appartenance à l'« ensemble de renvois » (lui-même lié à la catégorie « adresse »), ainsi qu'un second type de connexion extérieure à l'article : celle permettant de le lier avec l'« adresse » ou l'« entrée » de l'Encyclopédie à laquelle il nous invite à nous reporter – lorsque ce lien, bien sûr, peut être établi avec certitude ; dans le cas contraire, l'articulation avec des données critiques s'avérera nécessaire. L'instance « Problème » de la catégorie « renvoi » dans l'article PORISTIQUE sera donc ici liée à l'entrée « PROBLEME » de l'ouvrage (c'est-à-dire à l'instance « PROBLEME » de la catégorie « entrée » correspondante).

La description de la structure des données des articles de l'Encyclopédie conduit ainsi à l'établissement d'une liste de catégories encyclopédiques propres à l'ouvrage ainsi que de la liste des liens qu'elles entretiennent entre elles. La finesse de cette description relève d'un choix éditorial de notre part, effectué en toute connaissance de l'ouvrage, et en toute cohérence avec les objectifs de la politique précédemment exposée : le critère de fidélité à l'original, ou les fonctionnalités de lecture, de navigation et de recherche qui seront proposées sur l'interface de l'édition en ligne, en sont totalement tributaires.

Articulation entre données encyclopédiques
et données critiques

Cette première structure de données, exclusivement encyclopédiques, doit à présent être d'articulée avec le versant critique de notre édition, c'est-à-dire avec les différentes catégories de données critiques prévues à cet effet.

Cette seconde étape, étroitement dépendante de toutes les études entreprises sur l'Encyclopédie, paraît d'autant plus indispensable que la seule structure de données encyclopédiques ne suffit pas à pallier toutes les difficultés éditoriales soulevées par l'ouvrage. Nous avons déjà mentionné le cas problématique des renvois vers des adresses (ou entrées) incertaines ou inexistantes dans l'ouvrage, impliquant un éventuel enrichissement critique du mécanisme de navigation de l'édition, de même que la difficile question des auteurs d'articles. Concentrons-nous, à titre d'exemple, sur ce deuxième problème.

L'ouvrage, comme on sait, contient une myriade d'articles signés par deux collaborateurs ou plus. Tel est le cas de l'article Jet d'eau, au sein duquel deux signatures différentes apparaissent : la première « (K) » au terme du premier paragraphe, la seconde « (O) » à la fin du texte.

Jet d'eau (Hydraulique.) est une lance ou lame d'eau qui s'éleve en l'air par un seul ajutage qui en détermine la grosseur. Les jets croisés en forme de berceaux, sont appellés jets dardans, & les droits perpendiculaires. Il y a encore des gerbes, des bouillons. Consultez ces articles à leur lettre. (K)

Mariotte démontre qu'un jet d'eau ne peut jamais monter aussi haut qu'est l'eau dans son réservoir. En effet, l'eau qui sort d'un ajutage devroit monter naturellement à la hauteur de son réservoir, si la résistance de l'air & les frottemens des tuyaux ne l'en empêchoient. Voyez l'article Fluide. Mais cette résistance & ces frottemens font que l'eau perd nécessairement une partie de son mouvement, & par conséquent ne remonte pas aussi haut. Ce même auteur a aussi fait voir que lorsqu'un grand jet se distribue en un grand nombre d'autres plus petits, le quarré du diametre du principal ajutage doit être proportionnel à la somme de toutes les dépenses de ses branches ; & que si le réservoir a cinquante-deux piés de haut, & l'ajutage six lignes de diametre, celui du conduit doit être de trois pouces. Les différentes regles pour les jets d'eau se trouvent renfermées dans un ouvrage exprès de M. Mariotte, imprimé dans le recueil de ses œuvres. Chambers. (O)

L'une des premières et des plus légitimes questions que se pose un lecteur moderne est celle de l'auteur, et pour peu qu'il sache que l'Encyclopédie est le fruit du travail de nombreux collaborateurs, la seconde est : par quel moyen les reconnaître ? Si, d'après la structure de données encyclopédiques précédemment établie, les deux signatures (K) et (O) de l'article auront préalablement été identifiées comme telles, comment savoir cependant que le (K) désigne d'Argenville et le (O) D'Alembert ? La réponse se trouve, par bribes, dans les textes d'escorte de l'Encyclopédie, à des endroits souvent connus des seuls spécialistes (certaines correspondances entre signatures et auteurs sont faites à la fin de l'Avertissement du tome I, d'autres dans le tome III, etc.). La question suivante du lecteur consisterait probablement alors à se demander de quelles parties de l'article d'Argenville et D'Alembert sont respectivement les auteurs, ceci menant tout naturellement à une autre exigence : celle consistant à pouvoir rechercher un terme (ou une expression) parmi l'ensemble des contributions que les résultats des études sur l'Encyclopédie auront permis d'attribuer à un collaborateur particulier dans l'ouvrage. Se posent donc ainsi la question de l'attribution de tel ou tel passage, de tel ou tel article, à tel ou tel collaborateur, ainsi que celle de la justification raisonnée de cette attribution.

La solution que notre édition sera capable d'apporter à l'ensemble de ces problématiques éditoriales s'appuie sur plusieurs idées-clés (Illustration 1). Il s'agit d'abord de pouvoir lier la signature que le lecteur, novice ou averti, voit dans le texte (le (K) de d'Argenville par exemple) à deux autres types d'informations de nature critique : le collaborateur (la signature est celle de d'Argenville) et le passage de l'article correspondant (ceci est un paragraphe de l'article attribué à d'Argenville). Il s'agit aussi de faire en sorte que cette liaison entre les trois éléments puisse elle-même faire l'objet des justifications nécessaires par l'éditeur travaillant sur l'article.

On voit ainsi se dégager un processus de structuration entre, d'un côté, une catégorie encyclopédique (la signature présente dans le texte) et, de l'autre, deux catégories critiques (le collaborateur correspondant à la signature et l'extrait du texte de l'article à laquelle cette signature correspond). Des liens sont en outre établis pour rendre compte de l'attribution du passage à son auteur, liens qui doivent pouvoir être annotés, par exemple en renvoyant à la partie de l'Avertissement qui explique que telle signature désigne tel collaborateur, ou en fournissant une notice bibliographique sur ce dernier, un lien permettant d'accéder à ou rechercher dans l'ensemble de ses contributions dans l'Encyclopédie, etc.

Une telle structure, simple dans son principe, permet non seulement d'affiner les futures capacités d'interrogation du moteur de recherche, de prévoir une séparation claire dans l'édition entre ce qui appartient au contenu de l'ouvrage et ce qui relève d'un enrichissement critique de ce contenu (la matérialité de l'original est donc respectée), mais aussi de traiter tout aussi efficacement les autres cas particuliers (nous le savons grâce aux nombreuses études disponibles) susceptibles de se présenter dans l'ouvrage.

L'adresse ALLÉES DE JARDIN (Enc., I, p. 278a-279b) présente par exemple une première partie terminée par la signature (K), suivie d'une seconde partie commençant par *, et donc attribuable à Diderot . Dans un récent article de la revue [consulter], Fabrice Ferlin a cependant démontré qu'une remarque explicite de D'Alembert dans ses Opuscules mathématiques (tome I, 1761) permet sans aucun doute de lui attribuer cette deuxième partie de l'article. Pour traiter un tel cas, et informer le lecteur de ce nouvel apport de la recherche, il suffira de reprendre la structure de données précédente en y apportant les modifications instantielles nécessaires (Illustration 2) : la signature « * » sera certes toujours liée au passage collaborateur correspondant, ainsi qu'à un collaborateur particulier, mais l'instance de cette dernière catégorie (« collaborateur ») correspondra dans ce cas au nom de D'Alembert. Une note sur ce lien, conditionnant en quelque sorte son existence, devra en outre contenir les informations justifiant la correction de cette attribution (ce qui inclut par exemple les références précises à l'article de F. Ferlin, ainsi qu'un lien direct vers sa version en ligne).

De façon similaire, la structure de données s'applique aussi facilement à la multitude des articles non signés dans l'Encyclopédie : plus besoin de catégorie « signature » dans ce cas (l'article n'en possédant pas dans l'édition originale), un simple lien annoté (justifiant l'attribution de l'article ou du passage) entre les instances des catégories « passage collaborateur » et « collaborateur » suffira à rendre compte, d'un point de vue éditorial, du processus. Les autres cas de figure s'y adaptent tout aussi aisément, depuis l'erreur typographique, jusqu'à l'absence ou l'erreur d'attribution. Partant de là, de nouvelles possibilités d'interrogation du corpus apparaissent : par exemple, effectuer une collecte ou une recherche dans tous les passages liés à une étoile, ou, plus finement encore, dans tous les passages attribués à Diderot, parce qu'un chercheur dont les travaux font autorité les lui a attribués, ou encore parce qu'une signature * les précède.

Publications sur le projet :

A. Guilbaud, I. Passeron, O. Ferret, V. Barrellon, « Éditer l'Encyclopédie au 21e siècle : un projet d'édition numérique, critique et collaborative », Dix-Huitième Siècle, 46 (2014), « Bilan et perspectives de la recherche dix-huitiémiste », p. 153-166.

A. Guilbaud, I. Passeron, M. Leca-Tsiomis, O. Ferret, V. Barrellon, Y. Sumi et al., « "Entrer dans la forteresse" : pour une édition numérique collaborative et critique de l'Encyclopédie (projet ENCCRE) », Recherches sur Diderot et l'Encyclopédie, 48 (2013), p. 225-261.

ENCCRE | Intranet
© 2014 | Crédits