L’expression d’humanités digitales a été précédée par une autre, les humanities computing, qui mettait en avant l’utilisation d’outils informatiques pour améliorer le traitement des données, depuis la mécanographie à des dispositifs d’encodage des corpus comme la TEI, Text encoding initiative qui définit une série de métadonnées pour normaliser leur production sur les corpus de textes et de manuscrits. La TEI émerge dans les années 80 et reste aujourd’hui un système encore utilisé, qui s’étend à d’autres types de documents, notamment musicaux.
Le passage à l’utilisation de l’expression humanités digitales s’effectue dans les années 2000 : des ouvrages paraissent où cette nouvelle expression marque le fait que les pratiques et usages des chercheurs sont également liés au web. Le web devient ainsi également un lieu d’étude, et pas seulement un moyen de communiquer et d’échanger de l’information et des données.
Paul Otlet comme point commun
Pour revenir sur la liaison qui existe entre les humanités digitales et la culture de l’information, une mise au point historique s’impose. En effet, si on considère les humanités digitales comme un mouvement qui a débuté avec les premières techniques de traitement de l’information, il est alors possible de considérer que les humanités digitales et la culture de l’information partagent la même volonté d’accessibilité à la connaissance. Parmi les éléments communs entre les deux, un nom apparaît ici essentiel : Paul Otlet, considéré à la fois comme le père de la documentation et comme un des visionnaires les plus importants en ce qui concerne les systèmes d’information actuels. Il y a quelques mois, Martin Grandjean, historien, spécialiste des réseaux et notamment des réseaux pacifistes et représentant de l’association francophone des humanités numériques : Humanistica, a même consacré Paul Otlet comme figure tutélaire des humanités digitales.
On peut en effet le considérer comme un préfigurateur des humanités digitales, en quelque sorte des « humanités proto-digitales », en ce qu’il va n’avoir de cesse d’améliorer l’accessibilité à l’information et aux documents. C’est aussi quelqu’un qui va envisager, notamment dans son Traité de documentation (1934), plusieurs pistes concernant l’accessibilité aux documents ainsi que les possibilités d’analyse de données. Paul Otlet marque une rupture historique dans son passage à une documentation différente de la vieille bibliothéconomie. L’enjeu est de pouvoir accéder à l’information et à son traitement, et pas seulement de pouvoir accéder au document tel que peut l’être le livre, ce qui signifie une prise en compte étroite entre le fond et la forme. Il promeut une analyse statistique documentaire et une approche par un traitement mathématique de la connaissance. Une vision et une logique qui se rapprochent sensiblement des actuelles humanités digitales.
On pourrait citer plusieurs passages emblématiques du Traité de documentation. Retenons celui-ci :
« L’idéal serait d’avoir tout document à portée de la main. De là des tables de travail avec tiroirs divers, des dispositifs de tables circulaires avec siège rotatif au centre, des meubles classeurs à la portée de la main et des yeux et installés sur roues. Un principe nouveau vient d’être réalisé : le classeur sur rail à moteur électrique. On le place sur le sol perpendiculaire à la table de travail. Il avance ou recule sous l’action des doigts opérés sur une simple roulette. Sans déplacement de la personne, le document désiré vient s’offrir à la main et à l’œil. »
On est bien dans une approche technique de l’accès à l’information, certes mécanique à l’époque, et évidemment pas encore numérique ou digitale.
Considérer Paul Otlet comme un héritage commun à la culture de l’information et aux humanités digitales établit déjà un premier pas décisif entre les deux concepts.
Une longue histoire des humanités digitales
Le fait de parler d’humanités digitales plutôt que d’humanités numériques permet de se resituer dans une histoire plus longue qui débute avec la création des premiers index, moyens d’accéder à l’information sans être contraint à une lecture exhaustive. L’indexation demeure essentielle dans nos outils de traitement de l’information, si ce n’est qu’elle s’effectue de plus en plus de façon automatisée. C’est aussi considérer l’ensemble des techniques pour traiter et accéder à l’information et ne pas les réduire à la seule informatique. Le mot numérique tendant de plus en plus à proposer une acception réduite comme corollaire de l’informatique, le mot digital permet de mieux prendre en compte l’ensemble des techniques mobilisées, et de rappeler l’importance des médiations humaines et du caractère double des outils de traitement de l’information et notamment de l’indexation. On a donc un point de convergence sur la question de l’indexation et des métadonnées.
Les humanités digitales ont partie liée avec la culture de l’information tant il s’agit de se préoccuper des méthodes de traitement de l’information et des données, des façons de les présenter et des médiations existantes. C’est un rappel que la culture de l’information est aussi une culture technique.
Des cultures de l’information
On peut distinguer, au sein des humanités digitales, quatre cultures de l’information différentes : une culture de l’accès à l’information ; une culture de l’analyse des contenus ; une culture du traitement de l’information ; une culture des réseaux.
Une culture de l’accès à l’information
La première culture de l’information présente dans les humanités digitales remonte aux travaux d’indexation durant le Moyen Âge, avec notamment les travaux de Jean Hautfuney qui effectue l’indexation d’un ouvrage de nature encyclopédique, le speculum historiale de Vincent de Beauvais. L’objectif est alors de pouvoir améliorer les possibilités de retrouver rapidement l’information (statim invenire) et de donner un nouvel outil au lecteur pressé et intelligens (diligens et intelligens lector).
Cette culture repose sur les premières avancées en ce qui concerne la gestion des manuscrits avec notamment les travaux d’Hugues de Saint-Victor et son art de lire, qui est aussi une méthode d’écriture. Ce sont finalement en quelque sorte les premiers travaux en matière de design de l’information, et c’est ainsi à cette longue lignée qu’appartiennent les humanités digitales. Pour tracer à gros traits ces diverses avancées, il faut songer également ici aux différentes méthodes d’organisation des connaissances qui ont été élaborées durant les siècles précédents avec notamment les différentes méthodes de classifications des connaissances que nous connaissons jusqu’à celle de Dewey, ou bien encore la CDU d’Otlet et de La Fontaine.
Il convient de rappeler le travail essentiel en matière de normalisation de ces dernières en ce qui concerne le répertoire bibliographique universel (RBU) qui participe au projet du Mundaneum. À ce titre, l’œuvre d’Otlet n’est pas tant de vouloir réaliser une bibliothèque qui contiendrait tous les savoirs du monde, que de produire une sorte d’index de toutes les connaissances notamment imprimées. Voilà pourquoi il est parfois dit que Paul Otlet a inventé le Google de papier ! La logique d’indexation de l’existant va peu à peu se coupler avec une réduction des temps d’accès au document pour aller vers des logiques d’immédiateté telles celles que l’on peut espérer avec la dynamique de l’open access et des archives ouvertes.
Désormais, les enjeux sont aussi de pouvoir accéder non pas à quelques documents, mais à de grands ensembles que l’on peut analyser de façon massive grâce à des traitements automatisés. La consultation de l’information évolue donc et le lecteur n’est plus tout à fait le même tant il s’agit d’effectuer des lectures dites à distance avec des outils qui permettent l’extraction de concepts ou d’occurrences. Les masses documentaires et informationnelles parfois nommées Big Data nécessitent de nouveaux traitements qui cherchent à relier et effectuer des comparaisons entre les documents au sein de corpus.
Une culture de l’analyse des contenus
Par conséquent, la culture de l’accès à l’information s’associe à la nécessité de produire une analyse des contenus de plus en plus poussée. Cela implique une logique différente qui consiste à désacraliser l’objet livre pour procéder à une délivrance des contenus, permise notamment par les outils numériques et le web :
« Le recours à l’expression “dé-livraison” ne présuppose ici aucun jugement de valeur quant au sens des évolutions en cours, mais l’observation d’une déconstruction-reconstruction d’une culture héritée et façonnée par le livre en tant qu’objet technique, en termes de prise en compte d’autres formes culturelles et en termes d’invention de nouvelles formes plus ou moins liées à de nouveaux supports, dits numériques ou digitaux, qu’il reste à qualifier précisément.2 »
Cette culture de l’analyse du contenu et de l’accès à une information contenue est celle du cheminement de l’ancienne bibliothéconomie à la documentation qui va privilégier des méthodes de traitement des données plus complexes :
« L’Humanité est à un tournant de son Histoire. La masse des données acquises est formidable. Il faut de nouveaux instruments pour les simplifier, les condenser ou jamais l’intelligence ne saura ni surmonter les difficultés qui l’accablent, ni réaliser les progrès qu’elle entrevoit et auxquels elle aspire » (Otlet, 1934).
C’est donc une évolution de la traditionnelle analyse documentaire avec ses formes professionnelles que sont l’indexation et la condensation dans des formes renouvelées avec le web et les nouveaux outils d’analyse qui permettent d’extraire des concepts voire de produire des cartographies de lien.
Il demeure néanmoins un important travail d’analyse et d’interprétation qui s’inscrit dans la longue tradition de la philologie et les besoins actuels en évaluation de l’information face aux mécanismes de désinformation, de fabrique du faux, mais aussi face à la qualité parfois médiocre des métadonnées disponibles. On retrouve alors au sein des humanités digitales des opérations bien connues des professionnels de l’information.
Une culture du traitement de l’information
Parmi ces méthodes mobilisées par les humanités digitales, on pratique des opérations classiques de collecte d’informations et de données pour former des corpus qui pourront être ensuite analysés. Cette opération se diversifie en matière documentaire depuis des besoins de numérisation de corpus anciens jusqu’à l’extraction, par exemple, de tweets.
Après le travail de collecte, suit un travail de sélection pour délimiter méthodologiquement et thématiquement ce qui va mériter une analyse scientifique. Des travaux de découpage, de rassemblement, de tri vont alors être effectués, avant des opérations statistiques ou de métries.
Une culture des réseaux
Dernier élément de la culture de l’information présent dans les humanités digitales, la présence d’une culture des réseaux qui repose sur le réseau comme objet d’études, mais qui surtout renvoie à la constitution de réseaux de chercheurs au niveau international. En effet, les collèges invisibles décrits par Eugène Garfield renvoient à une pratique courante lors des différentes Républiques des lettres, comme notamment le réseau épistolaire de Marin Mersenne, ou bien encore la pratique des livres d’amis (liber amicorum) tel celui de Conrad Gesner qui faisait ainsi signer toutes les personnes de son réseau qu’il avait rencontrées. Cette logique de réseau de chercheurs va se développer fortement au xxe siècle notamment par l’échange de correspondances et d’articles, mais aussi par des événements dédiés. Ils vont être les moteurs de l’Arpanet/Internet tant il s’agit de pouvoir doter les chercheurs d’outils qui facilitent la communication et les échanges d’informations.
Une nouvelle fois, le rôle d’Otlet et de La Fontaine est important par leur influence sur la constitution d’associations internationales : les associations pacifistes, mais aussi les associations pour l’accès à la connaissance, comme la Fédération Internationale de Documentation qui n’existe plus, quelque peu suppléée désormais par la puissante IFLA.
Les réseaux sont donc des outils que les humanités digitales cherchent à analyser avec des outils dédiés depuis les réseaux de citation scientifique qui sont la base des logiques scientométriques jusqu’aux analyses plus actuelles des liens sur le web, ce qui permet d’établir des cartographies d’influence et de relation.
En tout cas, cette culture des réseaux marque aussi la nécessité d’une culture collaborative entre plusieurs acteurs, chercheurs et ingénieurs, bibliothécaires et autres membres du projet.
Pour l’instant, la démocratisation des humanités digitales n’a pas atteint le point d’imaginer des humanités digitales populaires, ou qui inclueraient tout au moins davantage les amateurs. Il s’agit désormais de poursuivre un mouvement similaire à celui qui va de l’IST (information scientifique et technique) au développement de la culture de l’information et des formations corrélées en intégrant les humanités digitales de façon plus précoce dans les cursus. La réflexion commence désormais à émerger au sein de l’éducation Nationale pour envisager une intégration et une formation des élèves de manière plus précoce (transcription de textes numérisés, utilisation d’outils de textmining, etc.). En comprenant les liens qui existent entre humanités digitales et culture de l’information, il y a un enjeu indéniable dont les professeurs-documentalistes devraient se saisir.