Accès direct au contenu

Accessibilité | Plan du site

Maison des Sciences de l'Homme
Ange-Guépin


Accueil > Manifestations scientifiques > Séminaires et conférences

Journée TEI : "de l'image au texte"

13 février 2018
9h30
Bibliothèque universitaire Le Mans Université

Ouvert à tous sur inscription : amelie.renard@univ-nantes.fr

Journée de formation

 
Description

Lorsque l'on parle de "numérisation" en lettres, langues et sciences humaines, la numérisation à proprement parler, c'est-à-dire la transformation en scan de documents-sources nativement analogues, n'est que la première étape d'un processus qu'il faut comprendre moins comme un simple changement de média que comme un enchaînement de méthodes de traitements de l'information permettant in fine de présenter des sources documentaires dans un format numérique scientifique riche et enrichissable, structuré, annoté, analysable et durablement sollicitable pour des recherches diverses. Les directives de la Text Encoding Initiative, auxquelles la journée Dayclic de novembre 2017 ont donné une première introduction, permettent de réaliser une telle présentation, mais elles supposent de disposer déjà d'un texte au format numérique qu'elles permettent ensuite d'éditer et d'enrichir.

L'objectif de cette deuxième journée TEI est de présenter une série de méthodes permettant de partir de l'image d'une source textuelle (sa numérisation sous forme de scan, au format pdf) pour la transformer en un code-source annotable, éditable et utilisable à des fins de recherche. Les participants sont invités à apporter les documents sur lesquels ils travaillent dans le cadre de leur projet de recherche s'ils en ont à leur disposition (des documents de travail seront fournis à ceux qui n'en auraient pas).

La journée s'articulera en deux parties. La matinée sera consacrée à la structuration des métadonnées (header) d'un document TEI, qui est ce grâce à quoi un document TEI peut être repéré par les moteurs de recherche et mis en relation avec d'autres ressources numériques, donc ce qui rend une source visible au sens numérique. Ce travail, qui sera effectué à titre d'exemple à partir de documents historiques, permettra aux participants d'apprendre à structurer l'ossature d'un document TEI.

L'après-midi sera consacrée à un atelier de transformation de sources numériques visuelles en sources numériques textuelles. Avec l'aide de l'outil en ligne Transkribus, les participants seront familiarisés avec la reconnaissance automatique de caractères de sources manuscrits et imprimées. Les participants sont invités à créer un compte sur l'interface du projet en amont de la journée. Pour ceux qui souhaitent travailler sur les sources de leurs projets de recherche, il est possible également de télécharger ses scans dans l'interface de Transkribus en préparation de la journée.
La journée aura lieu en salle de formation de la Bibliothèque Universitaire du Mans. Un certain nombre de postes de travail sur lesquels les logiciels nécessaires sont accessibles seront disponibles, mais il est possible de venir avec son propre ordinateur portable et d'installer sur place les logiciels concernés.

La matinée sera animée par Charles Riondet, historien et ingénieur de recherche à Inria Paris. L'après-midi sera animée par Tobias Hodel, historien, collaborateur scientifique aux Archives Cantonales de Zurich et à l'Université de Zurich et membre de l'équipe de recherche développant l'interface Transkribus. Tous deux sont spécialistes de méthodes numériques appliquées à l'Histoire.
Une troisième journée sera consacrée aux questions de standardisation, d'interopérabilité et de réutilisation des sources numériques (prévue pour avril 2018).


Programme :

  •  9:30 - Présentation : Structurer un document TEI
  • 10:15 - Pause
  • 10:45 - Travail pratique sur des documents TEI
  • 12:00 - Question-réponse autour du travail pratique

12:30 - Pause déjeuner

  • 13:30 - Atelier Transkribus
Introduction
  • 14:15 - Démonstration
  • 14:45 - Pause café
  • 15:00 - Travail pratique individuel ou en groupe
  • 15:45 - Compléments techniques (Keyword Spotting, Document Understanding)
  • 16:00 - Feedback


Comité d'organisation :
Anne Baillot (3LAM), François Vignale (3LAM), Amélie Renard (MSH Ange-Guépin)


Type :
Atelier numérique
Contact :
Amélie Renard
Lieu(x) :
Bibliothèque universitaire Le Mans Université
Avenue Olivier Messiaen
72085 - LE MANS cedex 9

mis à jour le : 25/01/2018


Document à télécharger

 

haut de la page imprimer

Fil RSS des 10 dernières actualités | Contact