Création d'un corpus FAIR de théâtre en alsacien et normalisation de variétés non-contemporaines

Main Authors: Ruiz Fabo, Pablo, Bernhard, Delphine, Werner, Carole
Format: Proceeding Journal
Bahasa: fra
Terbitan: , 2020
Subjects:
TEI
Online Access: https://zenodo.org/record/4323302
Daftar Isi:
  • Nous présentons des travaux en cours vers la création d’un corpus diachronique de pièces de théâtre en alsacien pour la période 1870-1940, publiquement disponible, encodé selon les recommandations de la Text Encoding Initiative (TEI) et suivant les principes FAIR pour la création de données de la recherche. Le corpus sera utile aux recherches en sociolinguistique historique et analyse dramatique. Nous décrivons le travail effectué en vue des pratiques FAIR et introduisons des questions de recherche en modélisation TEI de variables pertinentes pour l’analyse linguistique et dramatique. De façon générale, la création du corpus est un exemple des difficultés du travail avec les langues peu dotées. Particulièrement, le corpus présente de l’alternance codique et d’énormes défis pour la normalisation orthographique automatique, sur lesquels nous aimerions échanger avec la communauté.