Création d'un corpus FAIR de théâtre en alsacien et normalisation de variétés non-contemporaines
Main Authors: | Ruiz Fabo, Pablo, Bernhard, Delphine, Werner, Carole |
---|---|
Format: | Proceeding Journal |
Bahasa: | fra |
Terbitan: |
, 2020
|
Subjects: | |
Online Access: |
https://zenodo.org/record/4323302 |
Daftar Isi:
- Nous présentons des travaux en cours vers la création d’un corpus diachronique de pièces de théâtre en alsacien pour la période 1870-1940, publiquement disponible, encodé selon les recommandations de la Text Encoding Initiative (TEI) et suivant les principes FAIR pour la création de données de la recherche. Le corpus sera utile aux recherches en sociolinguistique historique et analyse dramatique. Nous décrivons le travail effectué en vue des pratiques FAIR et introduisons des questions de recherche en modélisation TEI de variables pertinentes pour l’analyse linguistique et dramatique. De façon générale, la création du corpus est un exemple des difficultés du travail avec les langues peu dotées. Particulièrement, le corpus présente de l’alternance codique et d’énormes défis pour la normalisation orthographique automatique, sur lesquels nous aimerions échanger avec la communauté.