| 18 janvier 2024 | Linguistique des discours et TAL | [Programme et inscription](https://gitlab.liris.cnrs.fr/geode/seminaires-ixxi/-/tree/master/séminaires/session18_jan24) | [Nathalie Rousseau](https://lettres.sorbonne-universite.fr/personnes/nathalie-rousseau)(Sorbonne Université) et [Anaïs Chambat](https://achambat.github.io)(CY Cergy Paris Université) |
| mars 2024 | | Programme et inscription | |
| 18 janvier 2024 | Linguistique des discours et TAL | [Slides et vidéos](https://gitlab.liris.cnrs.fr/geode/seminaires-ixxi/-/tree/master/séminaires/session18_jan24) | [Nathalie Rousseau](https://lettres.sorbonne-universite.fr/personnes/nathalie-rousseau)(Sorbonne Université) et [Anaïs Chambat](https://achambat.github.io)(CY Cergy Paris Université) |
| 4 décembre 2023 | Histoire et épistémologie | [Slides et vidéos](https://gitlab.liris.cnrs.fr/geode/seminaires-ixxi/-/tree/master/séminaires/session17_dec23) | [Ioana Galleron](http://www.univ-paris3.fr/mme-galleron-ioana-468922.kjsp)(Sorbonne Nouvelle) |
| 28 septembre 2023 | TAL et SIG | [Slides et vidéos](https://gitlab.liris.cnrs.fr/geode/seminaires-ixxi/-/tree/master/séminaires/session16_sep23) | [Ian Gregory](https://www.lancaster.ac.uk/staff/gregoryi/)(Lancaster University) and members of the [Space Time Narratives project](https://spacetimenarratives.github.io) |
| ~~22 juin 2023~~ | ~~Histoire et épistémologie~~ | [Annulé](https://gitlab.liris.cnrs.fr/geode/seminaires-ixxi/-/tree/master/séminaires/session15_jui23) | ~~[Peter Logan](https://liberalarts.temple.edu/academics/faculty/logan-peter-m)(Temple University)~~ |
## Baliser des dictionnaires anciens en XML-TEI pour en extraire des données lexicales : l’expérience du projet CollEx-Persée de « Métadictionnaire médical multilingue de la bibliothèque numérique Medica »
Le « Métadictionnaire médical multilingue de la bibliothèque numérique Medica » permet d’enrichir les résultats de recherche au sein d’un corpus de 56 dictionnaires et encyclopédies des sciences médicales du XVIIe au XXe siècle (459 volumes, plus de 450 000 entrées sur plus de 330 000 pages) en donnant accès au savoir lexical et étymologique de sept dictionnaires représentatifs et de leurs lexiques et glossaires multilingues. Nous exposerons tout d’abord les principes et les méthodes de balisage XML-TEI qui ont été définis pour extraire des données lexicales de ces ouvrages, après océrisation, en fonction des objectifs du projet et des contraintes de temps et de moyens à disposition. Des exemples concrets permettront d’illustrer les défis auxquels fait face le travail encore en cours de vérification du texte et de la structuration des fichiers XML-TEI, qui résultent de la diversité et de la complexité des ouvrages traités, mais aussi de la richesse et de la singularité du vocabulaire médical multilingue qui y est relevé. Nous évoquerons également le travail nécessaire pour mettre à disposition en accès libre, comme le projet s’y était engagé, des données qui soient les plus interopérables et les plus réutilisables possibles.
**Anaïs Chambat**, doctorante contractuelle en sciences du langage depuis octobre 2022 (CY Cergy Paris Université, EA 7518 « Lexiques, Textes, Discours et Dictionnaires – Centre Jean Pruvost »), cheffe de projet au sein de l’équipe du Métadictionnaire de 2021 à 2022.