From 9af30928871711e94762ab9c8316d7d7806236d8 Mon Sep 17 00:00:00 2001 From: lmoncla <moncla.ludovic@gmail.com> Date: Thu, 3 Feb 2022 13:10:01 +0100 Subject: [PATCH] Update README.md --- session2_fev22/README.md | 4 ++-- 1 file changed, 2 insertions(+), 2 deletions(-) diff --git a/session2_fev22/README.md b/session2_fev22/README.md index c704e1e..73bddcf 100644 --- a/session2_fev22/README.md +++ b/session2_fev22/README.md @@ -9,11 +9,11 @@ Inscription (gratuite mais obligatoire) : [formulaire d'inscription](https://fra 1. Présentation de la thématique 2 : Linguistique des discours, traitement automatique des langues. 2. Communications présentées : -### Titre à venir ... +### Classification d’articles encyclopédiques et reconnaissance d’entités nommées : Application à l’Encyclopédie de Diderot et d’Alembert L. Moncla (INSA/LIRIS), D. Vigier (U. Lyon 2/ICAR), K. McDonough (A. Turing Institute), A. Brenon (INSA/LIRIS & ICAR) -Résumé... +Cette présentation s’intéressera à deux tâches en cours au sein du Projet GEODE et dont certains résultats préliminaires ont déjà été publiés. La première tâche concerne la problématique de classification automatique des articles encyclopédiques. Nous présenterons une étude comparative de différentes approches de classification supervisée (associées à différentes méthodes de vectorisation des textes) telles que des méthodes d’apprentissage classiques (*Logistic Regression*, *SGD*, *SVM*), des méthodes d’apprentissage profond (*CNN* et *LSTM*) et des architectures à base de *Transformers* et de modèles de langue pré-entrainés (BERT et CamemBERT). La deuxième tâche s’intéresse à la reconnaissance et à la classification des entités nommées. Nous présenterons une méthodologie de recherche d’indices linguistiques utilisant la plateforme TXM pour leur découverte et la plateforme PERDIDO pour leur implémentation. Enfin, nous présenterons les premières évaluations de notre approche. -- GitLab