@@ -13,7 +13,7 @@ Notre méthode prend comme entrée des romans (grands textes) au format TXT ains
Schéma du processus de classification automatique de phrases
Labellisation automatique d’un corpus :
**Labellisation automatique d’un corpus :**
Il s’agit de créer un jeu de données décomposé en deux parties : deux jeux de données, un pour l'entraînement et l’autre pour l’évaluation. Ce jeu de données contient deux colonnes : sentences, labels. Ces deux colonnes indiquent des phrases et des labels qui permettent de savoir si les phrases sont des indications géographiques ou non (label 0 : pas géographique, label 1 : géographique)