diff --git a/Tutoriel-geoparsing.ipynb b/Tutoriel-geoparsing.ipynb index 40c50b3a51487f289f75a236d571f859e4217f2e..92b568c9b1ca7475f2950c8c5e7213900384cd48 100644 --- a/Tutoriel-geoparsing.ipynb +++ b/Tutoriel-geoparsing.ipynb @@ -38,10 +38,7 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "## 2. Configurer l'environnement\n", - "\n", - "* Si vous avez déjà configuré votre environnement, soit avec conda, soit avec pip (voir le fichier [README.md](https://gitlab.liris.cnrs.fr/lmoncla/tutoriel-anf-tdm-2022-python-geoparsing/-/blob/main/README.md)), vous pouvez ignorer la section suivante et passer directement à la 2.2.\n", - "* Si vous exécutez ce notebook depuis Google Colab / Binder, vous devez exécuter la cellule suivante :" + "## 2. Configurer l'environnement\n" ] }, { @@ -53,6 +50,14 @@ "path = ''" ] }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "* Si vous avez déjà configuré votre environnement, soit avec conda, soit avec pip (voir le fichier [README.md](https://gitlab.liris.cnrs.fr/lmoncla/tutoriel-anf-tdm-2022-python-geoparsing/-/blob/main/README.md)), vous pouvez ignorer la section suivante et passer directement à la 2.2.\n", + "* Si vous exécutez ce notebook depuis Google Colab / Binder, vous devez exécuter les cellules suivantes :" + ] + }, { "cell_type": "markdown", "metadata": {}, @@ -1055,7 +1060,7 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "## 6. Geoparsing / Geocoding\n", + "## 5. Geoparsing / Geocoding\n", "\n", "En complément de la tâche de reconnaissance des entités nommées la librairie `Perdido` propose également celle de résolution des toponymes, on parle alors de *Geoparsing*. Cette tâche consiste a associer à un nom de lieu des coordonnées géographiques non ambigus. De manière classique elle s'appuie sur le repérage des entités spatiales identifées lors de la reconnaissance des entités nommées et fait appel à des ressources externes de type *gazetier* (ou dictionnaires topographique) pour localiser les lieux." ] @@ -1064,7 +1069,7 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "### 6.1 Perdido Geoparser" + "### 5.1 Perdido Geoparser" ] }, { @@ -1114,7 +1119,7 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "### 6.2 Perdido Geocoder\n", + "### 5.2 Perdido Geocoder\n", "\n", "En complément du `Geoparser` qui prend en paramètre un texte et qui fait la reconnaissance d'entités nommées en amont de l'étape de geocoding, `Perdido` propose également une fonction de geocoding disctincte prenant en paramètre directement un nom de lieu (ou une liste de noms de lieux)." ] @@ -1136,10 +1141,10 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "### 6.2 Résolution de toponymes / désambiguïsation\n", + "### 5.3 Résolution de toponymes / désambiguïsation\n", "\n", "\n", - "#### 6.2.1 Exemple : Arques\n", + "#### 5.3.1 Exemple : Arques\n", "\n", "* Cherchons à localiser la ville `Arques`\n" ] @@ -1263,7 +1268,7 @@ "metadata": {}, "source": [ "\n", - "### 6.3 Le cas des descriptions de randonnées\n", + "### 5.4 Le cas des descriptions de randonnées\n", "\n", "Prenons maintenant l'exemple du geoparsing de descriptions de randonnées. Certaines solutions de désambiguisation ont pu être développées et intégrées au sein de la librairie `Perdido` (d'autres sont en cours d'intégration). Les solutions décrites dans la suite de cette partie ont été développées dans le cadre des projets [Perdido](http://erig.univ-pau.fr/PERDIDO/) (2012-2015) et [ANR CHOUCAS](http://choucas.ign.fr) (2017-2022). \n", "\n", @@ -1412,7 +1417,7 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "#### 6.3.1 Ajout d'un filtre \"code pays\"\n" + "#### 5.4.1 Ajout d'un filtre \"code pays\"\n" ] }, { @@ -1435,7 +1440,7 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "#### 6.3.2 Ajout d'un filtre \"bounding box\"" + "#### 5.4.2 Ajout d'un filtre \"bounding box\"" ] }, { @@ -1461,7 +1466,7 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "#### 6.3.3 Clustering par densité spatiale" + "#### 5.4.3 Clustering par densité spatiale" ] }, {