diff --git a/Tutoriel-geoparsing.ipynb b/Tutoriel-geoparsing.ipynb index c99c8c3e73b57a96abe0dfc09d7a3f746dcaecae..fec22156a7f761e5d74590075e0e80e480496db6 100644 --- a/Tutoriel-geoparsing.ipynb +++ b/Tutoriel-geoparsing.ipynb @@ -3403,7 +3403,17 @@ "\n", "> Ludovic Moncla, Walter Renteria-Agualimpia, Javier Nogueras-Iso and Mauro Gaio (2014). \"Geocoding for texts with fine-grain toponyms: an experiment on a geoparsed hiking descriptions corpus\". In Proceedings of the 22nd ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems, pp 183-192.\n", "\n", - "> Mauro Gaio and Ludovic Moncla (2019). “Geoparsing and geocoding places in a dynamic space context.“ In The Semantics of Dynamic Space in French: Descriptive, experimental and formal studies on motion expression, 66, 353.\n" + "> Mauro Gaio and Ludovic Moncla (2019). “Geoparsing and geocoding places in a dynamic space context.“ In The Semantics of Dynamic Space in French: Descriptive, experimental and formal studies on motion expression, 66, 353.\n", + "\n", + "\n", + "Nous avons choisi un exemple pour illustrer les différentes phases du processus que nous avons mis en place dans le cadre du geoparsing de descriptions de randonnées :\n", + "1. filtrer les résultats en fonction du pays \n", + "2. filtrer les résultats en fonction d'une zone géographique définie \n", + "3. regrouper les résultats en utilisant un algorithme de clustering spatial (DBSCAN, *density-based spatial clustering of applications with noise*)\n", + "4. selectionner le cluster qui contient le plus d'entités distinctes\n", + "\n", + "La librairie Perdido utilise la méthode DBSCAN implémentée dans la librairie [Scikit-Learn](https://scikit-learn.org/stable/modules/generated/sklearn.cluster.DBSCAN.html). \n", + "Cette stratégie est adaptée pour une description d'itinéraire où les différents lieux cités sont supposés être localisés à proximité les uns des autres." ] }, { @@ -4686,15 +4696,6 @@ "doc_geocoded.get_folium_map()" ] }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Désambiguisation basé sur la proximité géographique\n", - "\n", - "Clustering avec la méthode DBSCAN implémenté dans la librairie [Scikit-Learn](https://scikit-learn.org/stable/modules/generated/sklearn.cluster.DBSCAN.html). Cette stratégie est adaptée pour une description d'itinéraire où les différents lieux cités doivent être localisés à proximité les uns des autres." - ] - }, { "cell_type": "markdown", "metadata": {},