From ed4e3950d115e89ce94e04d0c26f8b4390dc40aa Mon Sep 17 00:00:00 2001 From: Ludovic Moncla <moncla.ludovic@gmail.com> Date: Tue, 13 Sep 2022 09:48:34 +0200 Subject: [PATCH] Update Tutoriel-geoparsing.ipynb --- Tutoriel-geoparsing.ipynb | 17 ++++++++++++++--- 1 file changed, 14 insertions(+), 3 deletions(-) diff --git a/Tutoriel-geoparsing.ipynb b/Tutoriel-geoparsing.ipynb index 17f869e..de096a2 100644 --- a/Tutoriel-geoparsing.ipynb +++ b/Tutoriel-geoparsing.ipynb @@ -157,7 +157,9 @@ "\n", "Perdido embarque 2 jeux de données : \n", " 1. articles encyclopédiques (volume 7 de l'Encyclopédie de Diderot et d'Alembert (1751-1772)), fournit par l'[ARTFL](https://encyclopedie.uchicago.edu) dans le cadre du projet [GEODE](https://geode-project.github.io) ;\n", - " 2. descriptions de randonnées (chaque description est associée à sa trace GPS. Elles proviennent du site [www.visorando.fr](https://www.visorando.com) et ont été collectées dans le cadre du projet [ANR CHOUCAS](http://choucas.ign.fr)." + " 2. descriptions de randonnées (chaque description est associée à sa trace GPS. Elles proviennent du site [www.visorando.fr](https://www.visorando.com) et ont été collectées dans le cadre du projet [ANR CHOUCAS](http://choucas.ign.fr).\n", + "\n", + " Dans un premier temps nous allons nous intéresser au jeu de données des articles encyclopédiques. Ce jeu de données est présent dans la librairie dans 2 versions, une version brute (articles fournis par l'ARTFL) au format dataframe et une version déjà annotée par Perdido (format PerdidoCollection). Nous allons charger la version brute et voir comment manipuler un dataframe." ] }, { @@ -165,7 +167,9 @@ "execution_count": null, "metadata": {}, "outputs": [], - "source": [] + "source": [ + "dataset_artfl = load_edda_artfl()" + ] }, { "cell_type": "code", @@ -173,7 +177,7 @@ "metadata": {}, "outputs": [], "source": [ - "d = load_choucas_perdido()\n", + "dataset_choucas = = load_choucas_perdido()\n", "df = d['data'].to_dataframe()\n", "df.head()" ] @@ -214,6 +218,13 @@ "### 5.1 Stanza NER" ] }, + { + "cell_type": "code", + "execution_count": null, + "metadata": {}, + "outputs": [], + "source": [] + }, { "cell_type": "markdown", "metadata": {}, -- GitLab