diff --git a/Classification/Application.md b/Classification/Application.md
index a4f502c63647415b895fee797239b81eb517b1e8..c14736b7aa2504ff38a9b6923db0fc76ac245248 100644
--- a/Classification/Application.md
+++ b/Classification/Application.md
@@ -1,9 +1,9 @@
-## Application au corpus d'Ã©tude {#sec:classification_application}
+## Annotation des articles {#sec:classification_application}
 
 ### Classification non supervisÃ©e
 
 En complÃ©ment des mÃ©thodes de classification supervisÃ©es, des tentatives ont Ã©tÃ©
-faites pour utiliser de l'apprentissage supervisÃ©, permettant d'Ã©tudier
+faites pour utiliser de l'apprentissage non supervisÃ©, permettant d'Ã©tudier
 autrement les relations entre les contenus des articles, les systÃ¨mes de
 classification et les prÃ©dictions gÃ©nÃ©rÃ©es automatiquement. Des techniques de
 *clustering* ont ainsi Ã©tÃ© employÃ©es pour grouper automatiquement les articles
@@ -383,9 +383,10 @@ raisons qui ont orientÃ© le choix du modÃ¨le mais les occurrences rÃ©pÃ©tÃ©es de
 Â«Com.Â» pouvant Ã©voquer un dÃ©signant mal filtrÃ© dans ces articles incorrectement
 classÃ©s en *Commerce* sont pour le moins troublantes. Il n'est pas facile non
 plus de tester cette hypothÃ¨se en contrÃ´lant la lemmatisation de cette
-abrÃ©viation puisque *BERT* attend en entrÃ©e le texte de l'article. L'opÃ©ration
-de lemmatisation, si elle a lieu, se produit au fil des couches de neurones
-artificiels.
+abrÃ©viation puisque *BERT* attend en entrÃ©e le texte de l'article. Il ne procÃ¨de
+pas Ã  un dÃ©coupage en mots en interne (il n'y a donc pas de lemmatisation) mais
+se contente de grouper des graphÃ¨mes qui apparaissent frÃ©quemment ensemble
+(algorithme WordPiece).
 
 De maniÃ¨re pragmatique, la solution la plus immÃ©diate pour corriger le problÃ¨me
 au vu de la rÃ©gularitÃ© de ces articles relativement brefs et possÃ©dant le motif
diff --git a/Classification/Models.md b/Classification/Models.md
index ec69916424b822a0bb99c3cf1cc7af7a6f3ac1eb..4fe5375e8e5a2ea7a1831ce67a71fef872b5c3bd 100644
--- a/Classification/Models.md
+++ b/Classification/Models.md
@@ -403,13 +403,10 @@ TF-IDF* (1), *BiLSTM + FastText* (2) et *BERT* Multilingue (3).
 
 Au-delÃ  de l'importance du nombre d'articles par classes, ces rÃ©sultats
 soulignent la difficultÃ© Ã  distinguer entre certaines classes pour des raisons
-lexicales ou sÃ©mantiques. Cela se voit clairement sur les figures
-\ref{fig:F1Scores_BERTvsCAMEMBERT} Ã  \ref{fig:res_per_class} pour la classe
-*Arts et mÃ©tiers*. Ce domaine est relativement maltraitÃ© par toutes les
-mÃ©thodes, par comparaison avec d'autres classes ayant un nombre comparable
-d'articles. Il est vraisemblable que ce domaine est souvent confondu avec la
-classe *MÃ©tiers* qui est parmi les domaines les mieux reprÃ©sentÃ©s. Cette
-hypothÃ¨se semble confirmÃ©e par la matrice de confusion de la figure
+lexicales ou sÃ©mantiques comme cela Ã©tait le cas pour *Arts et mÃ©tiers* avec
+*MÃ©tiers*. Ce domaine, parmi les mieux reprÃ©sentÃ©s, semble attirer Ã  lui des
+articles de nombreuses classes moins frÃ©quentes mais proches sÃ©mantiquement.
+Cette hypothÃ¨se semble confirmÃ©e par la matrice de confusion de la figure
 \ref{fig:confusion_matrix}.
 
 ![Matrice de confusion matrix pour la combinaison *SGD+TF-IDF* sur le jeu de test.](figure/classification/SGD+TF-IDF_domainGroup/confusionMatrix.png){#fig:confusion_matrix width=63%}
diff --git a/Classification/Relations.md b/Classification/Relations.md
index bfa21644c39beac0cdba7ebddfcc0c7ce5ff8b44..d120a56ed2059b4ea938eacc2ada969b3a1229f3 100644
--- a/Classification/Relations.md
+++ b/Classification/Relations.md
@@ -6,22 +6,18 @@ section s'intÃ©resse au contraire aux erreurs qui subsistent dans leurs
 prÃ©dictions. Faisant en effet l'hypothÃ¨se que les erreurs commises par le modÃ¨le
 reflÃ¨tent dans une certaine mesure les proximitÃ©s qui existent entre les
 domaines de connaissance elle se propose ainsi de comprendre les relations qui
-lient la *GÃ©ographie* et les autres domaines de connaissance.
-
-Comme pour la section prÃ©cÃ©dente, le jeu d'Ã©tiquettes utilisÃ© pour reprÃ©senter
-les domaines de connaissance dans cette section est celui des 38 *domaines
-regroupÃ©s* (voir la section \ref{sec:domains_build_classes}
-p.\pageref{sec:domain_groups}). En ce qui concerne le modÃ¨le dont les erreurs
-seront Ã©tudiÃ©es, deux tendances gouvernent le choix. Il faut qu'elles soient
-assez nombreuses pour fournir matiÃ¨re Ã  observation et donc ne pas prendre le
-meilleur, mais Ã  l'inverse il est vraisemblable que les prÃ©dictions d'un
-classifieur obtenant de trop mauvais rÃ©sultats recÃ¨lent davantage de bruit que
-de vÃ©ritÃ©s profondes sur les contenus des articles. Pour ces deux raisons, c'est
-le modÃ¨le *SGD+TF-IDF* entraÃ®nÃ© sur tous les articles disponibles (colonne nÂ°3
-du tableau \ref{tab:result_1} p.\pageref{tab:result_1}) qui a Ã©tÃ© retenu pour
-cette Ã©tude et sera utilisÃ© tout au long de cette section. Ce modÃ¨le parvient Ã 
-classer correctement 9â€¯630 des 11â€¯702 articles, soit 82%. Ce sont les 2â€¯072
-autres, les erreurs, qui intÃ©ressent cette Ã©tude.
+lient la *GÃ©ographie* aux autres domaines de connaissance.
+
+Deux tendances gouvernent le choix d'un modÃ¨le dont Ã©tudier les erreurs. Il faut
+qu'elles soient assez nombreuses pour fournir matiÃ¨re Ã  observation et donc ne
+pas prendre le meilleur, mais Ã  l'inverse il est vraisemblable que les
+prÃ©dictions d'un classifieur obtenant de trop mauvais rÃ©sultats recÃ¨lent
+davantage de bruit que de vÃ©ritÃ©s profondes sur les contenus des articles. Pour
+ces deux raisons, c'est le modÃ¨le *SGD+TF-IDF* entraÃ®nÃ© sur tous les articles
+disponibles (colonne nÂ°3 du tableau \ref{tab:result_1} p.\pageref{tab:result_1})
+qui a Ã©tÃ© retenu pour cette Ã©tude et sera utilisÃ© tout au long de cette section.
+Ce modÃ¨le parvient Ã  classer correctement 9â€¯630 des 11â€¯702 articles, soit 82%.
+Ce sont les 2â€¯072 autres, les erreurs, qui intÃ©ressent cette Ã©tude.
 
 ### Des erreurs Ã©loquentes {#sec:model_errors}
 
@@ -105,12 +101,7 @@ unique et Â«correcteÂ» pour un article donnÃ©.
 Un point de dÃ©part simple pour cette Ã©tude consiste Ã  Ã©tudier les faux nÃ©gatifs
 et les faux positifs des articles de *GÃ©ographie*. Sur les 2â€¯621 articles de
 cette classe prÃ©sents dans le jeu de test, 191 ont Ã©tÃ© mal classÃ©s par le
-modÃ¨le. Dans le formalisme introduit au dÃ©but de cette partie, une Â«erreur de
-classificationÂ» signifie que le modÃ¨le n'a pas rÃ©ussi Ã  prÃ©dire le *domaine
-regroupÃ©* obtenu Ã  l'issue de la conversion depuis l'*ensemble de domaines*
-associÃ© Ã  un article donnÃ© par l'[@=ENCCRE], soit aprÃ¨s normalisation des
-dÃ©signants prÃ©sents dans l'article (1^Ã¨re^ source) soit en fonction de son
-propre travail Ã©ditorial (2^Ã¨me^ source).
+modÃ¨le.
 
 ##### Faux nÃ©gatifs
 
diff --git a/Conclusion/Bilan.md b/Conclusion/Bilan.md
index db810a16aec6bacead6c704830134b1a35bcd5e2..d3cfc9696d6469bc81a8d2f6256cc03b50ad51f6 100644
--- a/Conclusion/Bilan.md
+++ b/Conclusion/Bilan.md
@@ -24,9 +24,9 @@ autres domaines de connaissance dans la partie du corpus correspondant Ã  *LGE*
 p.\pageref{sec:geography_edge_words_count}). Des articles plus longs
 apparaissent dans le domaine, particuliÃ¨rement bref par contraste dans l'*EDdA*.
 Une autre consÃ©quence de ces rapprochements peut s'observer en considÃ©rant les
-occurrences d'EN comme le fait la section \ref{sec:geo_named_entities}
+occurrences d'[@=EN] comme le fait la section \ref{sec:geo_named_entities}
 (p.\pageref{sec:geo_named_entities}). Alors que les philosophes des LumiÃ¨res
-emploient surtout les EN dans les articles de la classe *GÃ©ographie*, le profil
+emploient surtout les [@=EN] dans les articles de la classe *GÃ©ographie*, le profil
 d'utilisation des diffÃ©rents types relevÃ©s dans l'annotation gÃ©o-sÃ©mantique des
 articles s'harmonise entre les disciplines. Les noms propres de lieu en
 particulier (NP-Spatial) se propagent dans une certaine mesure aux autres
diff --git a/Contrastes/Contours.md b/Contrastes/Contours.md
index 794d6ec636a6ecfc072cbef2adfc637470206424..13ef7e573b9aeae718bcd059cbb942dd41f52f0f 100644
--- a/Contrastes/Contours.md
+++ b/Contrastes/Contours.md
@@ -327,7 +327,7 @@ corrobore Ã©galement l'hypothÃ¨se de sa disciplinarisation.
 
 Intuitivement, la GÃ©ographie en tant que science descriptive de l'espace
 terrestre renvoie Ã  la notion de lieu et en particulier de lieu nommÃ©. Le
-concept d'EntitÃ© NommÃ©e (EN) paraÃ®t donc un angle d'approche tout Ã  fait
+concept d'EntitÃ© NommÃ©e ([@=EN]) paraÃ®t donc un angle d'approche tout Ã  fait
 appropriÃ© pour Ã©tudier les articles encyclopÃ©diques du corpus et on peut faire
 l'hypothÃ¨se que ces entitÃ©s seront particuliÃ¨rement prÃ©sentes dans les articles
 de *GÃ©ographie*.
@@ -353,10 +353,10 @@ de l'ambiguÃ¯tÃ© des prÃ©positions et du vocabulaire dans de nombreux
 langagesÂ â€”â€¯illustrÃ©e par exemple pour l'anglais par
 @kordjamshidi_spatial_2010[p.3].
 
-Mais les discours gÃ©ographiques, au-delÃ  de leur densitÃ© en EN, prÃ©sentent aussi
-un intÃ©rÃªt dans la maniÃ¨re dont ils les mettent en relation ainsi que dans le
-vocabulaire qu'ils utilisent pour les catÃ©goriser. On peut ainsi penser, dans le
-contexte prÃ©cis de ce corpus d'Ã©tude Ã  la diffÃ©rence significative entre des
+Mais les discours gÃ©ographiques, au-delÃ  de leur densitÃ© en [@=EN], prÃ©sentent
+aussi un intÃ©rÃªt dans la maniÃ¨re dont ils les mettent en relation ainsi que dans
+le vocabulaire qu'ils utilisent pour les catÃ©goriser. On peut ainsi penser, dans
+le contexte prÃ©cis de ce corpus d'Ã©tude Ã  la diffÃ©rence significative entre des
 termes comme Â«paroisseÂ» et Â«communeÂ». C'est pourquoi une annotation
 gÃ©o-sÃ©mantique riche a Ã©tÃ© retenue plutÃ´t qu'une annotation en entitÃ©s nommÃ©es
 classiques pour examiner lâ€™hypothÃ¨se formulÃ©e au dÃ©but de cette sous-section. Le
@@ -420,7 +420,7 @@ donc leurs sommes pondÃ©rÃ©es, c'est-Ã -dire en fait les dÃ©comptes d'entitÃ©s d
 type donnÃ© dans toute l'*EDdA*, divisÃ©s par le nombre de mots de cette
 encyclopÃ©die.
 
-![DensitÃ© d'entitÃ©s dans l'*EDdA* par domaine et par type](figure/entities/EDdA_density.png){#fig:ene_edda width=70%}
+![DensitÃ© d'entitÃ©s dans l'*EDdA* par domaine et par type](figure/entities/EDdA_density.png){#fig:ene_edda width=90%}
 
 Les sommes horizontales s'effectuent au contraire sans problÃ¨me, mais il faut
 garder Ã  l'esprit qu'elles reprÃ©sentent un nombre d'entitÃ©s et pas un nombre de
@@ -473,12 +473,12 @@ Les autres types d'entitÃ©s particuliÃ¨res, celles de personnes, prÃ©sentent une
 distribution beaucoup plus homogÃ¨ne entre les domaines. Les `NC-Person` sont
 ainsi bien plus uniformÃ©ment rÃ©parties que les `NC-Spatial`, et les `NP-Person`
 atteignent une densitÃ© proche de 2%, son maximum, dans trois domaines. Il est Ã 
-noter que ce dernier type d'EN est bien reprÃ©sentÃ© en *GÃ©ographie*, oÃ¹ il trÃ¨s
-lÃ©gÃ¨rement plus frÃ©quent qu'en *Histoire* alors que les EN de type *NP-Spatial*
-Ã©taient bien moins frÃ©quents en *Histoire* qu'en *GÃ©ographie*. Les entitÃ©s de
-personnes n'apparaissent donc pas comme caractÃ©ristiques d'un domaine en
-particulier mais s'observent avec des combinaisons de densitÃ©s variÃ©es entre les
-`NC-Person`, `NP-Person` et `ENE-Person` en fonction des domaines.
+noter que ce dernier type d'[@=EN] est bien reprÃ©sentÃ© en *GÃ©ographie*, oÃ¹ il
+trÃ¨s lÃ©gÃ¨rement plus frÃ©quent qu'en *Histoire* alors que les [@=EN] de type
+*NP-Spatial* Ã©taient bien moins frÃ©quents en *Histoire* qu'en *GÃ©ographie*. Les
+entitÃ©s de personnes n'apparaissent donc pas comme caractÃ©ristiques d'un domaine
+en particulier mais s'observent avec des combinaisons de densitÃ©s variÃ©es entre
+les `NC-Person`, `NP-Person` et `ENE-Person` en fonction des domaines.
 
 La figure \ref{fig:ene_lge} qui montre les mÃªmes statistiques mais pour *LGE*
 offre un aspect tout Ã  fait diffÃ©rent. La *GÃ©ographie* y conserve la place de
@@ -502,7 +502,7 @@ la totalitÃ© de *LGE*, soit environ deux fois et demie plus que dans l'*EDdA*. L
 densitÃ© totale d'entitÃ©s dans cette encyclopÃ©die s'est beaucoup accrue,
 atteignant 7.5% soit plus d'une fois et demie celle dans les pages de l'*EDdA*.
 
-![DensitÃ© des ENE dans *LGE* par domaine et par type d'ENE](figure/entities/LGE_density.png){#fig:ene_lge width=70%}
+![DensitÃ© des ENE dans *LGE* par domaine et par type d'ENE](figure/entities/LGE_density.png){#fig:ene_lge width=90%}
 
 Il y a donc dans ces encyclopÃ©dies deux mouvements simultanÃ©s et contraires au
 niveau des entitÃ©s entre le XVIII^Ã¨me^ et le XIX^Ã¨me^ siÃ¨cle. D'une part les
diff --git a/Contrastes/Introduction.md b/Contrastes/Introduction.md
index 44e621044593797b16672fad71066156c194c181..dc03206520c24f6293fa916589d3bee1f4a1ccc4 100644
--- a/Contrastes/Introduction.md
+++ b/Contrastes/Introduction.md
@@ -1,8 +1,12 @@
-Ce dernier chapitre qui s'ouvre permet l'aboutissement des efforts dÃ©ployÃ©s dans
-les deux prÃ©cÃ©dents en dÃ©veloppant des Ã©tudes contrastives en diachronie entre
-l'*EDdA* et *LGE*. Le chapitre \ref{sec:corpus} fournit un corpus structurÃ© et
-dÃ©veloppe la notion de domaine de connaissance, centrale pour la classification
-qui est appliquÃ©e aux articles au chapitre \ref{sec:domains_classification}.
+Ce dernier chapitre qui s'ouvre constitue une mise en pratique des donnÃ©es
+prÃ©parÃ©s dans le cadre de cette thÃ¨se. Le chapitre \ref{sec:corpus} fournit en
+effet un corpus structurÃ© et dÃ©veloppe la notion de domaine de connaissance,
+centrale pour la classification qui est appliquÃ©e aux articles au chapitre
+\ref{sec:domains_classification}. Les analyses contrastives en diachronie
+conduites dans le prÃ©sent chapitre entre l'*EDdA* et *LGE* permettent de
+dÃ©montrer l'utilitÃ© et la pertinence des efforts dÃ©ployÃ©s dans les deux
+prÃ©cÃ©dents.
+
 Tout en gardant bien Ã  l'esprit les rÃ©serves Ã©mises Ã  l'Introduction sur la
 diffÃ©rence entre d'une part la GÃ©ographie en tant que discipline et d'autre part
 les discours qui peuvent relever de la gÃ©ographie (voir \ref{sec:intro_strategy}
diff --git a/Glossaire/ARTFL.md b/Glossaire/ARTFL.md
index 2a12324c924b50416bf22d2e60004b89368ab4f3..6d79498566123c4059baf7209600094d74360cc0 100644
--- a/Glossaire/ARTFL.md
+++ b/Glossaire/ARTFL.md
@@ -2,4 +2,4 @@ l'American and French Research on the Treasury of the French Language
 (Â«Recherche amÃ©ricaine et franÃ§aise sur les trÃ©sors de la langue franÃ§aiseÂ») est
 une collaboration du laboratoire ATILF, du CNRS et de l'UniversitÃ© de Chicago.
 Le projet donne accÃ¨s Ã  un vaste corpus de textes anciens en franÃ§ais.
-[https://artfl-project.uchicago.edu/](https://artfl-project.uchicago.edu/)
+[https://artfl-project.uchicago.edu/](https://artfl-project.uchicago.edu/).
diff --git a/Glossaire/EN.md b/Glossaire/EN.md
new file mode 100644
index 0000000000000000000000000000000000000000..713ebfbfebe9cce8e1aebb46d093d0c556cef39f
--- /dev/null
+++ b/Glossaire/EN.md
@@ -0,0 +1,5 @@
+*EntitÃ© NommÃ©e* (*Named Entity* en anglais) dÃ©signe une unitÃ© d'information dans
+un texte, souvent un mot ou un groupe de quelques mots qui renvoient Ã  un objet
+unique dans le contexte. Plus large que la notion de nom propre, il englobe par
+exemple les noms de personne, d'organisation ou d'endroit, les dates ou les
+grandeurs pourvues d'une unitÃ©.
diff --git a/Glossaire/ENE.md b/Glossaire/ENE.md
index ae46117aab2772bb980e96d7ee55fc370886a2c5..030083f164289e31ea54b5ce982009211886e93b 100644
--- a/Glossaire/ENE.md
+++ b/Glossaire/ENE.md
@@ -1,6 +1,6 @@
 *EntitÃ© NommÃ©e Ã‰tendue* dÃ©signe un groupe de mots structurÃ© en une construction
-qui dÃ©passe le cadre des entitÃ©s nommÃ©es (EN) pour inclure les Ã©lÃ©ments prÃ©sents
-autour: principalement des noms communs et des relations. Les ENE se bÃ¢tissent
+qui dÃ©passe le cadre des [@=EN] pour inclure les Ã©lÃ©ments prÃ©sents autour:
+principalement des noms communs et des relations. Les ENE se bÃ¢tissent
 rÃ©cursivement, pouvant inclure d'autres ENE, pour constituer de petits arbres
 autours des entitÃ©s nommÃ©es.
 
@@ -9,10 +9,10 @@ lieu, constituÃ©e d'un nom commun de lieu qui lui donne son type (c'est un
 kiosque), d'une relation spatiale Â«dansÂ» (traduisant l'inclusion), et d'une ENE:
 Â«le parc Sainte-MarieÂ». Ã€ son tour, celle-ci se dÃ©compose en un nom commun de
 lieu (c'est un parc), et un nom propre, Â«Sainte-MarieÂ», qui sans l'apport des
-ENE aurait probablement Ã©tÃ© la seule EN simple retenue pour toute l'expression.
-Il est intÃ©ressant de voir que le nom propre apporte pourtant peu d'information
-en lui-mÃªme, et qu'il n'est possible de percevoir sa dimension spatiale qu'avec
-l'ajout du nom commun Â«parcÂ» (il existe peut-Ãªtre par exemple une Â«communautÃ©
-Sainte-MarieÂ» qui pourrait Ãªtre une organisation et pas un lieu) ce qui souligne
-l'utilitÃ© des ENE pour la dÃ©sambiguÃ¯sation et les tÃ¢ches de comprÃ©hension
-automatique.
+ENE aurait probablement Ã©tÃ© la seule [@=EN] simple retenue pour toute
+l'expression. Il est intÃ©ressant de voir que le nom propre apporte pourtant peu
+d'information en lui-mÃªme, et qu'il n'est possible de percevoir sa dimension
+spatiale qu'avec l'ajout du nom commun Â«parcÂ» (il existe peut-Ãªtre par exemple
+une Â«communautÃ© Sainte-MarieÂ» qui pourrait Ãªtre une organisation et pas un lieu)
+ce qui souligne l'utilitÃ© des ENE pour la dÃ©sambiguÃ¯sation et les tÃ¢ches de
+comprÃ©hension automatique.
diff --git a/Glossaire/LDA.md b/Glossaire/LDA.md
index ce7b2b47cb7561ad09fa33d4513ab6f5fe635b1f..c87596b630b8226f5cffae71dc5513d0fa60b298 100644
--- a/Glossaire/LDA.md
+++ b/Glossaire/LDA.md
@@ -1,3 +1,3 @@
 *Latent Dirichlet Allocation*, procÃ©dÃ© de rÃ©duction de dimension permettant de
 mettre en Ã©vidence des classes de ressemblances prÃ©sentes dans les donnÃ©es
-d'entrÃ©e. C'est une technique de [@=TopicÂ Modeling]
+d'entrÃ©e. C'est une technique de [@=TopicÂ Modeling].
diff --git a/Glossaire/UD.md b/Glossaire/UD.md
index 9c0c9fcc2dea358233d7e8627ffe667fbb027f3c..c3558ece3db25f0f83cc9217fcb91fdc9072f43b 100644
--- a/Glossaire/UD.md
+++ b/Glossaire/UD.md
@@ -1,6 +1,6 @@
 *Universal Dependencies*, sont une convention d'annotation grammaticale
-comprenant des jeux d'Ã©tiquettes Ã  plusieurs niveaux (morphosyntaxe,
-morphologie et syntaxe en dÃ©pendance) conÃ§u pour Ãªtre commun Ã  un grand nombre
-des langues humaines les plus Ã©tudiÃ©es, ce qui permet notamment de pouvoir
-travailler sur des corpus multilingues.
-[https://universaldependencies.org/](https://universaldependencies.org/)
+comprenant des jeux d'Ã©tiquettes Ã  plusieurs niveaux (morphosyntaxe, morphologie
+et syntaxe en dÃ©pendance) conÃ§u pour Ãªtre commun Ã  un grand nombre des langues
+humaines les plus Ã©tudiÃ©es, ce qui permet notamment de pouvoir travailler sur
+des corpus multilingues
+([https://universaldependencies.org/](https://universaldependencies.org/)).
diff --git a/Introduction/Cadre.md b/Introduction/Cadre.md
index 1995d569125f888afa48e0793f5ee019f1d41781..f49f4e9f9d54a3da4e57defc94523f2c4ff0bd83 100644
--- a/Introduction/Cadre.md
+++ b/Introduction/Cadre.md
@@ -85,9 +85,9 @@ de la Â«mappemondeÂ» que constitue le Â«SystÃªme FigurÃ© des connoissances humai
 un Â«arbre encyclopÃ©diqueÂ» matÃ©rialisÃ© sous forme d'une gravure au tome 1^er^
 dans le but de montrer une vue d'ensemble des liens entre sciences.
 
-\label{geo_nations}La relation entre GÃ©ographie et encyclopÃ©dies sur laquelle
-s'ouvrait cette section est donc en rÃ©alitÃ© Ã  double-sens: Ã  la GÃ©ographie comme
-science encyclopÃ©dique, nourrie de toutes les autres, s'ajoute la pratique
+\label{geo_nations}La relation entre GÃ©ographie et encyclopÃ©dies Ã  l'origine de
+cette rÃ©flexion est donc en rÃ©alitÃ© Ã  double-sens: Ã  la GÃ©ographie comme science
+encyclopÃ©dique, nourrie de toutes les autres, s'ajoute la pratique
 encyclopÃ©dique comme une Â«gÃ©ographie des sciencesÂ» dont elle rÃ©vÃ¨le le paysage.
 Cependant, au-delÃ  de cette relation,Â la GÃ©ographie est soumise aux XVIII^Ã¨me^
 et XIX^Ã¨me^ siÃ¨cles Ã  des forces transformatrices profondes.
diff --git a/Introduction/Enjeu.md b/Introduction/Enjeu.md
index 4d4dc5b03a3489f96f8641afb598b649399d3bf0..f8eab04436bb778e708dc32f2d4223b4fc84dced 100644
--- a/Introduction/Enjeu.md
+++ b/Introduction/Enjeu.md
@@ -1,41 +1,68 @@
 ## RÃ©flexions prospectives {#sec:intro_forethoughts}
 
-### StratÃ©gie {#sec:intro_strategy .unnumbered .unlisted}
-
-La problÃ©matique dÃ©gagÃ©e dans la section prÃ©cÃ©dente invite Ã  adopter une
-dÃ©marche contrastive, selon deux axes. Le premier, temporel, est celui de la
-diachronie puisqu'il s'agit de comparer les discours du genre encyclopÃ©dique Ã 
+### ProblÃ©matique {#sec:intro_issue .unnumbered .unlisted}
+
+Le lien privilÃ©giÃ© qui unit les encyclopÃ©dies Ã  la GÃ©ographie amÃ¨ne Ã 
+s'interroger sur les effets qu'ont pu avoir dans ce type d'ouvrages les
+changements subis par la discipline aprÃ¨s le siÃ¨cle des LumiÃ¨res. Puisqu'il y a
+lieu de faire l'hypothÃ¨se que ces mutations ont eu des consÃ©quences sur la
+maniÃ¨re dont on Ã©crit la GÃ©ographie, il faut se donner les moyens d'observer
+leurs effets, ce qui constitue l'enjeu principal de cette thÃ¨se.
+
+La question que soulÃ¨ve immÃ©diatement une telle problÃ©matique concerne donc les
+moyens d'accÃ©der aux discours gÃ©ographiques prÃ©sents dans les encyclopÃ©dies du
+corpus. De nombreux projets en [@=HN] ont dÃ©jÃ  dÃ©veloppÃ© des outils pour traiter
+des textes antÃ©rieurs au XX^Ã¨me^ siÃ¨cle; d'autres s'intÃ©ressent Ã  l'importance
+d'un ensemble d'articles pour une discipline en particulier mais sans intÃ©grer
+d'analyse de discours et sans les opposer aux autres sciences. Ici, l'objectif
+est Ã  la fois de pouvoir traiter les textes des encyclopÃ©dies dans leur ensemble
+Ã  l'aide de mÃ©thodes automatiques et, simultanÃ©ment, d'Ãªtre Ã  tout moment
+capable de restreindre l'Ã©tude Ã  des sous-corpus pertinents ou d'adopter une
+dÃ©marche contrastive, principalement selon deux axes. Le premier, celui du champ
+disciplinaire, repose sur la possibilitÃ© d'identifier des discours gÃ©ographiques
+par opposition Ã  d'autres qui ne relÃ¨veraient pas du mÃªme domaine. Le deuxiÃ¨me
+axe est temporel puisqu'il faut comparer les discours du genre encyclopÃ©dique Ã 
 deux Ã©poques: le XVIII^Ã¨me^ d'une part et le tournant des XIX^Ã¨me^ et XX^Ã¨me^
-siÃ¨cles d'autre part. Le deuxiÃ¨me axe utilisÃ© pour faire contraster les textes du
-corpus, celui du champ disciplinaire, repose sur la possibilitÃ© d'identifier des
-discours gÃ©ographiques par opposition Ã  d'autres qui ne relÃ¨veraient pas de la
-discipline.
-
-La Â«cartographieÂ» des sciences entreprise par les encyclopÃ©distes se matÃ©rialise
-par la rÃ©partition des articles entre les diffÃ©rentes sciences en fonction des
-concepts dont ils traitent. TrÃ¨s simplement, la stratÃ©gie qui forme la ligne
-directrice de cette thÃ¨se va donc consister Ã  partitionner les articles
-d'encyclopÃ©die du corpus suivant l'Å“uvre dont ils sont issus pour la premiÃ¨re
-dimension et suivant le domaine de connaissance dont ils relÃ¨vent pour la
-deuxiÃ¨me. Mais il est une Ã©vidence apparente qui doit Ãªtre critiquÃ©e sous peine
-de fragiliser la dÃ©marche dans son ensemble: celle de l'identification implicite
-entre d'une part la discipline "gÃ©ographie" et d'autre part l'ensemble des
-articles assignÃ©s Ã  cette discipline par le choix Ã©ditorial des encyclopÃ©distes.
-Si la premiÃ¨re peut Ãªtre initialement dÃ©finie en tant qu'un ensemble vivant de
-pratiques et de savoirs, elle renvoie intuitivement Ã  une notion plus vaste et
-plus immatÃ©rielle. Au contraire la seconde, purement arbitraire, n'a d'existence
-que concrÃ¨te et contingente au travers des articles qui la constituent. Ces
-articles ne sont que l'echo de la discipline, arrivant nÃ©cessairement en retard
-par rapport Ã  ses progrÃ¨s: ils sont Ã©crits aprÃ¨s rÃ©verberation dans un ou
-plusieurs des dictionnaires universels dans lesquels les encyclopÃ©distes ont
-puisÃ© leurs sources, parfois d'aprÃ¨s des rÃ©cits de voyages passÃ©s. Une
-expression du XVIII^Ã¨me^ siÃ¨cle illustre parfaitement cette source
-d'information: Â«terme de relationÂ» [@quemada_dictionnaires_1968, p.309], qui
-qualifie certaines entrÃ©es dans l'*EDdA* et sous-entend le mot Â«voyageÂ». Il
-s'agit en effet du vocabulaire frÃ©quemment utilisÃ© lorsqu'un texte relate un
-voyage, le plus souvent une francisation d'un mot de la langue parlÃ©e dans le
-pays visitÃ© comme PILAU (L'EncyclopÃ©die, T12, p.618) empruntÃ© au Turc pour
-parler de la cuisson du riz.
+siÃ¨cles d'autre part.
+
+Cette thÃ©matique de recherche mobilise plusieurs des apports de l'informatiques
+aux [@=HN]. Il est d'abord nÃ©cessaire de dÃ©terminer un encodage qui convienne Ã 
+la fois Ã  l'*EDdA* et Ã  *LGE* malgrÃ© leur diffÃ©rences, de faÃ§on Ã  pouvoir
+regrouper les deux Å“uvres au sein d'un mÃªme corpus et leur appliquer les mÃªmes
+traitements puis les mÃªmes analyses. Cette tÃ¢che de normalisation, avec celle
+d'organisation des textes et des mÃ©tadonnÃ©es reprÃ©sente un important travail
+d'ingÃ©nierie des donnÃ©es. Ã€ ces efforts s'ajoutent ceux Ã  fournir pour
+identifier les discours pouvant relever de la GÃ©ographie. La Â«cartographieÂ» des
+sciences entreprise par les encyclopÃ©distes se matÃ©rialise par la rÃ©partition
+des articles entre les diffÃ©rentes sciences en fonction des concepts dont ils
+traitent. Ã€ cette Ã©chelle, associer un mÃªme domaine de connaissance Ã  des
+articles des deux encyclopÃ©dies prend la forme d'un problÃ¨me de classification.
+Plus prÃ¨s des phrases, l'annotation automatisÃ©e des textes et l'Ã©criture de
+requÃªtes basÃ©es sur des critÃ¨res lexicaux ou syntaxiques, faisant appel Ã  la
+fois Ã  l'informatique et aux sciences du langage, permet de mettre en Ã©vidence
+des motifs utiles.
+
+### La GÃ©ographie et ses traces {#sec:intro_strategy .unnumbered .unlisted}
+
+Au niveau des articles entiers, une Ã©vidence apparente doit toutefois Ãªtre
+critiquÃ©e sous peine de fragiliser la dÃ©marche dans son ensemble: celle de
+l'identification implicite entre d'une part la discipline "gÃ©ographie" et
+d'autre part l'ensemble des articles assignÃ©s Ã  cette discipline par le choix
+Ã©ditorial des encyclopÃ©distes. Si la premiÃ¨re peut Ãªtre initialement dÃ©finie en
+tant qu'un ensemble vivant de pratiques et de savoirs, elle renvoie
+intuitivement Ã  une notion plus vaste et plus immatÃ©rielle. Au contraire la
+seconde, purement arbitraire, n'a d'existence que concrÃ¨te et contingente au
+travers des articles qui la constituent. Ces articles ne sont que l'echo de la
+discipline, arrivant nÃ©cessairement en retard par rapport Ã  ses progrÃ¨s: ils
+sont Ã©crits aprÃ¨s rÃ©verberation dans un ou plusieurs des dictionnaires
+universels dans lesquels les encyclopÃ©distes ont puisÃ© leurs sources, parfois
+d'aprÃ¨s des rÃ©cits de voyages passÃ©s. Une expression du XVIII^Ã¨me^ siÃ¨cle
+illustre parfaitement cette source d'information: Â«terme de relationÂ»
+[@quemada_dictionnaires_1968, p.309], qui qualifie certaines entrÃ©es dans
+l'*EDdA* et sous-entend le mot Â«voyageÂ». Il s'agit en effet du vocabulaire
+frÃ©quemment utilisÃ© lorsqu'un texte relate un voyage, le plus souvent une
+francisation d'un mot de la langue parlÃ©e dans le pays visitÃ© comme PILAU
+(L'EncyclopÃ©die, T12, p.618) empruntÃ© au Turc pour parler de la cuisson du riz.
 
 L'objet qui intÃ©resse fondamentalement cette thÃ¨se est bien sÃ»r la GÃ©ographie en
 tant que discipline (qu'on distinguera typographiquement en conservant la
@@ -63,7 +90,7 @@ elle-mÃªme, elle est nÃ©cessairement irrÃ©guliÃ¨re et probablement lacunaire. C'
 la raison pour laquelle les mesures sont rÃ©parties alÃ©atoirement sur la figure
 \ref{fig:sampling} plutÃ´t qu'espacÃ©es entre elles d'un pas constant comme cela
 aurait Ã©tÃ© le cas sur un graphe similaire destinÃ© Ã  illustrer un vrai processus
-d'Ã©chantillonnage, par exemple d'un signal accoustique. Il s'agit donc de
+d'Ã©chantillonnage, par exemple d'un signal accoustique. Le problÃ¨me est donc de
 travailler Ã  partir d'une Â«traceÂ» de la GÃ©ographie, passÃ©e et finie, sans
 pouvoir limiter ni mÃªme seulement connaÃ®tre la quantitÃ© d'information perdue par
 rapport au Â«signalÂ» que constituerait la discipline gÃ©ographique. C'est pourtant
@@ -79,15 +106,14 @@ distinction Ã  l'esprit.
 ### Faire correspondre des Ã©poques {#sec:mapping_ages .unnumbered .unlisted}
 
 Ã€ la lumiÃ¨re de la remarque ci-dessus, apparaÃ®t un deuxiÃ¨me questionnement sur
-l'identitÃ© des objets qu'il s'agit de comparer. En effet, puisqu'il est
-impossible d'accÃ©der directement Ã  la GÃ©ographie de chaque Ã©poque et qu'il faut
-se contenter de ses traces sous forme d'ensembles d'articles, il est naturel de
-s'interroger sur le bien-fondÃ© d'une mise en regard de ces ensembles au seul
-prÃ©texte qu'ils sont estampillÃ©s *GÃ©ographie* chacun Ã  leur Ã©poque.
-Intuitivement, l'identitÃ© paraÃ®t Ã©vidente car c'est bien la mÃªme discipline qui
-a Ã©voluÃ© continÃ»ment d'une Ã©poque Ã  l'autre, et les encyclopÃ©distes de chaque
-Ã©poque ont choisi les articles qu'ils considÃ©raient relever de cette mÃªme
-discipline.
+l'identitÃ© des objets Ã  comparer. En effet, puisqu'il est impossible d'accÃ©der
+directement Ã  la GÃ©ographie de chaque Ã©poque et qu'il faut se contenter de ses
+traces sous forme d'ensembles d'articles, il est naturel de s'interroger sur le
+bien-fondÃ© d'une mise en regard de ces ensembles au seul prÃ©texte qu'ils sont
+estampillÃ©s *GÃ©ographie* chacun Ã  leur Ã©poque. Intuitivement, l'identitÃ© paraÃ®t
+Ã©vidente car c'est bien la mÃªme discipline qui a Ã©voluÃ© continÃ»ment d'une Ã©poque
+Ã  l'autre, et les encyclopÃ©distes de chaque Ã©poque ont choisi les articles
+qu'ils considÃ©raient relever de cette mÃªme discipline.
 
 Mais en toute rigueur, avec les seuls Ã©lÃ©ments disponiblesÂ â€”â€¯c'est-Ã -dire des
 collections d'articles non seulement finies mais surtout disjointes, sans
diff --git a/Introduction/Plan.md b/Introduction/Plan.md
index 59cea0712ba0b2b953242bda44bcc5738bb856ae..1c3fd8cd64810b75ff45662607d7a098b16a1209 100644
--- a/Introduction/Plan.md
+++ b/Introduction/Plan.md
@@ -51,6 +51,10 @@ cas notoire des biographies dans les articles de gÃ©ographie.
 
 ### Contributions {.unnumbered .unlisted}
 
+Les recherches prÃ©sentÃ©es dans ce manuscrit se situent Ã  l'interface de
+l'informatique et des sciences du langage mais la rÃ©partition des trois
+contributions entre ces deux sciences reste nettement en faveur de la premiÃ¨re.
+
 #### Version numÃ©rique structurÃ©e de *LGE* {.unnumbered .unlisted}
 
 PrÃ©sentÃ©e au chapitre \ref{sec:corpus}, la publication de la premiÃ¨re version
@@ -102,10 +106,10 @@ pour rendre compte des liens qui unissent les biographies et la GÃ©ographie.
 
 ### Choix {.unnumbered .unlisted}
 
-Le prÃ©sent manuscrit comporte un certain nombre de choix et de partis pris qu'il
-est bon d'avoir en tÃªte avant d'entamer sa lecture et qui tiennent en partie Ã 
-son caractÃ¨re autorÃ©fÃ©rentiel. Au contact du genre encyclopÃ©dique, il a fini par
-en prendre certaines caractÃ©ristiques.
+La rÃ©daction de ce manuscrit a fait l'objet d'un certain nombre de choix et de
+partis pris qu'il est bon d'avoir en tÃªte avant d'entamer sa lecture et qui
+tiennent en partie Ã  son caractÃ¨re autorÃ©fÃ©rentiel. Au contact du genre
+encyclopÃ©dique, il a fini par en prendre certaines caractÃ©ristiques.
 
 Le texte comporte des renvois frÃ©quents, non seulement Ã  des figures mais
 Ã©galement Ã  des sections ou Ã  des passages prÃ©cis dans le texte pour Ã©viter de
diff --git a/biblio.bib b/biblio.bib
index b23cf2476b755eb93b6a31540ee848ba7316ea10..b654f031f2c42265b43b6e004488ac8d5d7a71aa 100644
--- a/biblio.bib
+++ b/biblio.bib
@@ -604,7 +604,7 @@
 	number = {2},
 	urldate = {2023-02-16},
 	journal = {Langue franÃ§aise},
-	author = {Vigier, Denis and Moncla, Ludovic and Lefort, Isabelle and Joliveau, Thierry and Mac Donough, Katherine},
+	author = {Vigier, Denis and Moncla, Ludovic and Lefort, Isabelle and Joliveau, Thierry and McDonough, Katherine},
 	month = jun,
 	year = {2022},
 	pages = {59--80},
@@ -1479,7 +1479,7 @@ Dans leur diversitÃ©, les articles des VariaÂ 2023 portent sur un discours de Ma
 	issn = {1945-3604},
 	url = {https://journals.colorado.edu/index.php/lilt/article/view/1245},
 	doi = {10.33011/lilt.v6i.1245},
-	abstract = {Today's students might be faced with a very different set of challenges from those of the 1990s in the not-too-distant future. What should they do when most of the low hanging fruit has been pretty much picked over?

+	abstract = {Today's students might be faced with a very different set of challenges from those of the 1990s in the not-too-distant future. What should they do when most of the low hanging fruit has been pretty much picked over?
 In the particular case of Machine Translation, the revival of statistical approaches (e.g., Brown et al. (1993)) started out with finite-state methods for pragmatic reasons, but gradually over time, researchers have become more and more receptive to the use of syntax to capture long-distance dependences, especially when there isn't very much parallel corpora, and for language pairs with very different word orders (e.g., translating between a subject-verb-object (SVO) language like English and a verb final language like Japanese). Going forward, we should expect Machine Translation research to make more and more use of richer and richer linguistic representations. So too, there will soon be a day when stress will become important for speech recognition.

 Since it isn't possible for textbooks in computational linguistics to cover all of these topics, we should work with colleagues in other departments to make sure that students receive an education that is broad enough to prepare them for all possible futures, or at least all probable futures.},
 	urldate = {2023-08-28},
@@ -1792,7 +1792,7 @@ Since it isn't possible for textbooks in computational linguistics to cover all
     BOOKTITLE = {{9th Workshop on Geographic Information Retrieval}},
     ADDRESS = {Paris, France},
     YEAR = {2015},
-    MONTH = Nov,
+    MONTH = {Nov},
     DOI = {10.1145/2837689.2837700},
     KEYWORDS = {geo-semantic tagging ;  text annotation ;
         expanded named entity},
@@ -2197,7 +2197,7 @@ Since it isn't possible for textbooks in computational linguistics to cover all
     author = "Nadeau, David and Sekine, Satoshi",
     title = "A survey of named entity recognition and classification",
     journal= "LingvisticÃ¦ Investigationes",
-    year = "2007",
+    year = {2007},
     volume = "30",
     number = "1",
     pages = "3-26",
@@ -2446,7 +2446,7 @@ Since it isn't possible for textbooks in computational linguistics to cover all
     type = {ISO},
     number = {ISO 8879:1986},
     year = {1986},
-    month = oct,
+    month = {oct},
     date = 15,
 }
 
@@ -2457,7 +2457,7 @@ Since it isn't possible for textbooks in computational linguistics to cover all
   BOOKTITLE = {{First International Workshop on Geographic Information Extraction from Texts (GeoExT)}},
   ADDRESS = {Dublin, Ireland},
   YEAR = {2023},
-  MONTH = Apr,
+  MONTH = {apr},
   KEYWORDS = {Geoparsing ; geocoding ; named entity recognition ; toponym disambiguation},
   PDF = {https://hal.science/hal-04049794/file/GeoExT___ECIR_2023.pdf},
   HAL_ID = {hal-04049794},
@@ -4064,7 +4064,7 @@ year = {2018},
   and Ortolja-Baird, Alexandra",
   title="Named-entity recognition for early modern textual documents: a review of capabilities and challenges with strategies for the future",
   journal="Journal of Documentation",
-  year="2021",
+  year={2021},
   month="Jan",
   day="01",
   publisher="Emerald Publishing Limited",