From 39bef38f37741cffacfdbd4a03314a779d0df536 Mon Sep 17 00:00:00 2001
From: Alice BRENON <alice.brenon@ens-lyon.fr>
Date: Thu, 3 Apr 2025 00:39:49 +0200
Subject: [PATCH] Finish proofreading chapt.5 Contrasts (**TODO** the
 validation of the Parallel corpus still needs a fix)

---
 Contrastes/Biographies.md |  46 ++++-----
 Contrastes/Contours.md    | 203 +++++++++++++++++++-------------------
 2 files changed, 127 insertions(+), 122 deletions(-)

diff --git a/Contrastes/Biographies.md b/Contrastes/Biographies.md
index d750038..4abae3e 100644
--- a/Contrastes/Biographies.md
+++ b/Contrastes/Biographies.md
@@ -1,7 +1,7 @@
 ## La biographie cachÃ©e {#sec:biographies}
 
 Un parti pris Ã©ditorial remarquable de l'*EDdA* est de ne pas avoir inclus de
-biographies dans ses pages, choix assez emblÃ©matique du SiÃ¨cle des LumiÃ¨res et
+biographies dans ses pages, choix assez emblÃ©matique du siÃ¨cle des LumiÃ¨res et
 qui correspond bien Ã  l'idÃ©al humaniste et dÃ©mocratique de diffusion du savoir
 pour sa portÃ©e libÃ©ratrice intrinsÃ¨que [@dantuono_democratie_2018, p.99] plutÃ´t
 que pour mettre en valeur des rÃ©cits hÃ©roÃ¯ques individuels. Les auteurs le
@@ -95,7 +95,7 @@ critÃ¨res simples basÃ©s sur une combinaison d'observations qualitatives et
 quantitatives pour aller au-delÃ  du seul constat: Â«Jaucourt a piratÃ© la
 GÃ©ographie de l'*EDdA* pour Ã©crire des BiographiesÂ».
 
-### Deux lemmes inattendus
+### SpÃ©cificitÃ© des lemmes Â«naÃ®treÂ» et Â«mourirÂ» en *GÃ©ographie*
 
 Les rÃ©flexions prÃ©liminaires de cette section amÃ¨nent d'abord Ã  examiner les
 relations entre la biographie et les diffÃ©rents domaines de connaissance.
@@ -143,7 +143,7 @@ suggÃ©rer qu'on qualifie bien plus volontiers une ville de Â«petiteÂ» que de
 Le Lexicoscope permet ensuite de gÃ©nÃ©rer automatiquement une autre requÃªte qui
 intÃ¨gre un des cooccurrents parmi ces rÃ©sultats. Cette fonctionnalitÃ© correspond
 Ã  une Ã©tape du procÃ©dÃ© itÃ©ratif permettant de construire progressivement un
-[@=ALR], Ã©quivalents de la mÃ©thode des Â«segments rÃ©pÃ©tÃ©sÂ» pour les cooccurrents
+[@=ALR], Ã©quivalent de la mÃ©thode des Â«segments rÃ©pÃ©tÃ©sÂ» pour les cooccurrents
 syntaxiques. La nouvelle requÃªte obtenue pour le premier rÃ©sultat, le
 dÃ©terminant Â«ceÂ», revient Ã  chercher les plus forts cooccurrents du motif Â«cette
 villeÂ». L'extrait de code \ref{lst:tql_ce_ville} montre cette requÃªte formulÃ©e
@@ -189,11 +189,13 @@ dans 1â€¯674 articles.
 [^UDdeps]:
     [https://universaldependencies.org/u/dep/index.html](https://universaldependencies.org/u/dep/index.html)
 
+\begin{minipage}{\textwidth}
 \begin{lstlisting}[caption=RequÃªte TQL sur le motif syntaxique Â«dans cette villeÂ»,
 label=lst:tql_dans_ce_ville]
 <l=dans,c=PREP,#3>&&<l=ce,c=DET,#2>&&<l=ville,c=NOUN,#1>::(.*,1,2)(.*,
 1,3)
 \end{lstlisting}
+\end{minipage}
 
 ![ReprÃ©sentation sous forme d'arbre de syntaxe en dÃ©pendance du motif dÃ©fini par la requÃªte \ref{lst:tql_dans_ce_ville}](figure/syntax/dans_ce_ville.png){#fig:dans_cette_ville_tree width=20%}
 
@@ -225,7 +227,7 @@ restreindre au sous-corpus ne contenant que les articles de l'*EDdA*, qu'on
 compter les lemmes et appliquÃ© sur cette [@=partition] avec la requÃªte CQL dont
 le code est visible Ã  l'extrait \ref{lst:cql_naitre_mourir} permet de compter
 les occurrences des deux verbes Â«naÃ®treÂ» et Â«mourirÂ» dans le corpus. Un nombre
-d'occurrence n'est en soi pas pertinent sans Ãªtre rapportÃ© Ã  la taille des
+d'occurrences n'est pas pertinent en soi sans Ãªtre rapportÃ© Ã  la taille des
 diffÃ©rentes [@=partition]s. Le calcul des spÃ©cificitÃ©s (voir la section
 \ref{sec:EdlA_linguistic_tools} p.\pageref{sec:EdlA_linguistic_tools})
 implÃ©mentÃ© dans TXM opÃ¨re cette traduction pour rÃ©vÃ©ler la quantitÃ©
@@ -259,7 +261,7 @@ avec la *GÃ©ographie* dans les pages de l'*EDdA*.
 l'*EDdA*](figure/histogram/textometry/EDdA/mourir_naitre.png){#fig:naitre_mourir_edda}
 
 L'Ã©tape suivante du raisonnement consiste naturellement Ã  se demander si cette
-observation est propre Ã  l'*EDdA* ou s'ils se gÃ©nÃ©ralisent Ã  d'autres discours
+observation est propre Ã  l'*EDdA* ou si elle se gÃ©nÃ©ralise Ã  d'autres discours
 encyclopÃ©diques. Pour rÃ©pondre Ã  cette question, on procÃ¨de de la mÃªme faÃ§on en
 [@=partition]nant par domaine de connaissance le sous-corpus ne contenant que
 les articles de *LGE* avant de calculer les spÃ©cificitÃ©s des deux mÃªmes lemmes.
@@ -267,11 +269,11 @@ Les spÃ©cificitÃ©s obtenues suivent un profil bien plus tranchÃ©, de nombreux
 domaines obtenant pour les deux verbes des scores Â«saturÃ©sÂ» (voir la section
 \ref{textometry_specificity} p.\pageref{textometry_specificity} sur ce point),
 en positif ou en nÃ©gatif, c'est-Ã -dire que les deux y sont Â«infinimentÂ»
-spÃ©cifiques. Partout ailleurs, les spÃ©cificitÃ©s sont nÃ©gatives ou trÃ¨s faibles
-(seul Â«naÃ®treÂ» obtient un score de 8 pour la *Musique*). En ce qui concerne la
-*GÃ©ographie*, les deux lemmes sont trÃ¨s fortement sous-reprÃ©sentÃ©s avec des
-spÃ©cificitÃ©s de -1000. Le phÃ©nomÃ¨ne dÃ©tectÃ© dans l'*EDdA* semble donc avoir
-disparu 130 ans plus tard dans *LGE*.
+spÃ©cifiques ou sous-spÃ©cifiques. Partout ailleurs, les spÃ©cificitÃ©s sont
+nÃ©gatives ou trÃ¨s faibles (seul Â«naÃ®treÂ» obtient un score de 8 pour la
+*Musique*). En ce qui concerne la *GÃ©ographie*, les deux lemmes sont trÃ¨s
+fortement sous-reprÃ©sentÃ©s avec des spÃ©cificitÃ©s de -1000. Le phÃ©nomÃ¨ne dÃ©tectÃ©
+dans l'*EDdA* semble donc avoir disparu 130 ans plus tard dans *LGE*.
 
 ![SpÃ©cificitÃ©s des lemmes Â«naÃ®treÂ» et Â«mourirÂ» par superdomaine dans
 *LGE*](figure/histogram/textometry/LGE/mourir_naitre.png){#fig:naitre_mourir_lge}
@@ -287,7 +289,7 @@ critÃ¨res, pour croiser Ã  la fois les notions d'auteur et de domaine de
 connaissance. Pour la premiÃ¨re, il faut en effet pouvoir distinguer les Ã©crits
 de Jaucourt, ceux de Diderot, ceux des autres auteurs et ceux restÃ©s anonymes
 (pour lesquels il n'est pas en tout rigueur possible d'Ã©carter la possibilitÃ©
-qu'ils aient Ã©tÃ© Ã©crit par Jaucourt ou Diderot). Puisque certains articles
+qu'ils aient Ã©tÃ© Ã©crits par Jaucourt ou Diderot). Puisque certains articles
 rÃ©sultent de la collaboration entre plusieurs auteurs, il est nÃ©cessaire de
 traiter Ã  part les quatre articles Ã©crits Ã  la fois par Jaucourt et
 DiderotÂ â€”â€¯les entrÃ©es CHANVRE (L'EncyclopÃ©die, T3, p.147), CHAUSSURE
@@ -295,7 +297,7 @@ DiderotÂ â€”â€¯les entrÃ©es CHANVRE (L'EncyclopÃ©die, T3, p.147), CHAUSSURE
 p.902) et JALOUSIE (L'EncyclopÃ©die, T8, p.439). La notion de domaine demande
 moins de finesse car, la surreprÃ©sentation Ã©crasante des lemmes Â«naÃ®treÂ» et
 Â«mourirÂ» en *GÃ©ographie* ayant dÃ©jÃ  Ã©tÃ© Ã©tablie, il suffit pour chacune des
-configurations d'auteur(s) possibles de comparer leurs emplois de ces deux
+configurations possibles d'auteur(s) de comparer leurs emplois de ces deux
 verbes dans et hors de la *GÃ©ographie*. Comme aucun des quatre articles Ã©crits
 par Jaucourt et Diderot ensemble ne porte sur la *GÃ©ographie*, la [@=partition]
 correspondant Ã  cette configuration reste vide.
@@ -327,7 +329,7 @@ auteurs utilisent tout de mÃªme ces deux verbes dans les articles de
 est fait hors de ce domaine. Ces deux lemmes et les contenus biographiques
 qu'ils permettent d'Ã©crire ne sont donc pas exclusifs Ã  Jaucourt. La seconde
 rÃ©side dans le fait que Diderot ne semble quant Ã  lui pas sujet au mÃªme rÃ©gime:
-son emploi de Â«naÃ®treÂ» et Â«mourirÂ» reste dans les seuil de banalitÃ© hors de la
+son emploi de Â«naÃ®treÂ» et Â«mourirÂ» reste dans les seuils de banalitÃ© hors de la
 *GÃ©ographie* et mÃªme trÃ¨s lÃ©gÃ¨rement positif alors qu'il reste nÃ©gatif sur les
 articles de cet auteur sur le mÃªme domaine (le lemme Â«naÃ®treÂ» y est mÃªme assez
 rare avec une spÃ©cificitÃ© de -4.6). Diderot apparaÃ®t donc plus constant dans son
@@ -348,7 +350,7 @@ biographiques en *GÃ©ographie* mais, ce faisant, a aussi mis en lumiÃ¨re l'emplo
 de verbes associÃ©s Ã  ces contenus dans d'autres domaines. C'est ainsi que la
 figure \ref{fig:naitre_mourir_edda} prÃ©sentait les *Beaux-arts* et surtout la
 *Philosophie* comme des pistes intÃ©ressantes pour la recherche de biographies.
-MalgrÃ© le choix Ã©ditorial de ne pas mettre en avant de figure individuelles, le
+MalgrÃ© le choix Ã©ditorial de ne pas mettre en avant de figures individuelles, le
 Discours PrÃ©liminaire de l'*EDdA* (L'EncyclopÃ©die, T1, p.xlj) fait en effet
 mention de nombre de Â«gÃ©niesÂ» qui ont faÃ§onnÃ© les domaines oÃ¹ ils se sont
 illustrÃ©s. L'attention particuliÃ¨re qui leur est portÃ©e dans ce Discours
@@ -363,7 +365,7 @@ philosophie de Locke et, sur toute sa premiÃ¨re moitiÃ©, donne un rÃ©cit de la v
 du philosophe de sa naissance Ã  sa mort, riche en dates, lieux et mentions
 d'autres personnages historiques qui lui sont liÃ©s. Il apparaÃ®t tout Ã  fait
 comparable Ã  l'article WOLSTROPE qui, bien que trois fois plus long environ
-(7277 mots contre 2659) contient lui aussi environ une moitiÃ© d'Ã©lÃ©ments
+(7â€¯277 mots contre 2â€¯659) contient lui aussi environ une moitiÃ© d'Ã©lÃ©ments
 biographiques, le reste de l'article concernant directement les travaux de
 Newton, ses thÃ©ories et jusqu'Ã  l'exposition des travaux de ses prÃ©curseurs
 comme le paragraphe sur les lois de Kepler.
@@ -440,7 +442,7 @@ les philosophes, sa biographie est Â«dÃ©guisÃ©eÂ» en article de GÃ©ographie.
     de l'*EDdA* surtout quand il y a des diacritiques
 
 Pour Boyle et Huyghens, les articles avec le plus grand nombre d'occurrences de
-leur noms sont purement techniques et portent exclusivement sur leurs
+leurs noms sont purement techniques et portent exclusivement sur leurs
 thÃ©matiques de recherches, respectivement la ChimieÂ â€”â€¯AIR (L'EncyclopÃ©die, T1,
 p.225) et CHYMIE (L'EncyclopÃ©die, T3, p.408)â€¯â€”Â et la Physique et les
 MathÃ©matiquesÂ â€”â€¯Â«Figure de la TerreÂ» (L'EncyclopÃ©die, T6, p.749), CYCLOIDE
@@ -501,7 +503,7 @@ physiqueÂ», Â«corps cÃ©lesteÂ», Â«corps pesansÂ» (sic). Ces diffÃ©rences sont
 particuliÃ¨rement visibles sur le diagramme d'[@=AFC] de la figure
 \ref{fig:newton_vs_philosophers} reprÃ©sentant les 65 lemmes les plus frÃ©quents
 parmi les textes de doctrines philosophiques (ceux du tableau
-\ref{table:edda_biographies_in_philosophy}, le nuage de point rouge sur la
+\ref{table:edda_biographies_in_philosophy}, le nuage de points rouges sur la
 figure) auxquels est rajoutÃ© NEWTONIANISME (le point `EDdA_11_679` trÃ¨s
 nettement Ã  part sur la figure). Newton est donc mis au mÃªme niveau que les
 grands philosophes alors que le contenu de ses travaux est tout Ã  fait
@@ -516,7 +518,7 @@ nous se dÃ©clarer ouvertement NewtonienÂ» ?
 
 ![Analyse Factorielle des Correspondances pour les articles de systÃ¨mes philosophiques dans l'*EDdA*, y compris NEWTONIANISME](figure/textometry/newton_vs_philosophers.png){#fig:newton_vs_philosophers}
 
-### Deux critÃ¨res utiles
+### DiffÃ©rents profils de passages biographiques
 
 #### Proportion de contenu biographique
 
@@ -526,8 +528,8 @@ pas le moindre effort pour dÃ©guiser sa biographie: le bourg n'est citÃ© qu'en
 relation Ã  Isaac Newton dÃ¨s la premiÃ¨re phrase et les deux seules informations,
 lapidaires, que l'on pourrait qualifier de gÃ©ographiques Ã  son propos tiennent
 dans les huit premiers mots, en un syntagme nominal et un complÃ©ment
-circonstanciel: Â«bourg d'Angleterre, dans le comtÃ© de LincolnÂ».  Aucunes
-coordonnÃ©es, aucune distance ni mÃªme direction Ã  partir d'une autre ville ou
+circonstanciel: Â«bourg d'Angleterre, dans le comtÃ© de LincolnÂ».  Aucune
+coordonnÃ©e, aucune distance ni mÃªme direction Ã  partir d'une autre ville ou
 point remarquable du territoire anglais.
 
 Mais la situation est quand mÃªme toute autre avec l'article LODEVE
@@ -576,7 +578,7 @@ ainsi par exemple l'article \textsc{FertÃ©-Milon} (L'EncyclopÃ©die, T6, p.556) q
 est en fait le lieu de naissance de l'auteur Racine (figure
 \ref{fig:edda_ferte_milon}). En plus de faire Ã©trangement Ã©cho Ã  la remarque
 ci-dessus sur la prÃ©dominance de la PhilosophieÂ â€”â€¯on reproche quand mÃªme Ã 
-demi-mot Ã  Racine de n'avoir Ã©tÃ© Â«queÂ» poÃªte et pas philosopheâ€¯â€”Â l'article trÃ¨s
+demi-mot Ã  Racine de n'avoir Ã©tÃ© Â«queÂ» poÃ¨te et pas philosopheâ€¯â€”Â l'article trÃ¨s
 bref signÃ© par Jaucourt pose un dÃ©fi d'interprÃ©tation. En effet, l'auteur semble
 dire que le seul intÃ©rÃªt de la villeÂ â€”â€¯et par lÃ  mÃªme de l'articleâ€¯â€”Â rÃ©side dans
 la mention de Racine (Â«uniquement remarquable parÂ»). Mais il est dit bien peu
@@ -638,7 +640,7 @@ vraie biographie est Ã  l'article LÃ‰IBNITZIANISME, est mentionnÃ© dans l'articl
 LEIPSIC, en mÃªme temps qu'une remarque Ã©clairante sur la motivation profonde de
 ces biographies: Â«Leibnitz seul auroit suffi pour donner du relief Ã  Leipsic sa
 patrieÂ». Ces Ã©numÃ©rations sont lÃ  pour l'anecdote, elles ornent, donnent
-davantage d'intÃ©rÃªt aux lieux traitÃ©s. En cela elle font partie du discours
+davantage d'intÃ©rÃªt aux lieux traitÃ©s. En cela elles font partie du discours
 gÃ©ographique de l'Ã©poque.
 
 Toutes ces remarques convergent donc pour dÃ©gager un dernier critÃ¨re Ã  appliquer
diff --git a/Contrastes/Contours.md b/Contrastes/Contours.md
index 47ee8d2..86847c0 100644
--- a/Contrastes/Contours.md
+++ b/Contrastes/Contours.md
@@ -37,12 +37,12 @@ locuteurs change suivant les Ã©poques des parties du corpus. Si le franÃ§ais
 classique de l'*EDdA* diffÃ¨re heureusement assez peu de celui dÃ©jÃ  quasi
 contemporain de *LGE*, on y trouve encore tout de mÃªme des formes similaires Ã 
 celles rapportÃ©es par @diwersy_ressources_2017 [p.29]. Ainsi, l'adverbe Â«trÃ¨sÂ»
-demeure prÃ©fixÃ© Ã  de nombreux adjectifs, bien que sÃ©parÃ©s d'un tiret[^tiret]
-dans des formes comme Â«trÃ¨s-subtilÂ» Ã  l'article MALEBRANCHISME (L'EncyclopÃ©die,
-T9, p.942) ou Â«trÃ¨s-philosophiqueÂ» dans l'article DICTIONNAIRE (L'EncyclopÃ©die,
-T4, p.958) citÃ© Ã  la section \ref{dalembert_dictionnaire}
+demeure prÃ©fixÃ© Ã  de nombreux adjectifs, bien que sÃ©parÃ© d'un tiret[^tiret] dans
+des formes comme Â«trÃ¨s-subtilÂ» Ã  l'article MALEBRANCHISME (L'EncyclopÃ©die, T9,
+p.942) ou Â«trÃ¨s-philosophiqueÂ» dans l'article DICTIONNAIRE (L'EncyclopÃ©die, T4,
+p.958) citÃ© Ã  la section \ref{dalembert_dictionnaire}
 (p.\pageref{dalembert_dictionnaire}). Ã€ l'inverse certaines formes ne sont pas
-encore agglutinÃ©es telles que Â«par ce queÂ» dans l'article ATTAQUES *d'une place*
+encore agglutinÃ©es telles que Â«par ce queÂ» dans l'entrÃ©e ATTAQUES *d'une place*
 (L'EncyclopÃ©die, T1, p.829).
 
 [^tiret]: en moyen franÃ§ais on trouve des formes simplement agglutinÃ©es comme
@@ -61,7 +61,7 @@ peu aprÃ¨s dans le texte est Ã©tiquetÃ©e en tant que nom commun), et ne reconna
 pas Â«parce queÂ», considÃ©rant la sÃ©quence Â«par ce queÂ» comme trois tokens
 distincts. Le seul choix restant Ã  l'issue des traitements concerne les
 amalgames, reprÃ©sentÃ©s Ã  l'aide de sous-tokens disponibles dans le format
-CoNLL-U. Ã€ la suite de [@vigier_autour_2017, p.101], un seul token a Ã©tÃ© produit
+CoNLL-U. Ã€ la suite de @vigier_autour_2017 [p.101], un seul token a Ã©tÃ© produit
 pour les reprÃ©senter dans des outils permettant des recherches en surface comme
 TXM. Les [@=POS] et lemmes affectÃ©s Ã  ces tokens sont obtenus en concatÃ©nant les
 [@=POS] et les lemmes de leurs sous-tokens, sÃ©parÃ©s par un caractÃ¨re '+'. C'est
@@ -118,19 +118,19 @@ La chose la plus Ã©vidente lorsque l'on compare la figure
 domaine dans l'*EDdA* avec celui reprÃ©sentant le nombre d'articles pour la mÃªme
 [@=partition] \(figure \ref{fig:edda_count_by_domain_repartition}
 p.\pageref{fig:edda_count_by_domain_repartition}) est la faible importance
-relative des articles de gÃ©ographie en terme de taille. En nombre d'articles, la
-*GÃ©ographie* est trÃ¨s nettement le domaine le plus reprÃ©sentÃ© avec plus de 20%
-des articles de l'*EDdA* qui lui sont consacrÃ©s, soit presque deux fois plus
+relative des articles de gÃ©ographie en termes de taille. En nombre d'articles,
+la *GÃ©ographie* est trÃ¨s nettement le domaine le plus reprÃ©sentÃ© avec plus de
+20% des articles de l'*EDdA* qui lui sont consacrÃ©s, soit presque deux fois plus
 d'articles que le deuxiÃ¨me domaine le plus reprÃ©sentÃ©, *Droit et Jurisprudence*.
-MalgrÃ© cette trÃ¨s forte prÃ©sence, ses articles ne reprÃ©sentent plus que 9.3% en
-nombre de mots, ce qui n'en fait que le 4^Ã¨me^ domaine le plus volumineux, avec
-de surcroÃ®t un nombre de mots assez voisin de celui des 5^Ã¨me^ et 6^Ã¨me^
-domaines selon le mÃªme critÃ¨re (respectivement *Physique* et *Droit et
-Jurisprudence*). Il est mÃªme remarquable que la *GÃ©ographie* soit couverte en
-moins de mots que la *Philosophie*, Ã  laquelle ne sont consacrÃ©s que 5.47% des
-articles, soit prÃ¨s de 4 fois moins qu'Ã  la *GÃ©ographie*. Les articles de
-gÃ©ographie apparaissent donc comme particuliÃ¨rement brefs par rapport Ã  ceux des
-autres domaines de connaissance.
+MalgrÃ© cette trÃ¨s forte prÃ©sence, ses articles ne contiennent que 9.3% du nombre
+de mots, ce qui n'en fait que le 4^Ã¨me^ domaine le plus volumineux, avec de
+surcroÃ®t un nombre de mots assez voisin de celui des 5^Ã¨me^ et 6^Ã¨me^ domaines
+selon le mÃªme critÃ¨re (respectivement *Physique* et *Droit et Jurisprudence*).
+Il est mÃªme remarquable que la *GÃ©ographie* soit couverte en moins de mots que
+la *Philosophie*, Ã  laquelle ne sont consacrÃ©s que 5.47% des articles, soit prÃ¨s
+de 4 fois moins qu'Ã  la *GÃ©ographie*. Les articles de gÃ©ographie apparaissent
+donc comme particuliÃ¨rement brefs par rapport Ã  ceux des autres domaines de
+connaissance.
 
 \begin{figure}[h!]
     \centering
@@ -163,28 +163,29 @@ prÃ©sente une forme assez particuliÃ¨re, directement dÃ©croissante (une Â«mineÂ»
 gigantesque sans Â«corpsÂ»). La pente de dÃ©croissance est plus ou moins visible
 selon les domaines mais la plupart prÃ©sentent au moins cet effet de rupture de
 pente (la Â«mineÂ» dans la mÃ©taphore prÃ©cÃ©dente), par exemple les domaines
-*Histoire* et *Militaire*. Seul le domaine *MÃ©tier* semble comme la *GÃ©ographie*
-dÃ©croÃ®tre constamment, mais sa pente est tout de mÃªme moins forte que celle de
-la *GÃ©ographie* et il possÃ¨de bien plus d'articles avec un nombre Ã©levÃ© de mot
-(la diffÃ©rence devient flagrante au-dessus de quelques centaines de mots). La
-figure \ref{fig:edda_words_by_domain_distribution} montre la rarÃ©faction des
-articles de *GÃ©ographie* en raison logarithmique de leur taille (la mine prÃ©sente
-des bords bien droits caractÃ©ristiques d'une relation linÃ©aire). Il y a environ
-10 fois moins d'articles de *GÃ©ographie* de longueur 100 que de longueur 10.
+*Histoire* et *Militaire*. Seul le domaine *MÃ©tiers* semble comme la
+*GÃ©ographie* dÃ©croÃ®tre constamment, mais sa pente est tout de mÃªme moins forte
+que celle de la *GÃ©ographie* et il possÃ¨de bien plus d'articles avec un nombre
+Ã©levÃ© de mots (la diffÃ©rence devient flagrante au-dessus de quelques centaines
+de mots). La figure \ref{fig:edda_words_by_domain_distribution} montre la
+rarÃ©faction des articles de *GÃ©ographie* en raison logarithmique de leur taille
+(la mine prÃ©sente des bords bien droits caractÃ©ristiques d'une relation
+linÃ©aire). La diffÃ©rence de densitÃ© entre les articles de 100 mots et ceux de 10
+mots est par exemple sensiblement la mÃªme qu'entre les articles de 1Â 000 mots et
+ceux de 100 mots.
 
 ![Distribution des nombres de mots par article au sein des diffÃ©rents domaines de l'*EDdA*](figure/distribution/GEODE/EDdA/words_by_domain.png){#fig:edda_words_by_domain_distribution}
 
 Il est naturel aprÃ¨s avoir fait cette remarque de se demander si cette signature
-particuliÃ¨re persiste 130 ans plus tard. La taille de la *GÃ©ographie*, dans
-*LGE* aussi, est bien moins importante en nombre de mots qu'en nombre
-d'articles. Elle reprÃ©sente en effet une part encore plus importante du nombre
-d'articles (37.8% soit plus d'un tiers alors qu'elle ne reprÃ©sentait Â«queÂ»
-20.74% des articles de l'*EDdA*), mais cette fois encore cela ne suffit pas Ã  en
-faire le domaine le plus volumineux: malgrÃ© cette surreprÃ©sentation accrue la
-*GÃ©ographie* n'arrive qu'Ã  la deuxiÃ¨me place des disciplines occupant le plus de
-mots en comprenant Â«seulementÂ» 22.87% du texte. LÃ  encore, les articles de
-*GÃ©ographie* apparaissent donc relativement brefs par rapport Ã  ceux des autres
-disciplines.
+particuliÃ¨re persiste 130 ans plus tard. La taille de la *GÃ©ographie* dans *LGE*
+aussi est bien moins importante en nombre de mots qu'en nombre d'articles. Elle
+reprÃ©sente en effet une part encore plus importante du nombre d'articles (37.8%
+soit plus d'un tiers alors qu'elle ne reprÃ©sentait Â«queÂ» 20.74% des articles de
+l'*EDdA*), mais cette fois encore cela ne suffit pas Ã  en faire le domaine le
+plus volumineux: malgrÃ© cette surreprÃ©sentation accrue, la *GÃ©ographie* n'arrive
+qu'Ã  la deuxiÃ¨me place des disciplines occupant le plus de mots en comprenant
+Â«seulementÂ» 22.87% du texte. LÃ  encore, les articles de *GÃ©ographie*
+apparaissent donc relativement brefs par rapport Ã  ceux des autres disciplines.
 
 Il faut toutefois remarquer que les proportions d'articles classÃ©s en *Histoire*
 et en *GÃ©ographie* semblent en contradiction avec les intentions des auteurs de
@@ -211,7 +212,7 @@ vraisemblable pourrait rÃ©sider dans la difficultÃ© Ã  dÃ©cider Ã  l'avance avec
 assez de prÃ©cision du contenu d'une Å“uvre aussi vaste qu'une encyclopÃ©die,
 impliquant autant de contributeurs sur une pÃ©riode aussi longue. D'ailleurs, le
 mÃªme Avant-Propos annonce 25 tomes de 1200 pages chacun, quand on sait qu'il y
-en a eu finalement 31 au total, dont le dernier dÃ©passe allÃ¨grement les 1300
+en a eu finalement 31 au total, dont le dernier dÃ©passe allÃ¨grement les 1â€¯300
 pages. Mais lÃ  encore, mÃªme si l'*Histoire et GÃ©ographie* Ã©tait effectivement
 prÃ©vue pour Ãªtre la science occupant le plus de place dans *LGE*, on a peine Ã 
 croire qu'elle ait pu plus que tripler de volume sous les plumes de ses
@@ -323,7 +324,7 @@ l'hypothÃ¨se de l'apparition dans ce domaine d'un grand nombre de termes
 techniques beaucoup plus longs Ã  mÃªme de contrebalancer cet effet, ce qui
 corrobore Ã©galement l'hypothÃ¨se de sa disciplinarisation.
 
-#### Annotation gÃ©o-sÃ©mantiques {#sec:geo_named_entities}
+#### Annotations gÃ©o-sÃ©mantiques {#sec:geo_named_entities}
 
 Intuitivement, la GÃ©ographie en tant que science descriptive de l'espace
 terrestre renvoie Ã  la notion de lieu et en particulier de lieu nommÃ©. Le
@@ -342,7 +343,7 @@ suivant une typologie prÃ©Ã©tablie en relation avec l'usage que l'on souhaite
 faire du document; de les rattacher sans ambiguÃ¯tÃ© Ã  des entrÃ©es prÃ©sentes dans
 des bases de connaissance et enfin de dÃ©couvrir les relations qu'elles
 entretiennent [@ehrmann_named_2016, p.3350]. Si elles semblent inclure dÃ¨s le
-dÃ©but les expressions numÃ©riques comme les dates ou les quantitÃ©s pourvu d'une
+dÃ©but les expressions numÃ©riques comme les dates ou les quantitÃ©s pourvues d'une
 unitÃ© [@sekine_extended_2002], la dÃ©finition et l'organisation de classes assez
 complÃ¨tes fait l'objet de travaux consÃ©quents qui aboutissent Ã  la publication
 de jeux d'Ã©tiquettes complexes [@sekine_definition_2004] jusqu'Ã  des schÃ©mas
@@ -360,7 +361,7 @@ le contexte prÃ©cis de ce corpus d'Ã©tude Ã  la diffÃ©rence significative entre
 termes comme Â«paroisseÂ» et Â«communeÂ». C'est pourquoi une annotation
 gÃ©o-sÃ©mantique riche a Ã©tÃ© retenue plutÃ´t qu'une annotation en entitÃ©s nommÃ©es
 classiques pour examiner lâ€™hypothÃ¨se formulÃ©e au dÃ©but de cette sous-section. Le
-corpus a Ã©tÃ© annotÃ© avec un modÃ¨le spaCy spancat personnalisÃ©[^modÃ¨le]
+corpus a Ã©tÃ© annotÃ© avec un modÃ¨le SpaCy spancat personnalisÃ©[^modÃ¨le]
 [@moncla_spacy_2024]. Ce modÃ¨le a pour tÃ¢che de catÃ©goriser les entitÃ©s ou spans
 (ensemble de tokens) avec imbrications possibles selon une version simplifiÃ©e du
 schÃ©ma dâ€™annotation dÃ©crit dans @moncla_multilayer_2015. Le schÃ©ma retenu pour
@@ -532,7 +533,7 @@ niveaux). L'`ENE-Spatial` la plus profonde trouvÃ©e dans *LGE* a ainsi une
 profondeur de quatre lÃ  oÃ¹ la profondeur maximale dans l'*EDdA* s'Ã©levait Ã 
 sept. La trÃ¨s grande majoritÃ© des ENE trouvÃ©es sont trÃ¨s plates et la profondeur
 moyenne dans ces encyclopÃ©dies est de l'ordre de grandeur de $10^{-2}$ mais
-celle hors de la classe *GÃ©ographie* dans l'*EDdA* est de $8\times10^{3}$ alors
+celle hors de la classe *GÃ©ographie* dans l'*EDdA* est de $8\times10^{-3}$ alors
 qu'elle s'Ã©lÃ¨ve Ã  $1\times10^{-1}$ en *GÃ©ographie*; dans *LGE*, la profondeur
 moyenne hors *GÃ©ographie* est de $4\times10^{-3}$ contre $9\times10^{-3}$. Les
 articles de *GÃ©ographie* dans *LGE* sont donc non seulement moins denses en
@@ -586,7 +587,7 @@ l'Ã©tymologie complÃ©tÃ©e de critÃ¨res sÃ©mantiques lorsqu'une Ã©volution forte
 encyclopÃ©dies est absent dans l'autre. Toute la difficultÃ© de constitution de ce
 sous-corpus, nommÃ© Â«ParallÃ¨leÂ» et notÃ© $\mathcal{P}$ dans ce qui suit, rÃ©side
 dans ce problÃ¨me de bon appariementÂ â€”â€¯distinguer les *vraies* paires des
-*fausses* sources de bruit dans le corpus. Par construction, $\mathcal{P}$
+*fausses*, sources de bruit dans le corpus. Par construction, $\mathcal{P}$
 comprend un nombre pair d'articles, autant de l'*EDdA* que de *LGE* puisqu'il
 est obtenu en sÃ©lectionnant des couples d'articles. Les figures
 \ref{fig:adige_edda} et \ref{fig:adige_lge} prÃ©sentent un exemple de paire issue
@@ -653,7 +654,7 @@ l'*EDdA* et *LGE* comme s'il avait une qualitÃ© particuliÃ¨re qui ne tiendrait p
 aux hasards Ã©ditoriaux des deux entreprises. En pratique, cet ensemble peut Ãªtre
 remplacÃ© par n'importe lequel de ses sous-ensembles pourvu qu'il soit assez
 large pour Ãªtre reprÃ©sentatif. Mais surtout, imposer des restrictions trop
-strictes sur le contenu des articles empÃªcherait d'observer des changements
+sÃ©vÃ¨res sur le contenu des articles empÃªcherait d'observer des changements
 majeurs dans la maniÃ¨re dont un mÃªme objet serait traitÃ© entre l'*EDdA* et
 *LGE*, par exemple un territoire qui changerait de pays et ne serait donc plus
 dÃ©crit en rapport aux mÃªmes entitÃ©s administratives comme ce fut le cas de
@@ -661,7 +662,7 @@ l'Alsace entre le milieu du XVIII^Ã¨me^ siÃ¨cle et la fin du XIX^Ã¨me^ siÃ¨cle,
 une Ã©volution scientifique et technique qui ferait qu'on ne parle plus du tout
 d'un mÃªme sujet avec les mÃªmes termes. L'article SAVONE est particuliÃ¨rement
 intÃ©ressant pour cette raison. D'un descriptif des ordres religieux de la ville,
-de son commerce moribond et de ses liens avec des autres villes, italiennes
+de son commerce moribond et de ses liens avec d'autres villes, italiennes
 exclusivement, qui est suivi d'une biographie du pape Jules II dans l'*EDdA*
 (L'EncyclopÃ©die, T14, p.722), la ville paraÃ®t transformÃ©e dans *LGE* (La Grande
 EncyclopÃ©die, T29, p.624), l'article bien plus bref insiste sur la force de son
@@ -750,26 +751,26 @@ formule prÃ©cÃ©dente).
 
 ![Nombre total de comparaisons requis dans le pire des cas en fonction de la taille de la fenÃªtre utilisÃ©e](figure/dichotomy_window_comparisons.png){#fig:dichotomy_window_comparisons width=60%}
 
-Au milieu des paires candidates classÃ©es par similaritÃ©, entre les rangs 2931 et
-2940 on trouve une unique fausse paire, celle pour SPIEGELBERGÂ â€”â€¯une contrÃ©e
+Au milieu des paires candidates classÃ©es par similaritÃ©, entre les rangs 2â€¯931
+et 2â€¯940 on trouve une unique fausse paire, celle pour SPIEGELBERGÂ â€”â€¯une contrÃ©e
 allemande (L'EncyclopÃ©die, T15, p.461) et un gynÃ©cologue (La Grande
 EncyclopÃ©die, T30, p.388). Toutes les autres sont au moins en lien, l'acception
 moderne contenant l'acception ancienne comme c'est le cas pour BARRAGE oÃ¹ *LGE*
 contient une sous-section sur son acception commerciale dans l'ancien rÃ©gime (La
 Grande EncyclopÃ©die, T5, p.469) qui est la seule dÃ©finie dans l'*EDdA*
-(L'EncyclopÃ©die, T2, p.90) qui a Ã©tÃ© Ã©crit Ã  cette Ã©poque. Le taux de similaritÃ©
-rapportÃ© avec la mesure choisie est supÃ©rieur Ã  56.9% (valeur pour la 2931^Ã¨me^
-paire). On rÃ©itÃ¨re donc le procÃ©dÃ© entre les rangs 1461 et 1470 qui ont une
-similaritÃ© cosinus d'au moins 42% et contiennent au moins deux fausses paires.
-Puisqu'ils contiennent trop de bruit, on remonte donc le seuil en allant entre
-les rangs 2â€¯194 et 2â€¯203 (similaritÃ© > 50.3%) qui eux ne contiennent qu'une fausse
-paire et ainsi de suite. Le processus se poursuit jusqu'Ã  ce que deux fenÃªtres
-se rejoignent ce qui arrive comme prÃ©vu Ã  la dixiÃ¨me Ã©tape. On passe alors
-toutes les fausses paires jusqu'Ã  la premiÃ¨re vraie (pour ne pas ajouter
-dÃ©libÃ©rÃ©ment des paires que l'on sait fausses Ã  $\mathcal{P}$), celle de rang
-2â€¯167 qui avait obtenu un score de similaritÃ© de 50.0%. On les retient toutes
-depuis celle-ci jusqu'Ã  la fin de la liste, ce qui donne $5872 - 2167 + 1 =
-3706$ paires d'articles. Il est Ã  noter qu'au cours du processus, une autre
+(L'EncyclopÃ©die, T2, p.90) qui a Ã©tÃ© Ã©crite Ã  cette Ã©poque. Le taux de
+similaritÃ© rapportÃ© avec la mesure choisie est supÃ©rieur Ã  56.9% (valeur pour la
+2â€¯931^Ã¨me^ paire). On rÃ©itÃ¨re donc le procÃ©dÃ© entre les rangs 1â€¯461 et 1â€¯470 qui
+ont une similaritÃ© cosinus d'au moins 42% et contiennent au moins deux fausses
+paires. Puisqu'ils contiennent trop de bruit, on remonte donc le seuil en allant
+entre les rangs 2â€¯194 et 2â€¯203 (similaritÃ© > 50.3%) qui eux ne contiennent
+qu'une fausse paire et ainsi de suite. Le processus se poursuit jusqu'Ã  ce que
+deux fenÃªtres se rejoignent ce qui arrive comme prÃ©vu Ã  la dixiÃ¨me Ã©tape. On
+passe alors toutes les fausses paires jusqu'Ã  la premiÃ¨re vraie (pour ne pas
+ajouter dÃ©libÃ©rÃ©ment des paires que l'on sait fausses Ã  $\mathcal{P}$), celle de
+rang 2â€¯167 qui avait obtenu un score de similaritÃ© de 50.0%. On les retient
+toutes depuis celle-ci jusqu'Ã  la fin de la liste, ce qui donne $5872 - 2167 + 1
+= 3706$ paires d'articles. Il est Ã  noter qu'au cours du processus, une autre
 sÃ©rie de 10 paires sans aucune homonymie a Ã©tÃ© trouvÃ©e entre les rangs 2â€¯171 et
 2â€¯180. Ce contre-exemple Ã  l'hypothÃ¨se de monotonie de la qualitÃ© en fonction du
 score est toutefois rassurant sur la qualitÃ© des rangs sÃ©lectionnÃ©s et la
@@ -788,8 +789,8 @@ fenÃªtres ont Ã©tÃ© considÃ©rÃ©es en fonction des rÃ©sultats de l'Ã©valuation de
 autres dÃ©jÃ  validÃ©es. Il est donc nÃ©cessaire de prÃ©lever un nouvel Ã©chantillon
 pour vÃ©rifier si la qualitÃ© a une chance d'Ãªtre proche des 90% espÃ©rÃ©s
 initialement. Comme cette fois les $n$ paires prÃ©levÃ©es sont indÃ©pendantes, et
-qu'on Ã©value sur chacune une propriÃ©tÃ© boolÃ©enne (elles peuvent Ãªtre soit vraies
-soit fausses), elles constituent elles aussi des variables alÃ©atoires de
+puisqu'on Ã©value sur chacune une propriÃ©tÃ© boolÃ©enne (elles peuvent Ãªtre soit
+vraies soit fausses), elles constituent elles aussi des variables alÃ©atoires de
 Bernoulli, comme c'Ã©tait le cas pour les articles de *LGE* Ã©tiquetÃ©s en domaine
 par le modÃ¨le *BERT* et dont il s'agissait de contrÃ´ler la qualitÃ© Ã  la section
 \ref{sec:classifying_lge} page \pageref{bernouilli_experiment}. Le mÃªme cadre
@@ -797,7 +798,7 @@ thÃ©orique s'applique donc et un raisonnement tout Ã  fait semblable peut se
 dÃ©velopper. Le ThÃ©orÃ¨me Central Limite peut Ã  nouveau s'appliquer Ã  condition
 que la taille de l'Ã©chantillon reste suffisamment faible devant celle de
 l'ensemble de la population: le rapport de 100 considÃ©rÃ© comme suffisant impose
-donc que l'Ã©chantillon comporte moins de $5873/100 < 59$ paires. Ã€ cette
+donc que l'Ã©chantillon comporte moins de $3706/100 = 37.06$ paires. Ã€ cette
 condition, il est Ã  nouveau possible d'utiliser la loi normale pour modÃ©liser le
 comportement de ces variables.
 
@@ -813,8 +814,9 @@ la section \ref{sec:classifying_lge}, on utilise la moyenne empirique pour
 estimer la qualitÃ© $q$ dans $\mathcal{P}$ valant $m = \frac{48}{50} = 0.96$.
 L'application numÃ©rique \ref{eq:parallel_corpus_quality_range_numerical} de la
 borne infÃ©rieure de la formule \ref{eq:quality_range_algebraic}
-p.\ref{eq:quality_range_algebraic} permet d'affirmer avec moins de 5% de risque
-d'erreur que la qualitÃ© rÃ©elle dans le sous-corpus ParallÃ¨le est d'au moins
+p.\pageref{eq:quality_range_algebraic} permet d'affirmer avec moins de 5% de
+risque d'erreur que la qualitÃ© rÃ©elle dans le sous-corpus ParallÃ¨le est d'au
+moins
 
 \begin{equation}
     m - z_{97.5\%} \times \sqrt{\frac{m \times (1- m)}{n}} = 90.6\%
@@ -966,7 +968,7 @@ sur des lieux et des peuples historiques voire imaginaires relÃ¨ve dans ses page
 de la *GÃ©ographie*, comme l'illustrent les articles HYPERBORÃ‰ENS
 (L'EncyclopÃ©die, T8, p.405), JUTURNA (L'EncyclopÃ©die, T9, p.102) ou OGYGIE
 (L'EncyclopÃ©die, T11, p.429) reproduit Ã  la figure \ref{fig:ogygie_edda}. Les
-articles correspondant dans *LGE* (La Grande EncyclopÃ©die, respectivement T20
+articles correspondants dans *LGE* (La Grande EncyclopÃ©die, respectivement T20
 p.481, T21 p.362 et T25 p.298 visible Ã  la figure \ref{fig:ogygie_lge})
 conservent un contenu proche et se retrouvent donc classÃ©s en *Histoire* ou en
 *Histoire Naturelle*. Ã€ l'inverse, des articles comme ERYMANTHE (La Grande
@@ -981,10 +983,10 @@ dÃ©signant. Ainsi le traitement des entrÃ©es CLAIRETS (L'EncyclopÃ©die, T3, p.50
 et La Grande EncyclopÃ©die, T11, p.528) et STONEHENGE (L'EncyclopÃ©die, T15, p.535
 et La Grande EncyclopÃ©die, T30, p.520) est assez proche et, d'un point de vue
 moderne bien plus historique que gÃ©ographique dans les deux Å“uvres. Les deux
-articles dans l'*EDdA* sont pourvus de dÃ©signants qui les classent en
-*Histoire* mais le modÃ¨le, trop entraÃ®nÃ© Ã  voir cette sorte de contenu
-historique dans des articles de *GÃ©ographie* a tout de mÃªme prÃ©dit cette classe
-sur leurs successeurs dans *LGE*.
+articles dans l'*EDdA* sont pourvus de dÃ©signants qui les classent en *Histoire*
+mais le modÃ¨le, trop entraÃ®nÃ© Ã  voir cette sorte de contenu historique dans des
+articles de *GÃ©ographie* a tout de mÃªme prÃ©dit cette classe sur leurs
+successeurs dans *LGE*.
 
 \begin{figure}[h!]
     \centering
@@ -1022,22 +1024,22 @@ la paire VILLEPREUX (L'EncyclopÃ©die, T17, p.282 et La Grande EncyclopÃ©die, T31
 p.1007), visible Ã  la figure \ref{fig:villepreux_pair}, deux entrÃ©es trÃ¨s
 simples et Â«clairementÂ» gÃ©ographiques pour le lectorat contemporain. Le modÃ¨le
 Ã©choue pourtant Ã  reconnaÃ®tre le domaine dans la moitiÃ© issue de *LGE*, sans
-doute Ã  cause de la prÃ©sence d'Ã©lÃ©ments anachroniques pour l'*EDdA* oÃ¹ il a Ã©tÃ©
-entraÃ®nÃ© comme Â«chem. de ferÂ» ou l'adjectif Â«professionnelleÂ» qui n'est attestÃ©
-qu'Ã  partir de 1842\. Il est intÃ©ressant de remarquer que cet article dÃ©bute par
-le motif des communes identifiÃ© Ã  la section \ref{sec:classifying_lge}
-p.\pageref{lst:com_du_dep_regex}, mais ne fait pas partie des articles
-identifiÃ©s Ã  cause de sa longueur[^longueur], prÃ©cisÃ©ment due Ã  ces phrases
-nominales en fin d'article qui mentionnent des infrastructures prÃ©sentes sur la
-commune. Ces informations supplÃ©mentaires qui font que l'article n'a pas Ã©tÃ©
-repÃ©rÃ© directement comme un article de commune (et n'a donc pas Ã©tÃ© annotÃ©
-*GÃ©ographie*) n'ont pas permis au modÃ¨le d'identifier de la gÃ©ographie car elles
-mentionnent des realias trop diffÃ©rentes de celles existant au XVIII^Ã¨me^
-siÃ¨cle.
+doute Ã  cause de la prÃ©sence d'Ã©lÃ©ments anachroniques pour l'*EDdA* sur laquelle
+il a Ã©tÃ© entraÃ®nÃ© comme Â«chem. de ferÂ» ou l'adjectif Â«professionnelleÂ» qui n'est
+attestÃ© qu'Ã  partir de 1842\. Il est intÃ©ressant de remarquer que cet article
+dÃ©bute par le motif des communes identifiÃ© Ã  la section
+\ref{sec:classifying_lge} p.\pageref{lst:com_du_dep_regex}, mais ne fait pas
+partie des articles identifiÃ©s Ã  cause de sa longueur[^longueur], prÃ©cisÃ©ment
+due Ã  ces phrases nominales en fin d'article qui mentionnent des infrastructures
+prÃ©sentes sur la commune. Ces informations supplÃ©mentaires qui font que
+l'article n'a pas Ã©tÃ© repÃ©rÃ© directement comme un article de commune (et n'a
+donc pas Ã©tÃ© annotÃ© *GÃ©ographie*) n'ont pas permis au modÃ¨le d'identifier de la
+gÃ©ographie car elles mentionnent des realias trop diffÃ©rentes de celles existant
+au XVIII^Ã¨me^ siÃ¨cle.
 
 [^longueur]: pour rappel, un seuil de 50 tokens avait Ã©tÃ© imposÃ© pour diminuer
     les faux-positifs et ne pas risquer d'annoter *GÃ©ographie* trop d'articles
-    simplement amalgamÃ© avec un article bref Ã  cause des problÃ¨mes de
+    simplement amalgamÃ©s avec un article bref Ã  cause des problÃ¨mes de
     segmentation de `soprano` (voir section \ref{sec:corpus_preprocessing_lge}
     p.\pageref{lge_segmentation})
 
@@ -1069,7 +1071,7 @@ classement en *GÃ©ographie* par les Ã©diteurs, l'article correspondant dans *LGE
 (La Grande EncyclopÃ©die, T31, p.1104) en fait une description bien plus
 structurelle, et introduit des termes comme Â«laveÂ», Â«cheminÃ©eÂ», Â«explosionÂ»,
 absents de la prÃ©cÃ©dente ce qui conduit le modÃ¨le Ã  le classer Ã  *Physique*. Les
-trajectoires paires PORPHYRITE (L'EncyclopÃ©die, T13, p.127 et La Grande
+trajectoires des paires PORPHYRITE (L'EncyclopÃ©die, T13, p.127 et La Grande
 EncyclopÃ©die, T27, p.328) et PURBECK (L'EncyclopÃ©die, T13, p.576 et La Grande
 EncyclopÃ©die, T27, p.964) sont assez semblables mais avec la classe *Histoire
 naturelle* et dans deux directions opposÃ©es. L'entrÃ©e PORPHYRITE de l'*EDdA*
@@ -1137,10 +1139,10 @@ sphÃ¨res. Les deux articles sont classÃ©s comme on peut s'y attendre Ã  *Physiqu
 La fin du XIX^Ã¨me^ siÃ¨cle est marquÃ©e par de grandes explorations, entre autres
 vers les pÃ´les qui deviennent peu Ã  peu perceptibles en tant que territoire
 plutÃ´t que comme de simples abstractions gÃ©omÃ©triques[^polaire] ce qui conduit Ã 
-traitement trÃ¨s diffÃ©rent des deux mÃªmes entrÃ©es dans *LGE*. Si ANTARCTIQUE (La
-Grande EncyclopÃ©die, T3, p.135) reste dans une certaine mesure similaire (on y
-parle d'Â«axeÂ», de Â«cercleÂ» et de Â«parallÃ¨leÂ» dans un Â«I. ASTRONOMIEÂ»), il y est
-tout de mÃªme question de Â«rÃ©gionÂ», de Â«mondeÂ», et un Â«II. GÃ©ographieÂ» qui
+un traitement trÃ¨s diffÃ©rent des deux mÃªmes entrÃ©es dans *LGE*. Si ANTARCTIQUE
+(La Grande EncyclopÃ©die, T3, p.135) reste dans une certaine mesure similaire (on
+y parle d'Â«axeÂ», de Â«cercleÂ» et de Â«parallÃ¨leÂ» dans un Â«I. ASTRONOMIEÂ»), il y
+est tout de mÃªme question de Â«rÃ©gionÂ», de Â«mondeÂ», et un Â«II. GÃ©ographieÂ» qui
 consiste en un renvoi vers l'entrÃ©e OCÃ‰AN suffit Ã  ce que le modÃ¨le classe
 l'article Ã  *GÃ©ographie*. La bascule est encore bien plus nette avec l'ARCTIQUE
 (La Grande EncyclopÃ©die, T3, p.774) qui, aprÃ¨s une phrase introductive pour
@@ -1163,22 +1165,23 @@ spÃ©cialiser pour garder ce qui lui est propre.
     ce pÃ´le.
 
 L'approche particuliÃ¨re de cette sous-section, en s'intÃ©ressant Ã  des articles
-prÃ©cis plutÃ´t qu'Ã  des domaines dans leur ensemble a permis de mener une Ã©tudes
+prÃ©cis plutÃ´t qu'Ã  des domaines dans leur ensemble a permis de mener une Ã©tude
 plus qualitative. Les observations qui y ont Ã©tÃ© faites mettent en Ã©vidence des
 diffÃ©rences significatives dans les rÃ´les et les mÃ©thodes de la gÃ©ographie entre
 les articles dans l'*EDdA* et ceux dans *LGE*, dont le contenu s'individualise
 entre les deux Ã©poques par rapport Ã  celui des autres disciplines.
 
-Mise en regard de la sous-section prÃ©cÃ©dente sur la place accordÃ©e aux discours
-gÃ©ographiques, des Ã©volutions subies par la gÃ©ographie commencent Ã  apparaÃ®tre.
-L'intervalle de temps est d'abord marquÃ© par un fort accroissement de la
-volumÃ©trie consacrÃ©e Ã  la classe *GÃ©ographie*, avec un plus grand nombre
-d'articles, dont la plupart restent extrÃªmement brefs mais Ã©galement une
-diversification des profils d'articles avec l'apparition d'articles bien plus
-longs que ceux consacrÃ©s Ã  cette discipline dans l'*EDdA*. ParallÃ¨lement, elle
-se spÃ©cialise et gagne en technicitÃ©, utilisant au passage davantage de mots
-plus longs et structurant les informations au delÃ  de simplement concentrer des
-noms de lieux et de personnes. Elle cÃ¨de par ailleurs Ã  d'autres disciplines des
-thÃ©matiques qui lui revenaient par dÃ©faut et donne bien plus d'informations plus
-dÃ©taillÃ©es sur celles qu'elles conserve.
+En ajoutant les rÃ©sultats de cette sous-section Ã  ceux sur la place accordÃ©e aux
+discours gÃ©ographiques obtenus au dÃ©but de ce chapitre, une dynamique gÃ©nÃ©rale
+commence Ã  apparaÃ®tre dans les Ã©volutions subies par la gÃ©ographie. L'intervalle
+de temps est d'abord marquÃ© par un fort accroissement de la volumÃ©trie consacrÃ©e
+Ã  la classe *GÃ©ographie*, avec un plus grand nombre d'articles, dont la plupart
+restent extrÃªmement brefs mais Ã©galement une diversification des profils
+d'articles avec l'apparition d'articles bien plus longs que ceux consacrÃ©s Ã 
+cette discipline dans l'*EDdA*. ParallÃ¨lement, elle se spÃ©cialise et gagne en
+technicitÃ©, utilisant au passage davantage de mots plus longs et structurant les
+informations au delÃ  de simplement concentrer des noms de lieux et de personnes.
+Elle cÃ¨de par ailleurs Ã  d'autres disciplines des thÃ©matiques qui lui revenaient
+par dÃ©faut et donne bien plus d'informations plus dÃ©taillÃ©es sur celles qu'elle
+conserve.
 
-- 
GitLab