diff --git a/Classification/Introduction.md b/Classification/Introduction.md
index 5357dd3be5dcff0030da88c1ff14fde26461b625..c19c0b0589b2fbb780f4e044fbedbcb8dbd6e14f 100644
--- a/Classification/Introduction.md
+++ b/Classification/Introduction.md
@@ -23,7 +23,7 @@ s'appliquait à la section \ref{sec:EdlA_TAL} de l'état de l'art: devant la
 prédominance de l'emploi des noms anglophones pour les méthodes d'[@=AA], même
 chez des locuteurs français, une exception locale est faite dans toute cette
 section à l'emploi exclusif de termes francophones qui est la règle dans le
-reste de cette thèse. Ce choix se justifie par le soucis de ne pas produire de
+reste de cette thèse. Ce choix se justifie par le souci de ne pas produire de
 formes traduites quelque peu artificielles qui n'auraient de toute façon pas
 cours hors de ces pages.
 
diff --git a/Corpus/Encodage.md b/Corpus/Encodage.md
index da3bc122621329971b42627b583d43f05cf10794..aaf4b35c0b5a5c0f9743f76e4ecef310053e9cb2 100644
--- a/Corpus/Encodage.md
+++ b/Corpus/Encodage.md
@@ -711,7 +711,7 @@ d'encodage.
 
 [^txt]: on trouve aussi du «text brut» sous d'autres formes, par exemple dans
     une cellule d'un fichier tableur, ou dans une valeur au sein d'un fichier
-    JSON; le terme «fichier» (textuel) sera employé par soucis de simplicité
+    JSON; le terme «fichier» (textuel) sera employé par souci de simplicité
     mais les remarques faites dans cette section s'appliquent aussi à ces autres
     méthodes de stockage de texte
 
diff --git a/Introduction/Cadre.md b/Introduction/Cadre.md
index cb417e0f5dc46423dc4234c6bbbb264500f22457..0c06e1517aa198ef9dca97b8b8e8c6ba7ed8e3e0 100644
--- a/Introduction/Cadre.md
+++ b/Introduction/Cadre.md
@@ -109,7 +109,7 @@ en Allemagne ou en Hollande [@todorov_enseigner_2018, ¶¶1 et 9]. Vers la fin d
 XIX^ème^ siècle la Géographie se hisse enfin au rang de véritable discipline
 scientifique grâce à des auteurs comme Vidal de la Blache.
 
-### Des thématiques faites pour l'informatique {.unnumbered .unlisted}
+### Opportunités pour l'informatique {.unnumbered .unlisted}
 
 La conduite d'investigations sur des objets à la fois massifs et historiques
 comme peuvent l'être les œuvres encyclopédiques évoquées soulève cependant un
@@ -139,7 +139,7 @@ intéressantes pour l'informatique elle-même.
 
 La mise à disposition des équipes de grandes quantités de données et parfois de
 logiciels d'analyses en ligne requiert des infrastructures complexes qui
-soulèvent déjà des questions d'ingénieries non triviales liées entre autres au
+soulèvent déjà des questions d'ingénierie non triviales liées entre autres au
 stockage, à la vitesse d'accès aux données ou même à la prise en charge du
 travail collaboratif. Les efforts entrepris sur ces sujets ont donné naissance à
 des organisations comme Ortolang [@pierrel_ortolang_2016] ou Huma-Num
@@ -168,20 +168,20 @@ ruptures technologiques peuvent s'accompagner d'un bouleversement des usages
 le rapport aux objets examinés pour comprendre le sens du résultat d'un calcul,
 comme par exemple une prédiction faite par un classifieur automatique. Cet enjeu
 est en lien avec la visualisation des données, qui peut demander des efforts de
-développements logiciels mais interroge surtout sur l'interprétation pouvant
-être faite des concepts statistiques ou informatiques mobilisés. Enfin, la
-question des chaînes de traitement peut paraître secondaire, ne constituant
-qu'un assemblage «évident» ou même «nécessaire» des outils requis par un projet
-donné mais suscite en réalité de nombreuses réflexions sur les formats des
-données ainsi que sur l'équilibre à trouver entre commodité d'utilisation,
-flexibilité et réutilisabilité des états intermédiaires. Si de très nombreux
-projets en [@=HN] semblent partager une structure commune allant de la
-numérisation de données à l'application d'outils linguistiques automatisés
-[@jentsch_text_2020], la diversité des besoins spécifiques d'analyse ou des
-formats requis en entrée ou en sortie de chaîne pour chaque projet complique en
-réalité le réemploi de chaînes existantes. Quelle que soit la direction
-envisagée, les thématiques d'étude choisies apparaissent donc potentiellement
-fructueuses pour la recherche informatique.
+développement logiciel mais interroge surtout sur l'interprétation pouvant être
+faite des concepts statistiques ou informatiques mobilisés. Enfin, la question
+des chaînes de traitement peut paraître secondaire, ne constituant qu'un
+assemblage «évident» ou même «nécessaire» des outils requis par un projet donné
+mais suscite en réalité de nombreuses réflexions sur les formats des données
+ainsi que sur l'équilibre à trouver entre commodité d'utilisation, flexibilité
+et réutilisabilité des états intermédiaires. Si de très nombreux projets en
+[@=HN] semblent partager une structure commune allant de la numérisation de
+données à l'application d'outils linguistiques automatisés [@jentsch_text_2020],
+la diversité des besoins spécifiques d'analyse ou des formats requis en entrée
+ou en sortie de chaîne pour chaque projet complique en réalité le réemploi de
+chaînes existantes. Quelle que soit la direction envisagée, les thématiques
+d'étude choisies apparaissent donc potentiellement fructueuses pour la recherche
+informatique.
 
 ### Le projet GEODE {.unnumbered .unlisted}
 
diff --git a/Introduction/Enjeu.md b/Introduction/Enjeu.md
index 54fe3ee3940bf86042bb17fa2d7bffde0ccd8736..c1775c936c77bd3ada2770d5cca92ee49877c670 100644
--- a/Introduction/Enjeu.md
+++ b/Introduction/Enjeu.md
@@ -25,9 +25,9 @@ axe est temporel puisqu'il faut comparer les discours du genre encyclopédique 
 deux époques: le XVIII^ème^ d'une part et le tournant des XIX^ème^ et XX^ème^
 siècles d'autre part.
 
-Cette thématique de recherche mobilise plusieurs des apports de l'informatiques
+Cette thématique de recherche mobilise plusieurs des apports de l'informatique
 aux [@=HN]. Il est d'abord nécessaire de déterminer un encodage qui convienne à
-la fois à l'*EDdA* et à *LGE* malgré leur différences, de façon à pouvoir
+la fois à l'*EDdA* et à *LGE* malgré leurs différences, de façon à pouvoir
 regrouper les deux œuvres au sein d'un même corpus et leur appliquer les mêmes
 traitements puis les mêmes analyses. Cette tâche de normalisation, avec celle
 d'organisation des textes et des métadonnées représente un important travail
@@ -66,13 +66,13 @@ francisation d'un mot de la langue parlée dans le pays visité comme PILAU
 
 L'objet qui intéresse fondamentalement cette thèse est bien sûr la Géographie en
 tant que discipline (qu'on distinguera typographiquement en conservant la
-majuscule) mais il ne se réduit pas pas aux discours présents dans une
-encyclopédie. Les présents travaux s'efforcent de s'en rapprocher en étudiant
-ces discours, c'est-à-dire la trace textuelle laissée par la discipline (pour
-laquelle on réservera l'emploi sans marquer l'initiale: «géographie»). De la
-même manière, le terme de «discipline» sera pris dans le sens large de «science»
-alors que l'expression «domaine de connaissance» renverra plus spécifiquement à
-un choix éditorial de découpage dans une encyclopédie particulière.
+majuscule) mais il ne se réduit pas aux discours présents dans une encyclopédie.
+Les présents travaux s'efforcent de s'en rapprocher en étudiant ces discours,
+c'est-à-dire la trace textuelle laissée par la discipline (pour laquelle on
+réservera l'emploi sans marquer l'initiale: «géographie»). De la même manière,
+le terme de «discipline» sera pris dans le sens large de «science» alors que
+l'expression «domaine de connaissance» renverra plus spécifiquement à un choix
+éditorial de découpage dans une encyclopédie particulière.
 
 La situation est tout à fait analogue à celle en traitement du signal d'un
 processus d'échantillonnage par lequel on tente de connaître une fonction
@@ -123,12 +123,12 @@ distinctes aux deux époques. De plus, l'ensemble des catégories selon lesquell
 les articles se répartissent diffère à chaque époque. Cela peut être dû à
 l'apparition d'une discipline entière comme par exemple «Industrie» dans *LGE*
 qui aurait été anachronique dans la deuxième moitié du XVIII^ème^ siècle avant
-la révolution industrielle. Des redécoupages peut également avoir lieu: ainsi,
-là où la *Géographie* se retrouvait dans le «Systême Figuré» des encyclopédistes
-des Lumières aux côté de l'*Uranographie* et de l'*Hydrographie* dans la
-*Cosmographie*, au sein des sciences mathématiques[^uranographie], elle se
-retrouve associée à l'*Histoire* dans l'Avant-Propos de *LGE* qui en dresse le
-projet (La Grande Encyclopédie, T1, p.XI), comme l'illustre la figure
+la révolution industrielle. Des redécoupages peuvent également avoir lieu:
+ainsi, là où la *Géographie* se retrouvait dans le «Systême Figuré» des
+encyclopédistes des Lumières aux côté de l'*Uranographie* et de l'*Hydrographie*
+dans la *Cosmographie*, au sein des sciences mathématiques[^uranographie], elle
+se retrouve associée à l'*Histoire* dans l'Avant-Propos de *LGE* qui en dresse
+le projet (La Grande Encyclopédie, T1, p.XI), comme l'illustre la figure
 \ref{fig:evolution}[^chronologie]. D'ailleurs, si la liste des collaborateurs du
 projet n'associe pas chacun à une discipline précise, il est à noter que sur les
 12 membres dont la qualité contient le mot «géographie», la moitié exactement
diff --git a/Introduction/Plan.md b/Introduction/Plan.md
index 06f25108f644ca5f6b5ccf8d13ac1f01c750c6e1..72a3928c820d8d02703b1d9fdb61063f80c3ed5d 100644
--- a/Introduction/Plan.md
+++ b/Introduction/Plan.md
@@ -26,7 +26,7 @@ utilisées par chacune.
 
 La majeure partie du travail de mise en forme et d'encodage du corpus fait
 l'objet du chapitre \ref{sec:corpus}. La description détaillée des deux œuvres
-étudiées et de la structure des contenus que l'on peut y trouver y est suivie
+étudiées et de la structure des contenus que l'on peut y trouver est suivie
 d'une discussion des efforts entrepris pour représenter le corpus et les
 métadonnées qui lui sont associées. Le chapitre introduit également la notion de
 domaine de connaissance des articles, centrale dans le lien entre encyclopédies
@@ -42,7 +42,7 @@ classifieur retenu à la totalité du corpus afin de pouvoir ajouter aux
 métadonnées des articles le domaine dont ils relèvent.
 
 Enfin, le chapitre \ref{sec:contrasts} constitue l'aboutissement des deux
-précédent et se consacre aux analyses contrastives. Il commence par cerner la
+précédents et se consacre aux analyses contrastives. Il commence par cerner la
 place accordée aux discours géographiques, de manière tout à fait quantitative
 d'abord puis, en s'intéressant aux transferts d'articles entre classes en
 diachronie, de façon plus qualitative. La dernière étude qu'il contient observe
@@ -91,7 +91,7 @@ connaissance.
 
 #### Biographies et discours géographiques {.unnumbered .unlisted}
 
-Enfin le chapitre \ref{sec:contrasts}, apporte des éléments nouveaux pour
+Enfin le chapitre \ref{sec:contrasts} apporte des éléments nouveaux pour
 comprendre la place des biographies dans les articles de *Géographie*. En effet,
 il n'y a pas officiellement de notice biographique dans les pages de l'*EDdA* et
 la biographie, genre discursif, ne s'intègre pas au «Systême» des domaines de
@@ -120,21 +120,20 @@ renvois précisent le numéro de la page où se trouve la figure ou la section
 mentionnée. Ces numéros de page sont parfois omis pour les renvois «proches» à
 l'intérieur d'une même section ou à quelques pages d'intervalle.
 
-En écrivant cette thèse il est en outre apparu que plusieurs sigles et
-acronymes, par exemple des noms d'organisations ou de techniques, revenaient
-assez souvent pour justifier la création d'un court
-\hyperlink{glossary}{Glossaire} alphabétique de la terminologie du manuscrit. À
-leur première occurrence, les termes sont explicités, leurs initiales étant
-précisées entre parenthèses pour les acronymes. Les occurrences suivantes
-n'utilisent plus que la version courte sous forme de lien hypertexte également.
-Ces liens, à la différence des renvois précédents, ne sont jamais accompagnés de
-la page où se trouve l'entrée: du vocabulaire qui ne serait pas défini juste
-avant son utilisation est à chercher dans le \hyperlink{glossary}{Glossaire} à
-partir de la page \pageref{glossary}. La version numérique est donc là encore
-avantagée puisque de nombreux lecteurs PDF affichent une prévisualisation de la
-cible d'un lien au survol avec la souris, ce qui suffit le plus souvent pour
-consulter ces définitions assez brèves. Le format PDF est donc celui recommandé
-pour lire cette thèse.
+En écrivant cette thèse il est en outre apparu que plusieurs sigles et acronymes
+mais aussi du lexique scientifique revenaient assez souvent pour justifier la
+création d'un court \hyperlink{glossary}{Glossaire} alphabétique de la
+terminologie du manuscrit. À leur première occurrence, les termes sont
+explicités, leurs initiales étant précisées entre parenthèses pour les
+acronymes. Les occurrences suivantes n'utilisent plus que la version courte sous
+forme de lien hypertexte également. Ces liens, à la différence des renvois
+précédents, ne sont jamais accompagnés de la page où se trouve l'entrée: du
+vocabulaire qui ne serait pas défini juste avant son utilisation est à chercher
+dans le \hyperlink{glossary}{Glossaire} à partir de la page \pageref{glossary}.
+La version numérique est donc là encore avantagée puisque de nombreux lecteurs
+PDF affichent une prévisualisation de la cible d'un lien au survol avec la
+souris, ce qui suffit le plus souvent pour consulter ces définitions assez
+brèves. Le format PDF est donc celui recommandé pour lire cette thèse.
 
 Le manuscrit ne possède en revanche pas d'Annexe alors que cela est courant dans
 ce type de document pour présenter des tableaux de données, des algorithmes
@@ -162,7 +161,7 @@ exemple d'[@=AA] pour Apprentissage Automatique (l'expression développée est
 parfois utilisée en français mais l'abréviation ML pour «Machine Learning» est
 bien plus courante dans la littérature que «[@=AA]») ou pour [@=HN] qui peut
 surprendre par rapport à DH pour «Digital Humanities» alors qu'«Humanités
-Numériques» se rencontre couramment. Par soucis d'homogénéité, ce sont pourtant
+Numériques» se rencontre couramment. Par souci d'homogénéité, ce sont pourtant
 les versions francophones qui ont été préférées; dans tous les cas, le
 \hyperlink{glossary}{Glossaire} est là (p.\pageref{glossary}) si besoin. Pour
 certains termes comme les noms de méthodes de classification automatique où
diff --git "a/\303\211dlA/Linguistique_de_corpus.md" "b/\303\211dlA/Linguistique_de_corpus.md"
index a2428f340e00230a1c0c8cf911c6ef31e4feab3d..6b6c6718e6d7ee5be2f9d9e24778c674c54b68de 100644
--- "a/\303\211dlA/Linguistique_de_corpus.md"
+++ "b/\303\211dlA/Linguistique_de_corpus.md"
@@ -61,7 +61,7 @@ textes peuvent être assemblés pour former un corpus d'étude.
 correspond à l'approche de Quirk ou de Leech par exemple [@leon_histoire_2015,
 p.163] qui assemblent des textes choisis dans un but précis: l'étude est *basée
 sur un corpus*. À l'inverse, l'approche *corpus-driven* de Firth, Sinclair et
-l'école londonienne avec eux requiert des textes intégraux par soucis
+l'école londonienne avec eux requiert des textes intégraux par souci
 d'objectivité et d'authenticité des productions étudiées: c'est ce qui émerge du
 corpus qui oriente l'analyse.
 
diff --git "a/\303\211dlA/TAL.md" "b/\303\211dlA/TAL.md"
index 0a293a2d37590ea9e81a45fabc5b157855c15928..08446b16370820f9afe51760badc17bc900e24dc 100644
--- "a/\303\211dlA/TAL.md"
+++ "b/\303\211dlA/TAL.md"
@@ -22,7 +22,7 @@ donc à un mot unique du corpus), la composante associée dans le vecteur qui
 représente un document est un entier positif ou nul égal au nombre d'occurrences
 du mot (sa fréquence) dans ce document. Le terme anglophone consacré est «*Bag
 of Words*», et bien que ce terme soit le seul pour lequel l'équivalent français
-s'emploie, l'acronyme *BoW* sera également utilisé dans ce qui suit par soucis
+s'emploie, l'acronyme *BoW* sera également utilisé dans ce qui suit par souci
 d'homogénéité avec les autres méthodes. Cette approche produit des
 représentations vectorielles très grandes (beaucoup de nombres) et avec peu de
 valeurs non nulles (la plupart valent 0) car chaque document n'utilise qu'une