diff --git "a/\303\211dlA/Historique.md" "b/\303\211dlA/Historique.md"
index 3e856bb26914f7bfc2a6411f4476a09583dda9a0..34311eb882ed52c53ac6f3ddd5964e2bd4b2be97 100644
--- "a/\303\211dlA/Historique.md"
+++ "b/\303\211dlA/Historique.md"
@@ -10,7 +10,7 @@ qu'elles ont en commun: une approche plus statistique que symbolique du langage.
 Pour bien cerner cette distinction, il est utile de revenir Ã  la chronologie
 esquissÃ©e dans la section \ref{sec:EdlA_lexicography} et de la dÃ©velopper.
 
-### Une compÃ©tition stimulante
+### RivalitÃ© historique entre les approches symbolique et statistique
 
 Aux origines de cette lignÃ©e, il est d'abord question de Â«Traduction
 AutomatiqueÂ» (TA) et le domaine de recherche est surtout explorÃ© pour ses
@@ -64,7 +64,7 @@ Convolutionnels ([@=CNN]), descendants du Neocognitron de
 Mais depuis 2010, le balancier semble cassÃ© si l'on en croit
 @church_pendulum_2011[p.2], qui s'inquiÃ¨te de ne pas voir les mÃ©thodes
 rationalistes faire leur retour Ã  l'issue de la pÃ©riode d'une vingtaine d'annÃ©es
-qui sÃ©parait les pics d'activitÃ©s dans chacune des deux approches lors des
+qui sÃ©parait les pics d'activitÃ© dans chacune des deux approches lors des
 oscillations prÃ©cÃ©dentes. Loin de revenir dans les recherches pour combler les
 lacunes des mÃ©thodes statistiques, elles se retrouvent Ã©clipsÃ©es jusque dans les
 contenus pÃ©dagogiques [@church_pendulum_2011, p.19 et seq.].
@@ -90,7 +90,7 @@ avoir identifiÃ© leurs origines communes, il reste Ã  caractÃ©riser ce qui les
 sÃ©pare pour pouvoir convenir d'une dÃ©nomination Ã  utiliser dans le reste de
 cette thÃ¨se.
 
-### Convention de nommage {#sec:EdlA_history_names}
+### Nommer des pratiques trÃ¨s diffÃ©rentes {#sec:EdlA_history_names}
 
 La linguistique n'a pas attendu l'arrivÃ©e de rÃ©seaux de neurones artificiels
 utilisables pour que sa pratique bÃ©nÃ©ficie des apports des mÃ©thodes
@@ -155,6 +155,6 @@ place relative des approches couvertes dans les deux sections suivantes de cet
 versant informatique de la discipline, majoritairement Ã  des mÃ©thodes empiristes
 mais sans exclure quelques techniques rationalistes. La section
 \ref{sec:EdlA_corpus_linguistics} sera au contraire centrÃ©e sur les pratiques
-linguistiques enrichies d'outils informatiques, hÃ©ritiÃ¨res des travaux des
-Ã©coles britannique et franÃ§aise initiÃ©s dans les annÃ©es 1960.
+linguistiques enrichies d'outils informatiques, hÃ©ritiÃ¨res des travaux initiÃ©s
+dans les annÃ©es 1960 par les Ã©coles britannique et franÃ§aise.
 
diff --git "a/\303\211dlA/Linguistique_de_corpus.md" "b/\303\211dlA/Linguistique_de_corpus.md"
index 6b442deafd97dee9b1dea6cab2936749845796d1..ed055508e82d9d55e71eda7a4b60ea0987b9a414 100644
--- "a/\303\211dlA/Linguistique_de_corpus.md"
+++ "b/\303\211dlA/Linguistique_de_corpus.md"
@@ -138,8 +138,8 @@ de diffÃ©rents objets avec une approche statistique. En creux, ces dÃ©comptes
 supposent un dÃ©coupage: il s'agit de recenser les occurrences d'un phÃ©nomÃ¨ne
 dans une partie du corpus par rapport aux autres pour dÃ©gager des critÃ¨res
 quantitatifs objectifs qui caractÃ©risent cette partie. Ce concept de
-[@=partition] est fondamental dans l'approche contrastive et dans l'ensemble de
-la discipline.
+Â«[@=partition]Â» est fondamental dans l'approche contrastive et dans l'ensemble
+de la discipline.
 
 Guiraud le premier, Ã  la tÃªte des stylisticiens [@leon_histoire_2015, p.129]
 remarque que Â«la linguistique est la science statistique typeÂ»
@@ -166,10 +166,11 @@ rapportant les frÃ©quences observÃ©es Ã  la taille des diffÃ©rentes parties,
 @lafon_variabilite_1980 dÃ©finit la spÃ©cificitÃ© d'une forme comme une mesure de
 la probabilitÃ© que la distribution observÃ©e rÃ©sulte d'une rÃ©partition purement
 alÃ©atoire au sein du corpus. En ce sens, la spÃ©cificitÃ© quantifie la surprise
-que constitue la surreprÃ©sentation d'un motif dans une partie du corpus. Avec la
-loi de Zipf, ce point constitue un deuxiÃ¨me lien entre la lexicomÃ©trie et les
-travaux menÃ©s en thÃ©orie de l'information dÃ¨s les annÃ©es 1950 notamment par
-Shannon ou Markov [@leon_histoire_2015, chap.4 et en particulier p.56].
+que constitue la surreprÃ©sentation (ou la sous-reprÃ©sentation) d'un motif dans
+une partie du corpus. Avec la loi de Zipf, ce point constitue un deuxiÃ¨me lien
+entre la lexicomÃ©trie et les travaux menÃ©s en thÃ©orie de l'information dÃ¨s les
+annÃ©es 1950 notamment par Shannon ou Markov [@leon_histoire_2015, chap.4 et en
+particulier p.56].
 
 \label{textometry_specificity}DiffÃ©rentes lois ont Ã©tÃ© utilisÃ©es pour modÃ©liser
 la distribution des mots en vue de calculer des spÃ©cificitÃ©s comme la loi du
@@ -198,7 +199,7 @@ notion classique de cooccurrent se base uniquement sur la rÃ©alisation dite Â«de
 surfaceÂ»Â â€”â€¯c'est-Ã -dire sujette Ã  l'ordre particulier dans lequel les mots
 apparaissent dans une phrase (par opposition Ã  la Â«profondeurÂ» d'un arbre
 syntaxique). En rÃ©itÃ©rant les mesures de cooccurrence pour former peu Ã  peu un
-groupe de mots, il est mÃªme possible de repÃ©rÃ©r des motifs discursifs
+groupe de mots, il est mÃªme possible de repÃ©rer des motifs discursifs
 [@longree_les_2008] grÃ¢ce la technique dite des Â«segments rÃ©pÃ©tÃ©sÂ». Comme de
 telles tournures de phrase ne sont pas entiÃ¨rement figÃ©es, de nombreux mots
 peuvent occuper leurs positions encore libres et cette technique souffre donc
@@ -209,7 +210,7 @@ rechercher les cooccurrents en se basant sur les relations de syntaxe plutÃ´t qu
 sur la proximitÃ© sÃ©quentielle des mots. Ã€ la diffÃ©rence d'une recherche
 traditionnelle, il n'y a donc pas de notion de Â«fenÃªtreÂ» d'une taille
 paramÃ©trable autour du motif considÃ©rÃ©, la recherche se limite par construction
-a la phrase entiÃ¨re (au sens d'Â«arbre syntaxiqueÂ», dont les Ã©lÃ©ments sont
+Ã  la phrase entiÃ¨re (au sens d'Â«arbre syntaxiqueÂ», dont les Ã©lÃ©ments sont
 nÃ©cessairement connexes). En ajoutant progressivement Ã  un noyau initial des
 cooccurrents syntaxiques forts, cette technique nommÃ©e Â«Arbres
 Lexico-syntaxiques RÃ©currentsÂ» ([@=ALR]) permet d'extraire des motifs courants
@@ -280,12 +281,12 @@ alimente de nombreuses Ã©tudes [@pincemin_semantique_2022;
 @mayaffre_explorer_2019]. Les discours des syndicats font aussi l'objet
 d'analyses contrastives [@brugidou_discours_2000]. Des Ã©poques plus reculÃ©es
 comme l'entre-deux-guerres ne sont pas ignorÃ©es [@mayaffre_poids_2000]. Enfin,
-la taille des intervalles de temps considÃ©rÃ©s permet la mise en place d'Ã©tude de
-productions d'une seule personnalitÃ© politique oÃ¹ les contrastes sont envisagÃ©s
-selon la dimension temporelle. @labbe_franÃ§ois_1983 Ã©tudie ainsi le discours
-public de FranÃ§ois Mitterrand dans la quinzaine d'annÃ©es avant son Ã©lection au
-poste de prÃ©sident de la rÃ©publique puis celui de De Gaulle sur un peu plus
-d'une dÃ©cennie [@labbe_diachronie_2010].
+la taille des intervalles de temps considÃ©rÃ©s permet la mise en place d'Ã©tudes
+des productions d'une seule personnalitÃ© politique oÃ¹ les contrastes sont
+envisagÃ©s selon la dimension temporelle. @labbe_franÃ§ois_1983 Ã©tudie ainsi le
+discours public de FranÃ§ois Mitterrand dans la quinzaine d'annÃ©es avant son
+Ã©lection au poste de prÃ©sident de la rÃ©publique puis celui de De Gaulle sur un
+peu plus d'une dÃ©cennie [@labbe_diachronie_2010].
 
 De telles Ã©tudes, dites en diachronie, permettent de capturer des Ã©volutions Ã 
 des Ã©chelles variÃ©es selon la durÃ©e considÃ©rÃ©e, les changements les plus
diff --git "a/\303\211dlA/TAL.md" "b/\303\211dlA/TAL.md"
index 08446b16370820f9afe51760badc17bc900e24dc..b1892b6a55514b23685b92bed2aaaff9b5728133 100644
--- "a/\303\211dlA/TAL.md"
+++ "b/\303\211dlA/TAL.md"
@@ -36,10 +36,10 @@ frÃ©quence dans le document considÃ©rÃ© tempÃ¨re ce nombre en le divisant par la
 proportion de documents du corpus qui contiennent ce mot. De la mÃªme maniÃ¨re que
 les *BoW* Â«pursÂ», les vecteurs produits par cette mÃ©thode sont creux, ce qui
 tend Ã  dÃ©grader les performances des algorithmes d'[@=AA] en augmentant leurs
-complexitÃ©s spatiales et temporelles.
+consommation de mÃ©moire et leurs temps d'exÃ©cution.
 
 \label{edla_word_embeddings} Par contraste avec les deux approches prÃ©cÃ©dentes,
-les plongements de mots produisent des vecteurs de plus petites dimensions et
+les plongements de mots produisent des vecteurs de plus petite dimension et
 denses en coefficients non nuls. Ils constituent une famille de mÃ©thodes
 fondamentalement diffÃ©rentes des deux prÃ©cÃ©dentes du fait qu'elles capturent le
 contexte des mots dans leurs reprÃ©sentations vectorielles. Il y a deux approches
@@ -63,9 +63,9 @@ combinant tous les diffÃ©rents contextes dans lesquels il peut apparaÃ®tre. Plus
 rÃ©cemment, *BERT* [@devlin2018bert]Â â€”â€¯*Bidirectional Encoder Representations
 from Transformers* (Â«ReprÃ©sentations d'Encodeur Bi-directionnels Ã  partir de
 TransformeursÂ», voir p.\pageref{deep_learning_classifiers})â€¯â€”Â utilise un
-plongement contextuel, oÃ¹ la reprÃ©sentation de chaque mot dÃ©pend du contexte
-dans lequel il apparaÃ®t dans une phrase, pour la phase de vectorisation qu'il
-intÃ¨gre. *BERT* utilise des rÃ©seaux de neurones de type *transformer* et le
+plongement contextuel pour la phase de vectorisation qu'il intÃ¨gre, c'est-Ã -dire
+oÃ¹ la reprÃ©sentation d'un mot dÃ©pend du contexte dans lequel il apparaÃ®t dans
+une phrase. *BERT* utilise des rÃ©seaux de neurones de type *transformer* et le
 concept de masque pour prÃ©dire les mots qui complÃ¨tent une amorce de phrase
 donnÃ©e.
 
@@ -97,11 +97,11 @@ classification permettent de prÃ©dire les domaines de connaissance des articles
 p.\pageref{sec:structuring_knowledge}). Dans le cadre des travaux de l'[@=ARTFL]
 sur l'*EDdA*, @horton2009mining ont ainsi testÃ© la classification Bayesienne
 dite Â«naÃ¯veÂ» ([@=NaiveÂ Bayes]) pour prolonger la classification des auteurs de
-l'Å“uvre sur les entrÃ©es laissÃ©es sans domaine par les auteurs. L'Encyclopedia
-Britannica a Ã©galement Ã©tÃ© Ã©tudiÃ©e par le
-Nineteenth-CenturyÂ KnowledgeÂ Project[^19cProject] qui a utilisÃ© des mÃ©thodes
-d'[@=AA] mais aussi des approches basÃ©es sur des rÃ¨gles pour indexer 400â€¯000
-articles Ã  travers 4 Ã©ditions de l'Å“uvre [@grabus_representing_2019].
+l'Å“uvre sur les entrÃ©es laissÃ©es sans domaine. L'Encyclopedia Britannica a de
+mÃªme Ã©tÃ© Ã©tudiÃ©e par le Nineteenth-CenturyÂ KnowledgeÂ Project[^19cProject] qui a
+utilisÃ© des mÃ©thodes d'[@=AA] mais aussi des approches basÃ©es sur des rÃ¨gles
+pour indexer 400â€¯000 articles Ã  travers 4 Ã©ditions de l'Å“uvre
+[@grabus_representing_2019].
 
 [^19cProject]: [https://tu-plogan.github.io/](https://tu-plogan.github.io/)
 
@@ -207,23 +207,23 @@ nouveau.
 Enfin, avant de clore complÃ¨tement cet aperÃ§u des travaux en Classification
 Automatique, il est intÃ©ressant de mentionner un champ de recherche qui utilise
 des techniques de classification sans s'y rÃ©duire. Si la localisation des
-caractÃ¨res sur la page et la comprÃ©hension des liens qu'ils entretiennent est un
-prÃ©alable essentiel aux tÃ¢ches de reconnaissance de caractÃ¨res
-[@sayre_machine_1973, p.213], la classification des zones identifiÃ©es en
-caractÃ¨res semble bien plus complexe. Les moyens classiques semblent inefficaces
-pour produire des rÃ©sultats gÃ©nÃ©ralisables sur des donnÃ©es jamais rencontrÃ©es
-par l'algorithme et dans la mÃªme Ã©tude @sayre_machine_1973[p.216 et seq] explore
-donc des mÃ©thodes statistiques pour la classification.
+caractÃ¨res sur la page et la comprÃ©hension des liens qu'ils entretiennent
+reprÃ©sentent certes un type de problÃ¨mes entiÃ¨rement diffÃ©rent, l'identification
+des zones trouvÃ©es constitue quant Ã  elle un problÃ¨me de classification. Les
+moyens classiques semblent inefficaces pour produire des rÃ©sultats
+gÃ©nÃ©ralisables sur des donnÃ©es jamais rencontrÃ©es par l'algorithme ce qui
+conduit @sayre_machine_1973[p.216 et seq] Ã  explorer des mÃ©thodes statistiques
+pour reconnaÃ®tre les caractÃ¨res.
 
 En implÃ©mentant les [@=CNN], @lecun_backpropagation_1989 parviennent Ã  crÃ©er des
 modÃ¨les capables de lire les codes postaux Ã©crits Ã  la main sur des enveloppes.
 De nombreux systÃ¨mes rÃ©cents sont basÃ©s sur les *LSTM* [@wick_comparison_2018,
-p.79], architecture utile en classification ce qui souligne encore la parentÃ©
+p.79], architecture utile en classification, ce qui souligne encore la parentÃ©
 entre les deux tÃ¢ches. On distingue gÃ©nÃ©ralement cette tÃ¢che encore plus
 difficile de reconnaissance de caractÃ¨res tracÃ©s Ã  la mainÂ â€”â€¯donc moins
 rÃ©guliersâ€¯â€”Â sous le nom de *Handwritten Text Recognition* (HTR) par rapport au
 problÃ¨me plus gÃ©nÃ©ral d'[@=OCR]. Pour favoriser l'Ã©valuation de systÃ¨me de HTR,
-@chague_htr_2021 propose la diffusion de jeux de donnÃ©es pouvant servir de
+@chague_htr_2021 proposent la diffusion de jeux de donnÃ©es pouvant servir de
 vÃ©ritÃ© terrain. Aujourd'hui, tous les systÃ¨mes d'[@=OCR] sont basÃ©s sur des
 mÃ©thodes d'[@=AA].
 
@@ -380,10 +380,11 @@ pour annoter en syntaxe le corpus de cette thÃ¨seâ€¯â€”Â ou HOPS
 [@grobol_analyse_2021], tous deux basÃ©s sur de l'[@=AA], permettent d'analyser
 un texte en UD et produisent en sortie des fichiers au format CoNLL-U. Le modÃ¨le
 utilisÃ© par HOPS prÃ©dit l'existence de liens dans un graphe dont les nÅ“uds
-reprÃ©sentant les mots d'une phrase. Cette stratÃ©gie, mise en regard du fait
-qu'il est Ã©galement possible d'utiliser des rÃ¨gles de rÃ©Ã©criture de graphe pour
-annoter en syntaxe [@guillaume_dependency_2015 ; @bonfante_application_2018,
-chap.6] souligne la proximitÃ© thÃ©matique qui existe entre la thÃ©orie des graphes
-et l'analyse syntaxique (bien que les arbres syntaxiques, qui n'admettent pas de
-boucles, ne soient que des cas particuliers plus simples de graphes).
+reprÃ©sentent les mots de la phrase Ã  annoter. Cette stratÃ©gie, mise en regard du
+fait qu'il est Ã©galement possible d'utiliser des rÃ¨gles de rÃ©Ã©criture de graphe
+pour annoter en syntaxe [@guillaume_dependency_2015 ;
+@bonfante_application_2018, chap.6] souligne la proximitÃ© thÃ©matique qui existe
+entre la thÃ©orie des graphes et l'analyse syntaxique (bien que les arbres
+syntaxiques, qui n'admettent pas de boucles, ne soient que des cas particuliers
+plus simples de graphes).