diff --git a/Classification/Application.md b/Classification/Application.md
index ad3683988f0ada9d1fdb3b2f2d22f67e3fa16daa..0320746a99be51f3ad192aad0f8c73dcbcab3fbf 100644
--- a/Classification/Application.md
+++ b/Classification/Application.md
@@ -423,7 +423,7 @@ entrÃ©es de communes,label=lst:com_du_dep_regex]
 En lisant les blocs Ã  partir des plus profonds pour remonter Ã  l'expression dans
 son ensemble, voici comment elle peut s'analyser. D'abord, la lettre 'm' est
 parfois perÃ§ue par l'[@=OCR] comme la sÃ©quence "rn" voire "in", ce qui est Ã 
-l'origine de la sÃ©quence `\(m\|[ri]n\)` qui sert Ã  capturer Â«un mÂ» : soit
+l'origine de la sÃ©quence `\(m\|[ri]n\)` qui sert Ã  capturer Â«un mÂ»: soit
 `R`~`m`~ cette sÃ©quence. L'abrÃ©viation n'est pas toujours la mÃªme et il y a
 plusieurs occurrences oÃ¹ les deux 'm' du mot Â«communeÂ» ont Ã©tÃ© conservÃ©s: c'est
 lÃ  le sens de `R`~`m`~`\{1, 2\}` qui tolÃ¨re une sÃ©quence de 1 ou 2 fois
@@ -495,7 +495,7 @@ prÃ©sence d'articles qui sont de purs renvois sans contenu propre rend Ã©galemen
 difficile la dÃ©termination d'une classe sans ambiguÃ¯tÃ©. Pour toutes ces raisons,
 l'Ã©valuation a Ã©tÃ© plutÃ´t permissive, c'est-Ã -dire que la Â«charge de la preuveÂ»
 a plutÃ´t pesÃ© sur le rejet de la classification proposÃ©e par le modÃ¨le que sur
-son acceptation : le refus d'une annotation suggÃ©rÃ©e par le modÃ¨le devait Ãªtre
+son acceptation: le refus d'une annotation suggÃ©rÃ©e par le modÃ¨le devait Ãªtre
 motivÃ© par au moins un superdomaine qui conviendrait mieux de maniÃ¨re Ã©vidente.
 Pour un article qui aurait acceptÃ© plusieurs classes, la proposition du modÃ¨le a
 Ã©tÃ© acceptÃ©e si l'une au moins correspondait (mÃªme si Ã§a n'Ã©tait pas forcÃ©ment
diff --git a/Classification/Relations.md b/Classification/Relations.md
index a93dd9ecdd70102d318014e85927b9a8362320e5..687144f99bb1e0a0d9f19e1a7e780f082d2bfa15 100644
--- a/Classification/Relations.md
+++ b/Classification/Relations.md
@@ -44,14 +44,14 @@ plusieurs domaines.
 
 AprÃ¨s la question des origines, un deuxiÃ¨me paramÃ¨tre s'ajoute dans l'Ã©quation.
 Tous les travaux de la section \ref{sec:classifiers_comparison} considÃ¨rent en
-effet un problÃ¨me de classification monoclasse : pour les 5% d'articles assignÃ©s
+effet un problÃ¨me de classification monoclasse: pour les 5% d'articles assignÃ©s
 Ã  plusieurs domaines par les encyclopÃ©distes (voir la section
-\ref{classification_datasets} p.\pageref{classification_datasets}), une
-seule classe a Ã©tÃ© retenue pour entraÃ®ner le modÃ¨le (correspondant Ã  la cellule
-en vert sur la figure). Or d'une part il ne semble pas y avoir d'ordre
-d'importance entre les dÃ©signants prÃ©sents en tÃªte d'un article, et d'autre part
-les combinaisons de classes apparaissant ensemble au sein de ces 5% possÃ¨dent
-une certaine cohÃ©rence. Il y a ainsi plusieurs articles relevant Ã  la fois de
+\ref{classification_datasets} p.\pageref{classification_datasets}), une seule
+classe a Ã©tÃ© retenue pour entraÃ®ner le modÃ¨le (correspondant Ã  la cellule en
+vert sur la figure). Or d'une part il ne semble pas y avoir d'ordre d'importance
+entre les dÃ©signants prÃ©sents en tÃªte d'un article, et d'autre part les
+combinaisons de classes apparaissant ensemble au sein de ces 5% possÃ¨dent une
+certaine cohÃ©rence. Il y a ainsi plusieurs articles relevant Ã  la fois de
 l'*Histoire Naturelle* et de la *Botanique*[^bromelia] mais aucun relevant Ã  la
 fois de la *Pharmacie* et du *Spectacle*. MalgrÃ© le choix d'une classe parmi
 plusieurs pour simplifier la tÃ¢che du classifieur automatique, les combinaisons
diff --git a/Contrastes/Biographies.md b/Contrastes/Biographies.md
index c44ad300ce48941b3e6f20a2c554f50cff98d518..9257d36880940afb77c401eb887bdcd2727ffe58 100644
--- a/Contrastes/Biographies.md
+++ b/Contrastes/Biographies.md
@@ -398,7 +398,7 @@ biographies individuelles hors des articles de GÃ©ographie (dans la Philosophie)
 mais qu'en plus il n'y avait pas non plus de Â«tabouÂ» biographique que Jaucourt
 aurait enfreint seul et de son propre chef.
 
-[^defense]: Â«Ã€ ceux qui lâ€™auraient dÃ©sirÃ©e moins sÃ¨che : quâ€™il Ã©tait nÃ©cessaire
+[^defense]: Â«Ã€ ceux qui lâ€™auraient dÃ©sirÃ©e moins sÃ¨che: quâ€™il Ã©tait nÃ©cessaire
     de sâ€™en tenir Ã  la seule connaissance gÃ©ographique des villes qui fÃ»t
     scientifique, Ã  la seule qui nous suffirait pour construire de bonnes cartes
     des temps anciensÂ» (L'EncyclopÃ©die, T5, p.635)
@@ -622,26 +622,26 @@ ne suffisent donc pas Ã  prÃ©dire la prÃ©sence de passages biographiques.
 
 En essayant de trouver un juste milieu entre la FertÃ©-Milon et Paris, pour
 regarder des villes de taille intermÃ©diaire, on trouve alors trÃ¨s facilement un
-grand nombre de biographies : l'entrÃ©e pour TOURS (L'EncyclopÃ©die, T16, p.490)
-en contient 8 dont deux frÃ¨res qui sont dÃ©crits indÃ©pendamment, celle pour
-TROYES (L'EncyclopÃ©die, T16, p.719) en contient 9 sans liens entre les
-personnes, ROUEN atteint le total de 24. Ã€ chaque fois le motif est semblable:
-une suite de biographies succintes sans liens entre elles et prÃ©sentÃ©e
-implicitement comme un passage obligÃ© des articles (Â«je passe aux simples hommes
-de lettre natifs deÂ», Â«l'abondance m'oblige de m'arrÃªter Ã  cette listeÂ», Â«je ne
-me propose que d'indiquer ici les principauxÂ»), ce qui est renforcÃ© par l'usage
-frÃ©quent de l'ordre alphabÃ©tique. Ce que disent en nÃ©gatif ces Ã©numÃ©rations,
-c'est qu'elles sont lÃ  parce que le lectorat de ces articles s'attendent Ã  les
-trouver, plus que pour l'intÃ©rÃªt de la vie individuelle de chaque personne. Ce
-qui ne signifie pas qu'elles doivent Ãªtre anecdotiques: les exemples de la
-section \ref{sec:biography_domains} contiennent des savants majeurs de leurs
-domaines citÃ©s briÃ¨vement dans les villes qui les ont vu naÃ®tre: mÃªme Leibnitz,
-dont la vraie biographie est Ã  l'article LÃ‰IBNITZIANISME, est mentionnÃ© dans
-l'article LEIPSIC, en mÃªme temps qu'une remarque Ã©clairante sur la motivation
-profonde de ces biographies: Â«Leibnitz seul auroit suffi pour donner du relief Ã 
-Leipsic sa patrieÂ». Ces Ã©numÃ©rations sont lÃ  pour l'anecdote, elles ornent,
-donnent davantage d'intÃ©rÃªt aux lieux traitÃ©s. En cela elle font partie du
-discours gÃ©ographique de l'Ã©poque.
+grand nombre de biographies: l'entrÃ©e pour TOURS (L'EncyclopÃ©die, T16, p.490) en
+contient 8 dont deux frÃ¨res qui sont dÃ©crits indÃ©pendamment, celle pour TROYES
+(L'EncyclopÃ©die, T16, p.719) en contient 9 sans liens entre les personnes, ROUEN
+atteint le total de 24. Ã€ chaque fois le motif est semblable: une suite de
+biographies succintes sans liens entre elles et prÃ©sentÃ©e implicitement comme un
+passage obligÃ© des articles (Â«je passe aux simples hommes de lettre natifs deÂ»,
+Â«l'abondance m'oblige de m'arrÃªter Ã  cette listeÂ», Â«je ne me propose que
+d'indiquer ici les principauxÂ»), ce qui est renforcÃ© par l'usage frÃ©quent de
+l'ordre alphabÃ©tique. Ce que disent en nÃ©gatif ces Ã©numÃ©rations, c'est qu'elles
+sont lÃ  parce que le lectorat de ces articles s'attendent Ã  les trouver, plus
+que pour l'intÃ©rÃªt de la vie individuelle de chaque personne. Ce qui ne signifie
+pas qu'elles doivent Ãªtre anecdotiques: les exemples de la section
+\ref{sec:biography_domains} contiennent des savants majeurs de leurs domaines
+citÃ©s briÃ¨vement dans les villes qui les ont vu naÃ®tre: mÃªme Leibnitz, dont la
+vraie biographie est Ã  l'article LÃ‰IBNITZIANISME, est mentionnÃ© dans l'article
+LEIPSIC, en mÃªme temps qu'une remarque Ã©clairante sur la motivation profonde de
+ces biographies: Â«Leibnitz seul auroit suffi pour donner du relief Ã  Leipsic sa
+patrieÂ». Ces Ã©numÃ©rations sont lÃ  pour l'anecdote, elles ornent, donnent
+davantage d'intÃ©rÃªt aux lieux traitÃ©s. En cela elle font partie du discours
+gÃ©ographique de l'Ã©poque.
 
 Toutes ces remarques convergent donc pour dÃ©gager un dernier critÃ¨re Ã  appliquer
 aux biographies trouvÃ©es dans les articles de GÃ©ographie: celui de la motivation
diff --git a/Contrastes/Contours.md b/Contrastes/Contours.md
index 4b156d3018779fffd026caa6f3a4f7d2e15c494b..47307cd9d792e97228504e6da45f619af8926077 100644
--- a/Contrastes/Contours.md
+++ b/Contrastes/Contours.md
@@ -445,7 +445,7 @@ articles.
 
 Le trait le plus visible de la figure \ref{fig:ene_edda} est Ã©videmment la
 prÃ©pondÃ©rance de la *GÃ©ographie* par opposition aux autres domaines dans la
-rÃ©partition des entitÃ©s. Les plus prÃ©sentes sont celles de lieu : `ENE-Spatial`,
+rÃ©partition des entitÃ©s. Les plus prÃ©sentes sont celles de lieu: `ENE-Spatial`,
 `NC-Spatial` et surtout `NP-Spatial` qui atteint environ 5%, ce qui est
 supÃ©rieur Ã  la densitÃ© moyenne de tous les types d'entitÃ©s confondus dans
 l'ensemble de l'*EDdA* ($\Sigma$, valant 4.6%). La ligne *GÃ©ographie* dans son
@@ -573,7 +573,7 @@ caractÃ¨res mais sans tenir compte de la casse Ã©tant donnÃ© que la typographie
 un peu irrÃ©guliÃ¨re dans l'*EDdA* et que les conventions typographiques varient
 de toute faÃ§on lÃ©gÃ¨rement entre les deux encyclopÃ©dies. Cette rÃ¨gle relativement
 stricte n'est pourtant pas suffisante pour garantir que les paires sont toutes
-bien fondÃ©es : au lieu qu'elles renvoient bien au Â«mÃªmeÂ» objet (concept, lieu,
+bien fondÃ©es: au lieu qu'elles renvoient bien au Â«mÃªmeÂ» objet (concept, lieu,
 etc.) il se pourrait qu'une entrÃ©e vienne Ã  disparaÃ®tre de la premiÃ¨re
 encyclopÃ©die pour Ãªtre remplacÃ©e dans la suivante par une autre avec la mÃªme
 vedette mais sans lien sÃ©mantique avec l'entrÃ©e initiale. Si la vedette commune
diff --git a/Corpus/Encodage.md b/Corpus/Encodage.md
index 99c5bea7821bb2ad680e79a24732736596e732cd..f3e3de875800ba52ce2ac93144343935ca361338 100644
--- a/Corpus/Encodage.md
+++ b/Corpus/Encodage.md
@@ -606,7 +606,7 @@ raccourci Ã  son initiale Â«V.Â» comme cela Ã©tait dÃ©jÃ  visible sur la figure
 plupart des cas de renvois externes, vers d'autres Å“uvres que *LGE*. Lorsqu'il
 s'agit bien de renvois entre articles, c'est que le contexte particulier de ce
 renvoi exige une formulation plus explicite qui sort du Â«lienÂ» codifiÃ©
-typographiquement pour revenir Ã  une tournure plus construite : par exemple une
+typographiquement pour revenir Ã  une tournure plus construite: par exemple une
 reprise anaphorique pour Ã©viter une rÃ©pÃ©titionÂ â€”â€¯Â«Voy. ce motÂ» Ã  l'article
 COMBATTANT (La Grande EncyclopÃ©die, T11, p.1153)â€¯â€”Â ou un renvoi multipleÂ â€”â€¯Â«voir
 les mots \textsc{Poste} et \textsc{TÃ©lÃ©graphe}Â» Ã  l'article AFFRANCHISSEMENT (La
diff --git a/Corpus/Introduction.md b/Corpus/Introduction.md
index a3fb6934ffeec2b6383b22300f8b1e4b820a0450..a4df5ae0da3da57b7260a03678db6559e3dd4c2f 100644
--- a/Corpus/Introduction.md
+++ b/Corpus/Introduction.md
@@ -2,11 +2,11 @@ La notion de corpus occupe une place centrale dans les [@=HN], reprÃ©sentant
 l'objet autour duquel s'articulent de nombreux projets. Ce chapitre prÃ©sente non
 seulement les tÃ¢ches qui ont Ã©tÃ© rÃ©alisÃ©es le plus tÃ´t dans cette thÃ¨se mais
 Ã©galement celles qui ont requis le plus de travail. Toutefois, sa place avant
-les autres chapitres ne reflÃ¨te pas un ordre strict de dÃ©pendance : au
-contraire, de nombreux allers et retours ont Ã©tÃ© nÃ©cessaires entre les donnÃ©es
-et les outils utilisÃ©s pour les exploiter: ce chapitre est une tentative de
-saisir un Ã©tat satisfaisant d'un effort en rÃ©alitÃ© continu et pouvant se
-poursuivre sans fin.
+les autres chapitres ne reflÃ¨te pas un ordre strict de dÃ©pendance: au contraire,
+de nombreux allers et retours ont Ã©tÃ© nÃ©cessaires entre les donnÃ©es et les
+outils utilisÃ©s pour les exploiter: ce chapitre est une tentative de saisir un
+Ã©tat satisfaisant d'un effort en rÃ©alitÃ© continu et pouvant se poursuivre sans
+fin.
 
 Il commence par prÃ©senter les objets de l'Ã©tude et introduire les concepts
 requis pour dÃ©crire ces encyclopÃ©dies et les articles qu'elles contiennent, au
diff --git "a/Corpus/\305\222uvres.md" "b/Corpus/\305\222uvres.md"
index ff264199cce3e3ac5849494acf3f9a42cba60904..83a84a62fb44d1ab830dc5ce018533f4ad926362 100644
--- "a/Corpus/\305\222uvres.md"
+++ "b/Corpus/\305\222uvres.md"
@@ -35,7 +35,7 @@ Thaumaste que Panurge lui a ouvert Â«le vray puys et abisme de EncyclopÃ©dieÂ».
 cette Ã©poque, le terme renvoie encore principalement au concept abstrait de
 maÃ®trise simultanÃ©e de toutes les connaissances. C'est cette dÃ©finition proche
 de l'Ã©tymologie grecque du terme que donne FuretiÃ¨re dans la premiÃ¨re Ã©dition de
-son *Dictionnaire Universel*Â : un enchaÃ®nement de toutes les connaissances, de
+son *Dictionnaire Universel*: un enchaÃ®nement de toutes les connaissances, de
 *ÎºÏÎºÎ»Î¿Ï‚*, Â«cercleÂ», et *Ï€Î±Î¹Î´ÎµÎ¯Î±*, Â«connaissanceÂ». L'auteur critique dÃ©jÃ  sa
 poursuite en tant qu'une forme d'hubris (Â«C'est une tÃ©mÃ©ritÃ© Ã  un homme de
 vouloir possÃ©der l'EncyclopÃ©dieÂ») mais @basnage_dictionnaire_1702 [p.760] dans
diff --git a/Introduction/Cadre.md b/Introduction/Cadre.md
index 867bfc52196c1499c044cf1927af2ee47c5bb596..cb417e0f5dc46423dc4234c6bbbb264500f22457 100644
--- a/Introduction/Cadre.md
+++ b/Introduction/Cadre.md
@@ -6,7 +6,7 @@ Si l'on en croit AndrÃ© Marcel Berthelot, la GÃ©ographie serait la science
 encyclopÃ©dique par excellence:
 
 > Le gÃ©ographe aborde successivement le domaine de plusieurs sciences dÃ©finies ;
-> il en prend les rÃ©sultats et les place dans sa description synthÃ©tique :
+> il en prend les rÃ©sultats et les place dans sa description synthÃ©tique:
 > astronomie, physique, chimie, gÃ©ologie, botanique, zoologie, anthropologie,
 > linguistique, sociologie, statistique, dÃ©mographie, histoire, toutes les
 > branches des connaissances humaines lui apportent leur contingent de faits
diff --git a/Introduction/Enjeu.md b/Introduction/Enjeu.md
index e7f03141e57c3954d55d5c3cd627cf32bc11e26e..d938305292caeacac6e6cbc6c156c8c73ddca14b 100644
--- a/Introduction/Enjeu.md
+++ b/Introduction/Enjeu.md
@@ -119,7 +119,7 @@ qu'ils considÃ©raient relever de cette mÃªme discipline.
 
 Mais en toute rigueur, avec les seuls Ã©lÃ©ments disponiblesÂ â€”â€¯c'est-Ã -dire des
 collections d'articles non seulement finies mais surtout disjointes, sans
-continuitÃ© temporelleâ€¯â€”Â il n'est pas possible de l'affirmer : le nom aurait pu
+continuitÃ© temporelleâ€¯â€”Â il n'est pas possible de l'affirmer: le nom aurait pu
 subir un glissement sÃ©mantique et dÃ©signer des disciplines entiÃ¨rement
 distinctes aux deux Ã©poques. De plus, l'ensemble des catÃ©gories selon lesquelles
 les articles se rÃ©partissent diffÃ¨re Ã  chaque Ã©poque. Cela peut Ãªtre dÃ» Ã 
diff --git "a/\303\211dlA/Historique.md" "b/\303\211dlA/Historique.md"
index 371eb34898283e1a3ecf7b1971d588225230df0e..3e856bb26914f7bfc2a6411f4476a09583dda9a0 100644
--- "a/\303\211dlA/Historique.md"
+++ "b/\303\211dlA/Historique.md"
@@ -127,11 +127,11 @@ centrÃ©e sur la linguistique.
 
 Pour revenir au terme Â«[@=TAL]Â» sur lequel s'ouvrait cette brÃ¨ve section, il est
 maintenant possible de lui donner un sens. Il semblerait parfait pour dÃ©signer
-l'ensemble du domaineÂ : l'arrivÃ©e des machines dans les tÃ¢ches linguistiques
+l'ensemble du domaine: l'arrivÃ©e des machines dans les tÃ¢ches linguistiques
 initiÃ©e dans les annÃ©es 1960 et mentionnÃ©e ci-dessus consistait effectivement
 dÃ©jÃ  Ã  traiter le langage de maniÃ¨re automatique. Toutefois, le terme reste peu
 employÃ© par les linguistes et semble en rÃ©alitÃ© bien plus populaire sur l'autre
-versant de la discipline : dans une pratique de l'informatique dont la
+versant de la discipline: dans une pratique de l'informatique dont la
 linguistique reprÃ©sente un objet d'application. Il y est revendiquÃ© autant par
 des (rares, dÃ©sormais) hÃ©ritiers de Chomsky Ã©tablissant de nouveaux modÃ¨les
 formels de la langue que par des empiristes dÃ©veloppant de nouveaux outils
diff --git "a/\303\211dlA/Lexicographie.md" "b/\303\211dlA/Lexicographie.md"
index 75df43f89c135a7bd788850fe242613642ccf374..da406c792358847edb3a2e164d87204f1560c848 100644
--- "a/\303\211dlA/Lexicographie.md"
+++ "b/\303\211dlA/Lexicographie.md"
@@ -56,7 +56,7 @@ ampleur en Ã©crivant Ã  l'article DICTIONNAIRE (L'EncyclopÃ©die, T4, p.958):
 
 > \label{dalembert_dictionnaire}un dictionnaire de langues, qui paroÃ®t n'Ãªtre
 > qu'un dictionnaire de mots, doit Ãªtre souvent un dictionnaire de choses quand
-> il est bien fait : c'est alors un ouvrage trÃ¨s-philosophique.
+> il est bien fait: c'est alors un ouvrage trÃ¨s-philosophique.
 
 Il n'est pas possible de dÃ©finir les mots en demeurant au niveau du seul
 langage, sous peine de produire des tautologies selon
diff --git "a/\303\211dlA/Linguistique_de_corpus.md" "b/\303\211dlA/Linguistique_de_corpus.md"
index 882585a13b9217e66cc553c40b44e8b47de5d56b..e5174d3612a4635a657775c0882d4ba747f5e6ac 100644
--- "a/\303\211dlA/Linguistique_de_corpus.md"
+++ "b/\303\211dlA/Linguistique_de_corpus.md"
@@ -257,7 +257,7 @@ auteurÂ â€”â€¯Victor Hugoâ€¯â€”Â pour une Ã©tude de @brunet_hugometrie_2002. Il
 intÃ©ressant de noter la ressemblance avec les applications de la classification
 automatique pour dÃ©terminer le sujet d'un texte ou l'orientation politique de
 son auteur (voir la section \ref{sec:EdlA_TAL_text_classification}). Cependant,
-les deux dÃ©marches sont en rÃ©alitÃ© tout Ã  fait opposÃ©es : alors que la finalitÃ©
+les deux dÃ©marches sont en rÃ©alitÃ© tout Ã  fait opposÃ©es: alors que la finalitÃ©
 des tÃ¢ches de classification rÃ©side complÃ¨tement dans la production d'une
 partition des textes, ces Ã©tudes textomÃ©triques s'attachent au contraire Ã 
 identifier les critÃ¨res qui permettent de rattacher un texte Ã  une des
diff --git "a/\303\211dlA/TAL.md" "b/\303\211dlA/TAL.md"
index 0196e1ffe5a8781a9d57f3761d68f64d6a5637ac..3d67adb1df8fa4aa2b608d2bb73c9641bc4ba20f 100644
--- "a/\303\211dlA/TAL.md"
+++ "b/\303\211dlA/TAL.md"
@@ -282,7 +282,7 @@ l'annotation en [@=POS] est fortement compliquÃ©e par une dÃ©pendance contextuel
 aiguÃ«. Des mots diffÃ©rents, auxquels il faut donc attribuer des [@=POS]
 diffÃ©rentes, peuvent revÃªtir la mÃªme forme et nÃ©cessiter le contexte des autres
 mots de la phrase pour Ãªtre distinguÃ©s. Ce peut Ãªtre le cas par exemple pour des
-raisons d'homonymie : Â«Ã©tÃ©Â» peut Ãªtre le nom d'une saison ou bien une forme du
+raisons d'homonymie: Â«Ã©tÃ©Â» peut Ãªtre le nom d'une saison ou bien une forme du
 verbe Â«ÃªtreÂ». Puisqu'il s'agit de Â«reconnaÃ®treÂ» les mots, cette phase d'analyse
 est gÃ©nÃ©ralement l'occasion d'associer aussi Ã  chaque mot une forme normalisÃ©e,
 son Â«lemmeÂ». L'existence d'amalgames tels que Â«desÂ» dans Â«le temps des cerisesÂ»