From c0b34848aaf4a893e7ccb611aca23193fbaa2388 Mon Sep 17 00:00:00 2001
From: Alice BRENON <alice.brenon@ens-lyon.fr>
Date: Sat, 29 Mar 2025 16:21:51 +0100
Subject: [PATCH] =?UTF-8?q?Rework=20the=20order=20of=20the=20=C2=B6=20on?=
 =?UTF-8?q?=20ALRs=20in=20the=20=C3=89dlA=20+=20introduce=20the=20notion?=
 =?UTF-8?q?=20of=20syntactic=20cooccurrents=20more=20clearly?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 "\303\211dlA/Linguistique_de_corpus.md" | 34 +++++++++++++++----------
 1 file changed, 20 insertions(+), 14 deletions(-)

diff --git "a/\303\211dlA/Linguistique_de_corpus.md" "b/\303\211dlA/Linguistique_de_corpus.md"
index 3aeff0e..054eea6 100644
--- "a/\303\211dlA/Linguistique_de_corpus.md"
+++ "b/\303\211dlA/Linguistique_de_corpus.md"
@@ -192,23 +192,29 @@ par hasard, donc l'affichage de cette valeur dans TXM suffit en pratique Ã 
 exclure totalement une coÃ¯ncidence.
 
 \label{alr}Le calcul des spÃ©cificitÃ©s permet entre autres d'Ã©tudier les
-associations lexicales frÃ©quentes Ã  travers le concept de cooccurrences. En
-rÃ©itÃ©rant les mesures de cooccurrence pour former peu Ã  peu un groupe de mots,
-il est mÃªme possible de repÃ©rÃ©r des motifs discursifs [@longree_les_2008] grÃ¢ce
-la technique dite des Â«segments rÃ©pÃ©tÃ©sÂ». Comme la notion classique de
-cooccurrent se base uniquement sur la rÃ©alisation dite Â«de
+associations lexicales frÃ©quentes Ã  travers le concept de cooccurrences. La
+notion classique de cooccurrent se base uniquement sur la rÃ©alisation dite Â«de
 surfaceÂ»Â â€”â€¯c'est-Ã -dire sujette Ã  l'ordre particulier dans lequel les mots
 apparaissent dans une phrase (par opposition Ã  la Â«profondeurÂ» d'un arbre
-syntaxique)â€¯â€”Â le procÃ©dÃ© souffre du bruit crÃ©Ã© par les mots qui peuvent occuper
-des positions libres au milieu des tournures de phrase puisque celles-ci ne sont
-justement pas entiÃ¨rement figÃ©es [@tutin_routines_2016, p.124]. Pour lever ces
+syntaxique). En rÃ©itÃ©rant les mesures de cooccurrence pour former peu Ã  peu un
+groupe de mots, il est mÃªme possible de repÃ©rÃ©r des motifs discursifs
+[@longree_les_2008] grÃ¢ce la technique dite des Â«segments rÃ©pÃ©tÃ©sÂ». Comme de
+telles tournures de phrase ne sont pas entiÃ¨rement figÃ©es, de nombreux mots
+peuvent occuper leurs positions encore libres et cette technique souffre donc
+d'un Â«bruit considÃ©rableÂ» [@tutin_routines_2016, p.124]. Pour lever ces
 difficultÃ©s, @tutin_routines_2016[p.126] introduisent une mÃ©thode itÃ©rative
-semblable mais fondÃ©e sur des cooccurrents syntaxiques et nommÃ©e les Arbres
-Lexico-syntaxiques RÃ©currents ([@=ALR]). En ajoutant progressivement Ã  un noyau
-initial un cooccurrent syntaxique fort, cette technique permet d'extraire des
-motifs courants dans un corpus. Cette approche est implÃ©mentÃ©e dans le
-Lexicoscope [@kraif_lexicoscope_2016] et a Ã©tÃ© utilisÃ©e pour mettre en Ã©vidence
-des routines discursives par exemple dans certains genres littÃ©raires
+semblable mais fondÃ©e sur des cooccurrents syntaxiques. L'idÃ©e consiste Ã 
+rechercher les cooccurrents en se basant sur les relations de syntaxe plutÃ´t que
+sur la proximitÃ© sÃ©quentielle des mots. Ã€ la diffÃ©rence d'une recherche
+traditionnelle, il n'y a donc pas de notion de Â«fenÃªtreÂ» d'une taille
+paramÃ©trable autour du motif considÃ©rÃ©, la recherche se limite par construction
+a la phrase entiÃ¨re (au sens d'Â«arbre syntaxiqueÂ», dont les Ã©lÃ©ments sont
+nÃ©cessairement connexes). En ajoutant progressivement Ã  un noyau initial des
+cooccurrents syntaxiques forts, cette technique nommÃ©e Â«Arbres
+Lexico-syntaxiques RÃ©currentsÂ» ([@=ALR]) permet d'extraire des motifs courants
+dans un corpus. Cette approche est implÃ©mentÃ©e dans le Lexicoscope
+[@kraif_lexicoscope_2016] et a Ã©tÃ© utilisÃ©e pour mettre en Ã©vidence des routines
+discursives par exemple dans certains genres littÃ©raires
 [@kraif_constructions_2016] ou des Ã©crits scientifiques [@ji_hal_01956323].
 
 Outre la notion de spÃ©cificitÃ©, la deuxiÃ¨me contribution majeure des
-- 
GitLab