From 30235805aaad800fc82cec0bf67e488d23e7f860 Mon Sep 17 00:00:00 2001 From: Alice BRENON <alice.brenon@ens-lyon.fr> Date: Wed, 19 Mar 2025 18:01:15 +0100 Subject: [PATCH] =?UTF-8?q?Introduce=20the=20term=20=C2=ABseuil=20de=20ban?= =?UTF-8?q?alit=C3=A9=C2=BB=20in=20the=20textometry=20=C3=89dlA?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- "\303\211dlA/Linguistique_de_corpus.md" | 16 ++++++++-------- 1 file changed, 8 insertions(+), 8 deletions(-) diff --git "a/\303\211dlA/Linguistique_de_corpus.md" "b/\303\211dlA/Linguistique_de_corpus.md" index c1f0fbb..0fe81c9 100644 --- "a/\303\211dlA/Linguistique_de_corpus.md" +++ "b/\303\211dlA/Linguistique_de_corpus.md" @@ -177,14 +177,14 @@ l'implémentation dans le logiciel TXM [@heiden_txm_2010]. Dans ce logiciel, la spécificité est exprimée sur une échelle logarithmique: une valeur de spécificité de 2 signifie qu'il y a 1 chance sur 100 ($10^{2} = 100$) que le hasard puisse expliquer la distribution observée. On considère généralement que -le seuil à partir duquel une spécificité devient significative est de 3 -(c'est-à -dire au plus 1 chance sur 1 000 que le hasard explique le phénomène). -Pour des raisons pratiques d'affichage, le logiciel TXM «sature» et n'affiche -pas plus de 1 000 comme valeur pour une spécificité. Peu importe la valeur -réelle dans ce cas puisque cela correspond déjà à des distributions ayant -seulement au mieux 1 chance sur $10^{1000}$ de se produire par hasard, donc -l'affichage de cette valeur dans TXM suffit en pratique à exclure totalement une -coïncidence. +le seuil à partir duquel une spécificité devient significative, dit «seuil de +banalité» est de 3 (c'est-à -dire au plus 1 chance sur 1 000 que le hasard +explique le phénomène). Pour des raisons pratiques d'affichage, le logiciel TXM +«sature» et n'affiche pas plus de 1 000 comme valeur pour une spécificité. Peu +importe la valeur réelle dans ce cas puisque cela correspond déjà à des +distributions ayant seulement au mieux 1 chance sur $10^{1000}$ de se produire +par hasard, donc l'affichage de cette valeur dans TXM suffit en pratique à +exclure totalement une coïncidence. La deuxième contribution majeure des mathématiques à l'école française de linguistique vient un peu plus tard, à partir de la fin des années 1960 avec le -- GitLab