diff --git "a/\303\211dlA/Linguistique_de_corpus.md" "b/\303\211dlA/Linguistique_de_corpus.md" index c1f0fbbf0b5e2488dcf718f31eb4365083dee7c6..0fe81c9855e9250f473f37999b4356bc081a10bf 100644 --- "a/\303\211dlA/Linguistique_de_corpus.md" +++ "b/\303\211dlA/Linguistique_de_corpus.md" @@ -177,14 +177,14 @@ l'implémentation dans le logiciel TXM [@heiden_txm_2010]. Dans ce logiciel, la spécificité est exprimée sur une échelle logarithmique: une valeur de spécificité de 2 signifie qu'il y a 1 chance sur 100 ($10^{2} = 100$) que le hasard puisse expliquer la distribution observée. On considère généralement que -le seuil à partir duquel une spécificité devient significative est de 3 -(c'est-à -dire au plus 1 chance sur 1 000 que le hasard explique le phénomène). -Pour des raisons pratiques d'affichage, le logiciel TXM «sature» et n'affiche -pas plus de 1 000 comme valeur pour une spécificité. Peu importe la valeur -réelle dans ce cas puisque cela correspond déjà à des distributions ayant -seulement au mieux 1 chance sur $10^{1000}$ de se produire par hasard, donc -l'affichage de cette valeur dans TXM suffit en pratique à exclure totalement une -coïncidence. +le seuil à partir duquel une spécificité devient significative, dit «seuil de +banalité» est de 3 (c'est-à -dire au plus 1 chance sur 1 000 que le hasard +explique le phénomène). Pour des raisons pratiques d'affichage, le logiciel TXM +«sature» et n'affiche pas plus de 1 000 comme valeur pour une spécificité. Peu +importe la valeur réelle dans ce cas puisque cela correspond déjà à des +distributions ayant seulement au mieux 1 chance sur $10^{1000}$ de se produire +par hasard, donc l'affichage de cette valeur dans TXM suffit en pratique à +exclure totalement une coïncidence. La deuxième contribution majeure des mathématiques à l'école française de linguistique vient un peu plus tard, à partir de la fin des années 1960 avec le