diff --git a/Contrastes/Biographies.md b/Contrastes/Biographies.md index 2eda7394d210254e5243f918d9d7f261c81683a2..99cae3af3a79bd935dbe2b6bee403cc5aaca0d0b 100644 --- a/Contrastes/Biographies.md +++ b/Contrastes/Biographies.md @@ -105,13 +105,18 @@ que les exemples connus de contenus biographiques dans l'*EDdA* apparaissent tous dans cette discipline. En partant du cas de WOLSTROPE (L'Encyclopédie, T17, p.630), qui utilise sa ville de naissance pour parler de Newton, il est naturel de prendre la notion de ville comme point de départ. L'étude des cooccurrents -syntaxiques offre la possibilité de voir les constructions dans lequelles le -terme «ville» est utilisé. - -Dans le Lexicoscope [@kraif_lexicoscope_2016], une requête sur le lemme «ville» -(formulée en langage TQL[^tql] dans le code source \ref{lst:tql_ville}) peut -être utilisée pour mesurer les scores d'associations avec ce lemme des -différents tokens possibles. +syntaxiques introduits à la section \ref{alr} (voir p.\pageref{alr}) offre la +possibilité d'observer les constructions dans lesquelles un terme comme «ville» +est employé. + +Concrètement, cette technique permet de trouver les mots les plus fréquemment +associés à un motif donné à partir de considérations statistiques. En se basant +sur les liens de syntaxe plutôt que sur l'ordre des mots dans la phrase, elle +s'affranchit de la notion de fenêtre de recherche présente habituellement dans +ce type de mesure et peut détecter des cooccurrents pertinents n'importe où dans +les phrases où le motif apparaît. Dans le Lexicoscope [@kraif_lexicoscope_2016], +une telle requête sur lemme «ville» étiqueté `NOUN` (nom commun) se formule en +langage TQL[^tql] (voir le code source \ref{lst:tql_ville}). \begin{lstlisting}[caption=Requête TQL sur le lemme «ville» annoté \texttt{NOUN} (nom commun), label=lst:tql_ville] @@ -146,9 +151,11 @@ suggérer qu'on qualifie bien plus volontiers une ville de «petite» que de Le Lexicoscope permet ensuite de générer automatiquement une autre requête qui intègre un des cooccurrents parmi ces résultats. Cette fonctionnalité correspond à une étape du procédé itératif permettant de construire progressivement un -[@=ALR] \(voir la section \ref{alr} p.\pageref{alr}). La nouvelle requête -obtenue pour le premier résultat, le déterminant «ce», est reproduite à -l'extrait de code \ref{lst:tql_ce_ville}. +[@=ALR], équivalents de la méthode des «segments répétés» pour les cooccurrents +syntaxiques. La nouvelle requête obtenue pour le premier résultat, le +déterminant «ce», revient à chercher les plus forts cooccurrents du motif «cette +ville». L'extrait de code \ref{lst:tql_ce_ville} montre cette requête formulée +en TQL. \begin{lstlisting}[caption=Requête TQL sur la mise en relation syntaxique quelconque du lemme «ce» annoté comme \texttt{DET} et du lemme «ville» annoté @@ -170,7 +177,7 @@ moins de 10% de celle obtenue par la préposition «dans». {#fig:ce_ville_lemma_geode} -En suivant ce nouveau coocurrent «dans» on construit la requête +En suivant ce nouveau cooccurrent «dans» on construit la requête \ref{lst:tql_dans_ce_ville}, dont un équivalent sous forme d'arbre syntaxique en dépendances est visible à la figure \ref{fig:dans_cette_ville_tree} pour plus de clarté. Les astérisques sur les deux arêtes partant du nœud `ville_NOUN` @@ -199,7 +206,7 @@ label=lst:tql_dans_ce_ville] {#fig:dans_cette_ville_tree width=20%} En recherchant ce troisième motif, on obtient le lexicogramme de la figure -\ref{fig:dans_ce_ville_lemma_geode} qui représente les dix coocurrents de «dans +\ref{fig:dans_ce_ville_lemma_geode} qui représente les dix cooccurrents de «dans cette ville» avec la plus forte mesure d'association. Sur cette figure, il n'y a quasiment plus que des verbes et des adjectifs. Le phénomène de remontée d'un lemme, déjà observé au cours du processus, se produit à nouveau avec l'adjectif @@ -208,7 +215,7 @@ lemme, déjà observé au cours du processus, se produit à nouveau avec l'adjec cette ville». De la même manière, le verbe «mourir» prend le deuxième rang, alors qu'il n'était que sixième pour «cette ville». De plus, le troisième rang est occupé par le verbe «naître», absent jusqu'ici des résultats mais de sens -contraire à «mourir» et proche de l'adjectif «natal» discuté lors de l'analyse +contraire à «mourir» et proche de l'adjectif «natal» observé lors de l'analyse de la figure \ref{fig:ville_lemma_geode}. À travers ce vocabulaire susceptible d'apparaître dans des contenus biographiques, on retrouve le procédé utilisé dans l'article WOLSTROPE à l'origine de cette étude. Toutefois, en étant parti @@ -481,10 +488,10 @@ importance particulière accordée à la Philosophie. Alors que Newton est surto considéré actuellement comme un physicien, sa contribution est particulièrement valorisée dans les pages de l'*EDdA* et mise en regard de celles de Descartes et de Leibnitz qu'il a affronté sur certains problèmes. Les trois savants se -retrouvent dans des contextes similaires, et ont des coocurrents très proches: +retrouvent dans des contextes similaires, et ont des cooccurrents très proches: des mots comme «analyse», «philosophie», «calcul», «principes» et «démontrés» et même plus directement leurs noms (par exemple `"Newton"` et `"Descartes"` sont -dans les cinq coocurrents les plus forts de `"Leibnitz"` et il en va de même +dans les cinq cooccurrents les plus forts de `"Leibnitz"` et il en va de même pour les deux autres combinaisons qu'on peut former de leurs trois noms). Et on constate même qu'à la différence des autres physiciens il possède lui aussi un article à son nom: NEWTONIANISME (L'Encyclopédie, T11, p.122), reformulé en