@@ -105,13 +105,18 @@ que les exemples connus de contenus biographiques dans l'*EDdA* apparaissent
...
@@ -105,13 +105,18 @@ que les exemples connus de contenus biographiques dans l'*EDdA* apparaissent
tous dans cette discipline. En partant du cas de WOLSTROPE (L'Encyclopédie, T17,
tous dans cette discipline. En partant du cas de WOLSTROPE (L'Encyclopédie, T17,
p.630), qui utilise sa ville de naissance pour parler de Newton, il est naturel
p.630), qui utilise sa ville de naissance pour parler de Newton, il est naturel
de prendre la notion de ville comme point de départ. L'étude des cooccurrents
de prendre la notion de ville comme point de départ. L'étude des cooccurrents
syntaxiques offre la possibilité de voir les constructions dans lequelles le
syntaxiques introduits à la section \ref{alr} (voir p.\pageref{alr}) offre la
terme «ville» est utilisé.
possibilité d'observer les constructions dans lesquelles un terme comme «ville»
est employé.
Dans le Lexicoscope [@kraif_lexicoscope_2016], une requête sur le lemme «ville»
(formulée en langage TQL[^tql] dans le code source \ref{lst:tql_ville}) peut
Concrètement, cette technique permet de trouver les mots les plus fréquemment
être utilisée pour mesurer les scores d'associations avec ce lemme des
associés à un motif donné à partir de considérations statistiques. En se basant
différents tokens possibles.
sur les liens de syntaxe plutôt que sur l'ordre des mots dans la phrase, elle
s'affranchit de la notion de fenêtre de recherche présente habituellement dans
ce type de mesure et peut détecter des cooccurrents pertinents n'importe où dans
les phrases où le motif apparaît. Dans le Lexicoscope [@kraif_lexicoscope_2016],
une telle requête sur lemme «ville» étiqueté `NOUN` (nom commun) se formule en
langage TQL[^tql] (voir le code source \ref{lst:tql_ville}).
\begin{lstlisting}[caption=Requête TQL sur le lemme «ville» annoté \texttt{NOUN}
\begin{lstlisting}[caption=Requête TQL sur le lemme «ville» annoté \texttt{NOUN}
(nom commun), label=lst:tql_ville]
(nom commun), label=lst:tql_ville]
...
@@ -146,9 +151,11 @@ suggérer qu'on qualifie bien plus volontiers une ville de «petite» que de
...
@@ -146,9 +151,11 @@ suggérer qu'on qualifie bien plus volontiers une ville de «petite» que de
Le Lexicoscope permet ensuite de générer automatiquement une autre requête qui
Le Lexicoscope permet ensuite de générer automatiquement une autre requête qui
intègre un des cooccurrents parmi ces résultats. Cette fonctionnalité correspond
intègre un des cooccurrents parmi ces résultats. Cette fonctionnalité correspond
à une étape du procédé itératif permettant de construire progressivement un
à une étape du procédé itératif permettant de construire progressivement un
[@=ALR] \(voir la section \ref{alr} p.\pageref{alr}). La nouvelle requête
[@=ALR], équivalents de la méthode des «segments répétés» pour les cooccurrents
obtenue pour le premier résultat, le déterminant «ce», est reproduite à
syntaxiques. La nouvelle requête obtenue pour le premier résultat, le
l'extrait de code \ref{lst:tql_ce_ville}.
déterminant «ce», revient à chercher les plus forts cooccurrents du motif «cette
ville». L'extrait de code \ref{lst:tql_ce_ville} montre cette requête formulée
en TQL.
\begin{lstlisting}[caption=Requête TQL sur la mise en relation syntaxique
\begin{lstlisting}[caption=Requête TQL sur la mise en relation syntaxique
quelconque du lemme «ce» annoté comme \texttt{DET} et du lemme «ville» annoté
quelconque du lemme «ce» annoté comme \texttt{DET} et du lemme «ville» annoté
...
@@ -170,7 +177,7 @@ moins de 10% de celle obtenue par la préposition «dans».
...
@@ -170,7 +177,7 @@ moins de 10% de celle obtenue par la préposition «dans».
{#fig:ce_ville_lemma_geode}
{#fig:ce_ville_lemma_geode}
En suivant ce nouveau coocurrent «dans» on construit la requête
En suivant ce nouveau cooccurrent «dans» on construit la requête
\ref{lst:tql_dans_ce_ville}, dont un équivalent sous forme d'arbre syntaxique en
\ref{lst:tql_dans_ce_ville}, dont un équivalent sous forme d'arbre syntaxique en
dépendances est visible à la figure \ref{fig:dans_cette_ville_tree} pour plus de
dépendances est visible à la figure \ref{fig:dans_cette_ville_tree} pour plus de
clarté. Les astérisques sur les deux arêtes partant du nœud `ville_NOUN`
clarté. Les astérisques sur les deux arêtes partant du nœud `ville_NOUN`
...
@@ -199,7 +206,7 @@ label=lst:tql_dans_ce_ville]
...
@@ -199,7 +206,7 @@ label=lst:tql_dans_ce_ville]
{#fig:dans_cette_ville_tree width=20%}
{#fig:dans_cette_ville_tree width=20%}
En recherchant ce troisième motif, on obtient le lexicogramme de la figure
En recherchant ce troisième motif, on obtient le lexicogramme de la figure
\ref{fig:dans_ce_ville_lemma_geode} qui représente les dix coocurrents de «dans
\ref{fig:dans_ce_ville_lemma_geode} qui représente les dix cooccurrents de «dans
cette ville» avec la plus forte mesure d'association. Sur cette figure, il n'y a
cette ville» avec la plus forte mesure d'association. Sur cette figure, il n'y a
quasiment plus que des verbes et des adjectifs. Le phénomène de remontée d'un
quasiment plus que des verbes et des adjectifs. Le phénomène de remontée d'un
lemme, déjà observé au cours du processus, se produit à nouveau avec l'adjectif
lemme, déjà observé au cours du processus, se produit à nouveau avec l'adjectif
...
@@ -208,7 +215,7 @@ lemme, déjà observé au cours du processus, se produit à nouveau avec l'adjec
...
@@ -208,7 +215,7 @@ lemme, déjà observé au cours du processus, se produit à nouveau avec l'adjec
cette ville». De la même manière, le verbe «mourir» prend le deuxième rang,
cette ville». De la même manière, le verbe «mourir» prend le deuxième rang,
alors qu'il n'était que sixième pour «cette ville». De plus, le troisième rang
alors qu'il n'était que sixième pour «cette ville». De plus, le troisième rang
est occupé par le verbe «naître», absent jusqu'ici des résultats mais de sens
est occupé par le verbe «naître», absent jusqu'ici des résultats mais de sens
contraire à «mourir» et proche de l'adjectif «natal» discuté lors de l'analyse
contraire à «mourir» et proche de l'adjectif «natal» observé lors de l'analyse
de la figure \ref{fig:ville_lemma_geode}. À travers ce vocabulaire susceptible
de la figure \ref{fig:ville_lemma_geode}. À travers ce vocabulaire susceptible
d'apparaître dans des contenus biographiques, on retrouve le procédé utilisé
d'apparaître dans des contenus biographiques, on retrouve le procédé utilisé
dans l'article WOLSTROPE à l'origine de cette étude. Toutefois, en étant parti
dans l'article WOLSTROPE à l'origine de cette étude. Toutefois, en étant parti
...
@@ -481,10 +488,10 @@ importance particulière accordée à la Philosophie. Alors que Newton est surto
...
@@ -481,10 +488,10 @@ importance particulière accordée à la Philosophie. Alors que Newton est surto
considéré actuellement comme un physicien, sa contribution est particulièrement
considéré actuellement comme un physicien, sa contribution est particulièrement
valorisée dans les pages de l'*EDdA* et mise en regard de celles de Descartes et
valorisée dans les pages de l'*EDdA* et mise en regard de celles de Descartes et
de Leibnitz qu'il a affronté sur certains problèmes. Les trois savants se
de Leibnitz qu'il a affronté sur certains problèmes. Les trois savants se
retrouvent dans des contextes similaires, et ont des coocurrents très proches:
retrouvent dans des contextes similaires, et ont des cooccurrents très proches:
des mots comme «analyse», «philosophie», «calcul», «principes» et «démontrés» et
des mots comme «analyse», «philosophie», «calcul», «principes» et «démontrés» et
même plus directement leurs noms (par exemple `"Newton"` et `"Descartes"` sont
même plus directement leurs noms (par exemple `"Newton"` et `"Descartes"` sont
dans les cinq coocurrents les plus forts de `"Leibnitz"` et il en va de même
dans les cinq cooccurrents les plus forts de `"Leibnitz"` et il en va de même
pour les deux autres combinaisons qu'on peut former de leurs trois noms). Et on
pour les deux autres combinaisons qu'on peut former de leurs trois noms). Et on
constate même qu'à la différence des autres physiciens il possède lui aussi un
constate même qu'à la différence des autres physiciens il possède lui aussi un
article à son nom: NEWTONIANISME (L'Encyclopédie, T11, p.122), reformulé en
article à son nom: NEWTONIANISME (L'Encyclopédie, T11, p.122), reformulé en