Skip to content
Snippets Groups Projects
Commit 4b1377f6 authored by Alice Brenon's avatar Alice Brenon
Browse files

Start describing the ALR process followed to reach the conclusion that...

Start describing the ALR process followed to reach the conclusion that considering «naître» and «mourir» would be a good idea
parent dda9f541
No related branches found
No related tags found
No related merge requests found
......@@ -98,6 +98,92 @@ Géographie de l'*EDdA* pour écrire des Biographies».
### Deux lemmes inattendus
Les réflexions préliminaires de cette section amènent d'abord à examiner les
relations entre la biographie et les différents domaines de connaissance pour
déterminer si les contenus biographiques sont particulièrement présent dans la
Géographie ou si le fait que les exemples connus de biographie dans l'*EDdA*
apparaissent dans ses articles ne relève que du hasard. En partant du cas de
WOLSTROPE (L'Encyclopédie, T17, p.630), qui utilise sa ville de naissance pour
parler de Newton, il est naturel de prendre la notion de ville comme point de
départ. L'étude des cooccurrents syntaxiques offre la possibilité de voir les
constructions dans lequelles le terme «ville» est utilisé.
Dans le Lexicoscope [@kraif_lexicoscope_2016], une requête sur le lemme «ville»
(formulée en langage TQL[^tql] dans le code source \ref{lst:tql_ville}) peut
être utilisée pour mesurer les scores d'associations avec ce lemme des
différents tokens possibles.
\begin{lstlisting}[caption=Requête TQL traduisant ces critères,
label=lst:tql_ville]
<l=ville,c=NOUN,#1>
\end{lstlisting}
[^tql]:
[http://phraseotext.univ-grenoble-alpes.fr/lexicoscope_beta/doc/Reference%20TQL.fr.pdf](http://phraseotext.univ-grenoble-alpes.fr/lexicoscope_beta/doc/Reference%20TQL.fr.pdf)
La figure \ref{fig:ville_lemma_geode} représente
l'histogramme des dix mesures les plus élevées. Sur cette figure, le déterminant
«ce» apparaît comme cooccurrent principal de «ville». Il est intéressant de
constater qu'il obtient même un score d'association (22 958) supérieur à celui
de l'adjectif «natal» (18 773): alors que la nature d'un déterminant fait qu'il
peut potentiellement être utilisé avec n'importe quel nom commun (pas seulement
ville), l'ensemble des noms que peut qualifier un adjectif donné est bien plus
restreint par des considérations sémantiques. En effet, «ce» peut déterminer
aussi bien «ville» que «procédé» par exemple, mais la séquence «procédé natal»
n'a aucun sens évident et donc virtuellement aucune chance d'apparaître dans un
texte, à part sous forme de contre-exemple comme dans cette phrase.
![Les 10 cooccurrents syntaxiques principaux du lemme «ville» annoté comme `NOUN` (nom commun)](figure/histogram/textometry/ville.png){#fig:ville_lemma_geode}
Le Lexicoscope permet ensuite de générer automatiquement une requête qui intègre
un des cooccurrents parmi ces résultats. Cette fonctionnalité correspond à une
étape du procédé itératif permettant de construire progressivement un [@=ALR].
La nouvelle requête obtenue pour le premier résultat, le déterminant «ce», est
reproduite à l'extrait de code \ref{lst:tql_ce_ville}.
\begin{lstlisting}[caption=Requête TQL traduisant ces critères,
label=lst:tql_ce_ville]
<l=ce,c=DET,#2>&&<l=ville,c=NOUN,#1>::(.*,1,2)
\end{lstlisting}
Son exécution sur le même corpus permet d'obtenir la figure
\ref{fig:ce_ville_lemma_geode} qui montre l'association prééminente de la
préposition «dans» avec l'ébauche de motif «cette ville».
![Les 10 cooccurrents syntaxiques principaux du lemme «ville» annoté comme `NOUN` (nom commun)](figure/histogram/textometry/ville.png){#fig:ville_lemma_geode}
\begin{figure}
\centering
\begin{subfigure}[b]{\textwidth}
\includegraphics{figure/histogram/textometry/ce_ville.png}
\caption{Les 10 cooccurrents syntaxiques principaux du motif}
\label{fig:ce_ville_lemma_geode}
\end{subfigure}
\caption{Recherche du motif formé d'une relation syntaxique quelconque entre
le lemme «ce» annoté comme \texttt{DET} et le lemme «ville» annoté comme \texttt{NOUN}}
\label{fig:ville_geode}
\end{figure}
En suivant ce nouveau coocurrent on construit la requête
\ref{lst:tql_dans_ce_ville}, dont un équivalent sous forme d'arbre syntaxique en
dépendances est visible à la figure \ref{fig:dans_cette_ville_tree} pour plus de
clarté. Les astérisques sur les deux arêtes partant du nœud `ville_NOUN`
représentent l'absence de contrainte sur les relations qui relient «ville»
respectivement à «dans» et à «ce». En pratique, on peut s'attendre à ce que ces
relations soient réalisées par un `case` pour «dans» et par un `det` pour
«ce»[^UDdeps] mais le motif demeure flexible sur ce point.
[^UDdeps]:
[https://universaldependencies.org/u/dep/index.html](https://universaldependencies.org/u/dep/index.html)
\begin{lstlisting}[caption=Requête TQL traduisant ces critères,
label=lst:tql_dans_ce_ville]
<l=dans,c=PREP,#3>&&<l=ce,c=DET,#2>&&<l=ville,c=NOUN,#1>
::(.*,1,2)(.*,1,3)
\end{lstlisting}
![Représentation de la syntaxe en dépendance du syntagme «dans cette ville»](figure/syntax/dans_ce_ville.png){#fig:dans_cette_ville_tree width=20%}
### L'influence des domaines {#sec:biography_domains}
Puisque des éléments biographiques apparaissent dans un article d'histoire de la
......
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment