Skip to content
Snippets Groups Projects
Commit 002d7ed4 authored by Alice Brenon's avatar Alice Brenon
Browse files

Phrasing improvement in new naître/mourir analysis

parent 5e8be403
No related branches found
No related tags found
No related merge requests found
......@@ -100,13 +100,14 @@ Géographie de l'*EDdA* pour écrire des Biographies».
Les réflexions préliminaires de cette section amènent d'abord à examiner les
relations entre la biographie et les différents domaines de connaissance pour
déterminer si les contenus biographiques sont particulièrement présent dans la
Géographie ou si le fait que les exemples connus de biographie dans l'*EDdA*
apparaissent dans ses articles ne relève que du hasard. En partant du cas de
WOLSTROPE (L'Encyclopédie, T17, p.630), qui utilise sa ville de naissance pour
parler de Newton, il est naturel de prendre la notion de ville comme point de
départ. L'étude des cooccurrents syntaxiques offre la possibilité de voir les
constructions dans lequelles le terme «ville» est utilisé.
déterminer si les contenus biographiques sont réellement plus présents dans la
Géographie ou si ce n'est qu'une impression donnée par le fait que les exemples
connus de contenus biographiques dans l'*EDdA* apparaissent tous dans cette
discipline. En partant du cas de WOLSTROPE (L'Encyclopédie, T17, p.630), qui
utilise sa ville de naissance pour parler de Newton, il est naturel de prendre
la notion de ville comme point de départ. L'étude des cooccurrents syntaxiques
offre la possibilité de voir les constructions dans lequelles le terme «ville»
est utilisé.
Dans le Lexicoscope [@kraif_lexicoscope_2016], une requête sur le lemme «ville»
(formulée en langage TQL[^tql] dans le code source \ref{lst:tql_ville}) peut
......@@ -122,24 +123,24 @@ différents tokens possibles.
[http://phraseotext.univ-grenoble-alpes.fr/lexicoscope_beta/doc/Reference%20TQL.fr.pdf](http://phraseotext.univ-grenoble-alpes.fr/lexicoscope_beta/doc/Reference%20TQL.fr.pdf)
La figure \ref{fig:ville_lemma_geode} représente l'histogramme des dix mesures
les plus élevées. Sur cette figure, le déterminant «ce» apparaît comme
cooccurrent principal de «ville». Il est intéressant de constater qu'il obtient
même un score d'association (22 958) supérieur à celui de l'adjectif «natal»
(18 773): alors que la nature d'un déterminant fait qu'il peut potentiellement
être utilisé avec n'importe quel nom commun (pas seulement ville), l'ensemble
des noms que peut qualifier un adjectif donné est bien plus restreint par des
considérations sémantiques. En effet, «ce» peut déterminer aussi bien «ville»
que «procédé» par exemple, mais la séquence «procédé natal» n'a aucun sens
évident et donc virtuellement aucune chance d'apparaître dans un texte, à part
sous forme de contre-exemple comme dans cette phrase. Deux autres mots outils
figurent parmi les cinq premiers cooccurrents. Ce sont le déterminant «le»
(intéressant par comparaison avec «ce») et la préposition «dans» qui suggère
l'emploi du concept de ville comme d'un cadre narratif dans lequel se produit
les événements qui intéressent les articles. Un deuxième adjectif, «petit»,
obtient également un score proche: l'asymétrie que crée cette observation par
rapport au contraire «grand» semble suggérer qu'on qualifie bien plus volontiers
une ville de «petite» que de «grande» dans les pages des encyclopédies du
corpus.
les plus élevées obtenues pour cette requête. Sur cette figure, le déterminant
«ce» apparaît comme cooccurrent principal de «ville». Il est intéressant de
constater qu'il obtient même un score d'association (22 958) supérieur à celui
de l'adjectif «natal» (18 773): alors que la nature d'un déterminant fait qu'il
peut potentiellement être utilisé avec n'importe quel nom commun (pas seulement
ville), l'ensemble des noms que peut qualifier un adjectif donné est bien plus
restreint par des considérations sémantiques. En effet, «ce» peut déterminer
aussi bien «ville» que «procédé» par exemple, alors qu'une séquence comme
«procédé natal» n'a aucun sens évident et donc virtuellement aucune chance
d'apparaître dans un texte, à part sous forme de contre-exemple comme dans cette
phrase. Deux autres mots outils figurent parmi les cinq premiers cooccurrents.
Ce sont le déterminant «le» (intéressant par comparaison avec «ce») et la
préposition «dans» qui suggère l'emploi du concept de ville comme d'un cadre
circonstanciel dans lequel se produisent les événements qui intéressent les
articles. Un deuxième adjectif, «petit», obtient également un score proche:
l'asymétrie que crée cette observation par rapport au contraire «grand» semble
suggérer qu'on qualifie bien plus volontiers une ville de «petite» que de
«grande» dans les pages des encyclopédies du corpus.
![Les 10 cooccurrents syntaxiques principaux du lemme «ville» annoté comme `NOUN` (nom commun)](figure/histogram/textometry/ville.png){#fig:ville_lemma_geode}
......@@ -162,9 +163,10 @@ fois avec la plus forte mesure d'association. Déjà présente sur la figure
construction que rendre compte des intéractions de «ce» et de «dans» avec
«ville» de manière séparée. Cette nouvelle mesure montre qu'en réalité les trois
éléments apparaissent fréquemment ensemble dans le syntagme «dans cette ville».
La préposition «de» suit une trajectoire semblable puis les mesures
d'associations chutent très rapidement à moins de 10% de la valeur obtenue pour
la préposition «dans», obtenues par un ensemble de verbes et de noms.
La préposition «de» suit une trajectoire semblable puis, après l'adjectif
«dernier» avec une mesure d'association de 2 662, déjà bien plus faible, les
autres valeurs chutent très rapidement pour un ensemble de verbes et de noms, à
moins de 10% de celle obtenue par la préposition «dans».
![Les 10 cooccurrents syntaxiques principaux du motif formé d'une relation syntaxique quelconque entre le lemme «ce» annoté comme `DET` et le lemme «ville» annoté comme `NOUN`](figure/histogram/textometry/ce_ville.png){#fig:ce_ville_lemma_geode}
......
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment