Skip to content
Snippets Groups Projects
Commit b603fbf1 authored by Alice Brenon's avatar Alice Brenon
Browse files

Stop using 'partition' for anything that isn't a partition in the sense of corpus linguistics

parent ea892e33
No related branches found
No related tags found
No related merge requests found
...@@ -483,7 +483,7 @@ partie de la composante supérieure (ce qui est assez surprenant avec une ...@@ -483,7 +483,7 @@ partie de la composante supérieure (ce qui est assez surprenant avec une
perspective contemporaine très théorique de ces deux disciplines). La perspective contemporaine très théorique de ces deux disciplines). La
*Géographie*, quant à elle, se situe bien dans la composante inférieure ce qui *Géographie*, quant à elle, se situe bien dans la composante inférieure ce qui
semble traduire — si l'on accepte l'interprétation précédentes des deux semble traduire — si l'on accepte l'interprétation précédentes des deux
partitions — un domaine qui compile des informations plus qu'il ne décrit des groupes — un domaine qui compile des informations plus qu'il ne décrit des
procédés. procédés.
[^2arêtes]: ce fait peut sembler déconcertant mais correspond aux pluriels entre [^2arêtes]: ce fait peut sembler déconcertant mais correspond aux pluriels entre
......
...@@ -215,8 +215,8 @@ France elle-même) que des colonies mais la nature des statistiques rapportées ...@@ -215,8 +215,8 @@ France elle-même) que des colonies mais la nature des statistiques rapportées
pourrait différer suivant les lieux. En revanche, la description des populations pourrait différer suivant les lieux. En revanche, la description des populations
colonisées se distingue de manière bien plus nette et révèle une vision du monde colonisées se distingue de manière bien plus nette et révèle une vision du monde
basée sur une notion de «races» hiérarchisées. Les nombres d'habitants sont basée sur une notion de «races» hiérarchisées. Les nombres d'habitants sont
souvent partitionnés suivant ce critère, par exemple aux articles PHILIPPEVILLE souvent divisés suivant ce critère, par exemple aux articles PHILIPPEVILLE (La
(La Grande Encyclopédie, T26, p.676) — ancien nom de la ville de Skikda — et Grande Encyclopédie, T26, p.676) — ancien nom de la ville de Skikda — et
ZANZIBAR (La Grande Encyclopédie, T31, p.1305). D'autres articles comme CANAQUES ZANZIBAR (La Grande Encyclopédie, T31, p.1305). D'autres articles comme CANAQUES
(La Grande Encyclopédie, T8, p.1195) ou BAMBARA (La Grande Encyclopédie, T5, (La Grande Encyclopédie, T8, p.1195) ou BAMBARA (La Grande Encyclopédie, T5,
p.192) prennent résolument le parti de caractériser les populations par des p.192) prennent résolument le parti de caractériser les populations par des
......
...@@ -30,8 +30,8 @@ l'objet du chapitre \ref{sec:corpus}. La description détaillée des deux œuvre ...@@ -30,8 +30,8 @@ l'objet du chapitre \ref{sec:corpus}. La description détaillée des deux œuvre
d'une discussion des efforts entrepris pour représenter le corpus et les d'une discussion des efforts entrepris pour représenter le corpus et les
métadonnées qui lui sont associées. Le chapitre introduit également la notion de métadonnées qui lui sont associées. Le chapitre introduit également la notion de
domaine de connaissance des articles, centrale dans le lien entre encyclopédies domaine de connaissance des articles, centrale dans le lien entre encyclopédies
et géographie et sur laquelle repose un des partitionnements du corpus utilisés et géographie et sur laquelle repose un des axes d'investigation suivis dans les
dans les études contrastives. études contrastives.
L'importance de cette notion justifie la place centrale qui lui est accordée au L'importance de cette notion justifie la place centrale qui lui est accordée au
chapitre \ref{sec:domains_classification} en tant que focale de tâches de chapitre \ref{sec:domains_classification} en tant que focale de tâches de
......
...@@ -265,8 +265,8 @@ intéressant de noter la ressemblance avec les applications de la classification ...@@ -265,8 +265,8 @@ intéressant de noter la ressemblance avec les applications de la classification
automatique pour déterminer le sujet d'un texte ou l'orientation politique de automatique pour déterminer le sujet d'un texte ou l'orientation politique de
son auteur (voir la section \ref{sec:EdlA_TAL_text_classification}). Cependant, son auteur (voir la section \ref{sec:EdlA_TAL_text_classification}). Cependant,
les deux démarches sont en réalité tout à fait opposées: alors que la finalité les deux démarches sont en réalité tout à fait opposées: alors que la finalité
des tâches de classification réside complètement dans la production d'une des tâches de classification réside complètement dans la répartition des textes
partition des textes, ces études textométriques s'attachent au contraire à dans des groupes cohérents, ces études textométriques s'attachent au contraire à
identifier les critères qui permettent de rattacher un texte à une des identifier les critères qui permettent de rattacher un texte à une des
catégories pour rendre explicite ce qui les caractérise. catégories pour rendre explicite ce qui les caractérise.
......
...@@ -110,10 +110,10 @@ articles à travers 4 éditions de l'œuvre [@grabus_representing_2019]. ...@@ -110,10 +110,10 @@ articles à travers 4 éditions de l'œuvre [@grabus_representing_2019].
Dans tous les cas évoqués ci-dessus, l'ensemble de classes à attribuer aux Dans tous les cas évoqués ci-dessus, l'ensemble de classes à attribuer aux
documents est défini en amont de l'étude. Il n'est pas pour autant indépendant documents est défini en amont de l'étude. Il n'est pas pour autant indépendant
du corpus mais correspond au contraire à un axe d'analyse que l'on suppose du corpus mais correspond au contraire à un axe d'analyse que l'on suppose
pertinent: un partitionnement suivant une sensibilité politique peut avoir un pertinent: observer une sensibilité politique peut avoir un intérêt pour classer
intérêt pour classer des discours parlementaires ou des professions de foi des discours parlementaires ou des professions de foi électorales, mais serait à
électorales, mais serait à priori beaucoup moins adapté à des prévisions priori beaucoup moins adapté à des prévisions météorologiques ou des recettes de
météorologiques ou des recettes de cuisine. cuisine.
À partir de l'ensemble de classes, un échantillon des documents doit être annoté À partir de l'ensemble de classes, un échantillon des documents doit être annoté
manuellement pour servir de référence pour l'entraînement du modèle de manuellement pour servir de référence pour l'entraînement du modèle de
...@@ -181,8 +181,8 @@ moments charnière» dans les débats politiques du Royaume-Uni. ...@@ -181,8 +181,8 @@ moments charnière» dans les débats politiques du Royaume-Uni.
des discours prononcés lors des premières années de la Révolution Française. des discours prononcés lors des premières années de la Révolution Française.
L'intérêt de cette approche est qu'elle ne requiert pas de métadonnées sur L'intérêt de cette approche est qu'elle ne requiert pas de métadonnées sur
chaque discours outre celles disponibles à la constitution du corpus d'étude et chaque discours outre celles disponibles à la constitution du corpus d'étude et
utilisées pour le partitionner (dans le cas précédent, le nom du député à qui il utilisées pour organiser les textes (dans le cas précédent, le nom du député à
est attribué et la date à laquelle il a été prononcé). qui il est attribué et la date à laquelle il a été prononcé).
Après les travaux de classification sur [@=Naive Bayes] évoqués plus haut, une Après les travaux de classification sur [@=Naive Bayes] évoqués plus haut, une
autre étude menée à l'[@=ARTFL] a consisté à utiliser la [@=LDA] pour constituer autre étude menée à l'[@=ARTFL] a consisté à utiliser la [@=LDA] pour constituer
......
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment