diff --git a/Classification/Models.md b/Classification/Models.md index e7c8458a52d0a71e562026abd250706da3c70748..a6cf0265342d16e05127b00a6e7decc6a44efbf3 100644 --- a/Classification/Models.md +++ b/Classification/Models.md @@ -150,7 +150,7 @@ artificiellement élevés sur le jeu de validation mais les rendrait bien plus mauvais pour prolonger la classification sur les articles qui justement n'en sont pas pourvus). Enfin, la ponctuation et les mots vides — déterminants, prépositions, pronom etc. en reprenant la distinction de -@lehmann_lexicologie_2018[chap.1 §8] — sont retirés des textes et les mots +@lehmann_lexicologie_2018[chap.1, §1.2.2] — sont retirés des textes et les mots restants sont lemmatisés[^lefff]. Cette dernière étape est contournée pour les modèles de la famille *BERT* (ligne 4. dans la liste précédente) puisque ces modèles peuvent recevoir en entrée des textes complets et la version des textes diff --git a/Contrastes/Contours.md b/Contrastes/Contours.md index 01cfca75c7580f75d54db0bb0f156e15707f8b9c..4a712eeadbd6583138f9914a721a3a42b48ec2c4 100644 --- a/Contrastes/Contours.md +++ b/Contrastes/Contours.md @@ -579,7 +579,7 @@ encyclopédie pour être remplacée dans la suivante par une autre avec la même vedette mais sans lien sémantique avec l'entrée initiale. Si la vedette commune à une paire d'entrées est un nom propre, il s'agira de vérifier qu'elles décrivent bien la même entité; pour les vedettes relevant des autres catégories -morphosyntaxiques, comme le proposent @lehmann_lexicologie_2018[chap.5 §11-13] +morphosyntaxiques, comme le proposent @lehmann_lexicologie_2018[chap.5, §1.3] l'étymologie complétée de critères sémantiques lorsqu'une évolution forte a éloigné les termes permettront de distinguer les polysémies, intéressantes à étudier, des simples homonymies et ce même si le sens utilisé dans une des diff --git a/Corpus/Application.md b/Corpus/Application.md index 749914b1365ec001d7752934324db64b3efedb54..b6ff4f887d7c2db67e167ea6cd9c672a5aec283e 100644 --- a/Corpus/Application.md +++ b/Corpus/Application.md @@ -209,7 +209,7 @@ diffère donc en toute rigueur. \end{figure} \label{sec:domain_groups}L'[@=ARTFL] a réduit ce nombre à 2 620 classes -normalisées [@horton2009mining, §3] qui correspondent dans l'encodage +normalisées [@horton2009mining, ¶3] qui correspondent dans l'encodage XML-[@=TEI] de l'œuvre à l'attribut `normclass`. À partir des mêmes données, l'[@=ENCCRE] a créé manuellement une liste de 2 160 «désignants explicités» , prenant également en compte les tournures évoquées précédemment à la section diff --git "a/Corpus/\305\222uvres.md" "b/Corpus/\305\222uvres.md" index 33012daca4904b47ec0e784f31280a75d331115f..745efc3ced34774b22885ba10dda9805e590ae4c 100644 --- "a/Corpus/\305\222uvres.md" +++ "b/Corpus/\305\222uvres.md" @@ -430,7 +430,7 @@ encyclopédies ont ainsi commencé à la matérialiser au début des articles. Les systèmes de classification choisis par les éditeurs d'une encyclopédie reflètent le contexte spécifique des débats intellectuels contemporains de sa publication, qui peut transparaître par exemple dans l'emploi d'un désignant -plutôt qu'un autre comme le montre @viard_lutilite_2006[§33]. Les encyclopédies +plutôt qu'un autre comme le montre @viard_lutilite_2006[¶33]. Les encyclopédies sont donc un terrain particulièrement intéressant pour étudier comment la classification de la connaissance change au cours du temps. Dans le cadre de cette thèse, la notion de classification permet surtout d'accéder en première @@ -461,7 +461,7 @@ Dans l'*EDdA*, l'organisation de la connaissance intègre non seulement les sciences mais également les arts et les métiers. Elle est fondée sur une autre partition en trois, celle proposée par Bacon qui rattache tout savoir aux facultés humaines de la mémoire, l'imagination et la raison [@jaquet_bacon_2010, -§10]. Cette distinction est fondamentale dans la démarche des encyclopédistes: +¶10]. Cette distinction est fondamentale dans la démarche des encyclopédistes: revendiquée par d'Alembert dès le Discours Préliminaire (L'Encyclopédie, T1, p.xvj), elle est aussi visible dans les trois colonnes qui partagent le «Systême figuré des connoissances humaines» reproduit à la figure @@ -476,10 +476,10 @@ structure transversalement les articles et suggère des navigations de l'œuvre, véritables liens «hypertextes» avant l'heure [@blanchard_systeme_2002, p.47]. Les encyclopédistes ne commettent pas non plus l'erreur de prendre le «Systême» pour plus qu'il n'est: une déclaration d'intention et non pas une «grille fixe» -[@cernuschi_designants_2006, §3] dans lequel les articles devraient à tout prix +[@cernuschi_designants_2006, ¶3] dans lequel les articles devraient à tout prix trouver leur place. Des branches de l'arbre demeurent sans articles et à l'inverse des articles sont affectés à des domaines qui ne sont pas mentionnés -par le «Systême figuré» [@leca_tsiomis_tentative_2006, §4]. +par le «Systême figuré» [@leca_tsiomis_tentative_2006, ¶4]. {#fig:systeme_figure} @@ -530,20 +530,20 @@ chimistes et les chrétiens. {#fig:aaa_t1 width=60%} -À la suite de @leca_tsiomis_tentative_2006[§15], on réservera le terme de +À la suite de @leca_tsiomis_tentative_2006[¶1], on réservera le terme de «désignant» aux formes marquées typographiquement, placées entre parenthèse en début d'article. Les désignants sont en toute rigueur un cas particulier de marques de domaine mais on utilisera les deux termes en opposition, pour distinguer les marques de domaine qui ne sont pas des désignants. Les désignants résultent d'une simplification et d'une codification au fil du temps des marques -de domaine, leurs «ancêtres» d'après @leca_tsiomis_tentative_2006[§8]. Ils sont +de domaine, leurs «ancêtres» d'après @leca_tsiomis_tentative_2006[¶8]. Ils sont en effet absents d'œuvres antérieures comme le *Dictionnaire Universel* de Basnage ou même de la 3ème édition du *Dictionnaire de Trévoux* (celle de 1743). Dans ces œuvres en revanche, des occurrences de «en termes de» se rapprochent des débuts d'articles là où se trouverait un désignant. C'est dans la *Cyclopedia* de Chambers que le mot «terme» disparaît, restant sous-entendu puisque l'œuvre est un recueil de terminologie [@leca_tsiomis_tentative_2006, -§12], laissant apparaître le nom de la discipline seule. Dans l'*EDdA*, le +¶12], laissant apparaître le nom de la discipline seule. Dans l'*EDdA*, le concept de désignant est tout à fait né et des marques de domaine se trouvent même parfois entourées de parenthèses quand elles apparaîssent à la même place, comme c'est le cas aux articles BIZEGLE — «(chez les Cordonniers)» @@ -606,7 +606,7 @@ partie de la préface, la démarche encyclopédique consiste à révéler les li qui relient tous les savoirs humains et à les organiser, partant des faits concrets pour généraliser vers l'abstraction et établir ainsi ce qui constitue les «lois naturelles». Mais à la suite de d'Alembert qui comme le fait remarquer -@hardestydoig_designant_2006[§1] reconnaît la part d'arbitraire inhérente à tout +@hardestydoig_designant_2006[¶1] reconnaît la part d'arbitraire inhérente à tout «système» (toujours dans le *Discours préliminaire*), les auteurs ont bien conscience qu'il n'y a pas de preuve que l'ensemble des connaissances admette un ordre. La volonté d'y trouver une logique pourrait simplement s'expliquer par la @@ -809,7 +809,7 @@ connu joué par l'association de ces deux disciplines à l'école dans la constitution d'une identité nationale, qui trouve son impulsion dans la Révolution Française et n'a été remise en cause ni par les empires ni par les républiques ultérieures pour culminer dans les célèbres lois «Jules Ferry» -[@chevalier_geographie_2013, §2 et 3]. +[@chevalier_geographie_2013, ¶¶2 et 3]. Au travers des analyses présentées dans cette section, la notion de domaine de connaissance apparaît donc bien comme fondamentale. Elle joue un rôle central diff --git a/Introduction/Cadre.md b/Introduction/Cadre.md index 9c370dc81002b143757b5a421bbd0df261fc1485..867bfc52196c1499c044cf1927af2ee47c5bb596 100644 --- a/Introduction/Cadre.md +++ b/Introduction/Cadre.md @@ -99,13 +99,13 @@ grand public et la géographie appliquée. L'École des géographes forme depuis utiles aux états-majors dans les nombreux conflits qui parsèment le XIX^ème^ siècle. Avec la période révolutionnaire, l'école reçoit la charge de former des citoyens dont les connaissances doivent progressivement intégrer de la -géographie [@chevalier_geographie_2013, §2; @todorov_enseigner_2018, §15]. La +géographie [@chevalier_geographie_2013, ¶2; @todorov_enseigner_2018, ¶15]. La géographie est aussi mise à contribution, associée à l'histoire, pour développer le sentiment national qui émerge au XIX^ème^ siècle non seulement en France dès 1833 et jusqu'aux célèbres lois «Jules Ferry» qui mettent en avant la puissance coloniale française dans les programmes de géographie -[@chevalier_geographie_2013, §3] mais aussi ailleurs en Europe, comme en Italie, -en Allemagne ou en Hollande [@todorov_enseigner_2018, §§1 et 9]. Vers la fin du +[@chevalier_geographie_2013, ¶3] mais aussi ailleurs en Europe, comme en Italie, +en Allemagne ou en Hollande [@todorov_enseigner_2018, ¶¶1 et 9]. Vers la fin du XIX^ème^ siècle la Géographie se hisse enfin au rang de véritable discipline scientifique grâce à des auteurs comme Vidal de la Blache. diff --git "a/\303\211dlA/Historique.md" "b/\303\211dlA/Historique.md" index 5be5997b407ee3fab2b1e5597b1a185d72419d01..371eb34898283e1a3ecf7b1971d588225230df0e 100644 --- "a/\303\211dlA/Historique.md" +++ "b/\303\211dlA/Historique.md" @@ -14,10 +14,10 @@ esquissée dans la section \ref{sec:EdlA_lexicography} et de la développer. Aux origines de cette lignée, il est d'abord question de «Traduction Automatique» (TA) et le domaine de recherche est surtout exploré pour ses -applications potentielles, notamment militaires [@leon_cnrs_2002, §5]. Ainsi ça +applications potentielles, notamment militaires [@leon_cnrs_2002, ¶5]. Ainsi ça n'est pas «[@=TAL]» mais seulement «TA» qu'il faut reconnaître dans «ATALA», le nom de l'Association pour l'étude et le développement de la Traduction Automatique -et de la Linguistique Appliquée[^ATALA] créée en 1959 [@leon_cnrs_2002, §1]. +et de la Linguistique Appliquée[^ATALA] créée en 1959 [@leon_cnrs_2002, ¶1]. [^ATALA]: [https://www.atala.org/](https://www.atala.org/) @@ -103,7 +103,7 @@ Au départ, ces nouvelles méthodes représentent seulement un moyen d'accélér les recherches en décuplant la capacité des linguistes à aller trouver des exemples. En effet à partir des années 1960 la lecture attentive de textes pour repérer des occurrences de motifs, par exemples syntaxiques, est jugée trop -inefficace [@leon_cnrs_2002, §63] et les équipes s'emploient à automatiser leur +inefficace [@leon_cnrs_2002, ¶63] et les équipes s'emploient à automatiser leur détection. Le projet de Wittgenstein de fonder le sens des mots sur leur emploi peut enfin être réalisé en étudiant leur «vrai» usage dans de grands échantillons de productions des locuteurs plutôt que de se satisfaire diff --git "a/\303\211dlA/Lexicographie.md" "b/\303\211dlA/Lexicographie.md" index 4c716217a3a2ee1f1069ad87213e1aa22ca87552..bcfbf4d23ad826329eb8bdd6d58d7a02bf859cca 100644 --- "a/\303\211dlA/Lexicographie.md" +++ "b/\303\211dlA/Lexicographie.md" @@ -75,7 +75,7 @@ appris par les enfants lors de l'acquisition du langage). S'il reste possible de définir certains d'entre eux en intension (au prix d'une description introduisant plusieurs nouveaux mots pour chacun) d'autres, typiquement ceux rattachés à des qualia comme la couleur ne peuvent espérer recevoir qu'une -définition extensionnelle [@lehmann_lexicologie_2018, chap.2, §14] +définition extensionnelle [@lehmann_lexicologie_2018, chap.2, §2] nécessairement incomplète (il est possible d'énumérer *des* objets de couleur rouge mais pas tous ces objets). Mais sans explications ni liens, une expérience du monde ne constitue pas une définition, ce qui fait écrire à @@ -178,7 +178,7 @@ automatiques avec des succès parfois en dessous des attentes initiales selon [^stanza_lemmatizer]: [https://stanfordnlp.github.io/stanza/lemma.html#improving-the-lemmatizer-by-providing-key-value-dictionary](https://stanfordnlp.github.io/stanza/lemma.html#improving-the-lemmatizer-by-providing-key-value-dictionary) -En ce qui concerne la métalexicographie, @zhu_discours_2022[§8] fait observer +En ce qui concerne la métalexicographie, @zhu_discours_2022[p.129] fait observer que les dictionnaires constituent «un excellent terrain d'expérimentation» et les encyclopédies intéressent par nature non seulement les nombreuses disciplines des discours qui s'y déploient mais aussi la philosophie et @@ -195,13 +195,13 @@ traduction latine, une définition rédigée en français tant que tel est un phénomène progressif mais un palier important a été atteint avec le *Dictionnaire Universel* de Furetière en 1690 qui dépasse le cadre du seul langage pour s'intéresser aux choses [@leca_tsiomis_dictionnaires_2009, -§§5-9]. Bien qu'on puisse lui reprocher certaines lacunes, sa deuxième édition, +¶¶5-9]. Bien qu'on puisse lui reprocher certaines lacunes, sa deuxième édition, parue en 1701 et évoquée à la section \ref{sec:EdlA_tei_applications}, achève d'offrir au *Furetière* sa place dans l'histoire de l'encyclopédisme en Europe et en fait un précurseur important de l'*EDdA*. Le mouvement se poursuit dans le reste du XVIII^ème^ siècle, période très étudiée pour la richesse des innovations dans les dictionnaires universels et les encyclopédies -[@leca_tsiomis_ecrire_1995, §10]. La première édition du *Dictionnaire Universel +[@leca_tsiomis_ecrire_1995]. La première édition du *Dictionnaire Universel François et Latin*, couramment appelé le *Dictionnaire de Trévoux* est publiée par les jésuites (catholiques au contraire de Basnage qui était protestant) en 1704, peu après la parution du *Furetière* dont il reprend assez d'éléments pour diff --git "a/\303\211dlA/XML-TEI.md" "b/\303\211dlA/XML-TEI.md" index 44a77a7d0f0c830c9a7fe427b00fdf071bfaa12a..6b311bab2a7e5dd4dc671ad1a362a0994523a367 100644 --- "a/\303\211dlA/XML-TEI.md" +++ "b/\303\211dlA/XML-TEI.md" @@ -148,7 +148,7 @@ De la même façon qu'ALTO, XML-[@=TEI] est donc un dialecte du XML obtenu en définissant un schéma. Celui du format [@=TEI] est publié et maintenu par la *Text Encoding Initiative*[^tei-c], un collectif de volontaires issus du monde de la recherche. Cette organisation a été créée en 1988 -[@ide_encodingstandards_1995, §5; @huitfeldt_multidimensional_1994, p.237] suite +[@ide_encodingstandards_1995, ¶5; @huitfeldt_multidimensional_1994, p.237] suite aux principes adoptés en novembre 1987 à la conférence de Vassar [@ide_text_1995, p.2]. La [@=TEI] publie ses premières recommandations en novembre 1990 [@ide_text_1995, p.11], la [@=TEI] P1 (*Proposal 1*, «proposition