Skip to content
Snippets Groups Projects
Commit 0caed5f7 authored by Alice Brenon's avatar Alice Brenon
Browse files

Fix awkward and vague statements about the importance of 'text' in linguistics...

Fix awkward and vague statements about the importance of 'text' in linguistics + stand corrected on the position of the london school fo linguistics regarding that topic
parent 9602711e
No related branches found
No related tags found
No related merge requests found
......@@ -17,21 +17,25 @@ réunir un tel ensemble, il est utile de commencer par s'interroger sur la notio
de «texte» puisque c'est par rapport à elle que sera définie celle de corpus.
\label{text_polysemy}Le terme est assez fortement polysémique puisqu'il peut
être utilisé tant pour désigner une unité d'analyse comme c'est le cas ici que
pour signifier une production écrite (par opposition à orale) ainsi que la
«matière» qu'étudient certains linguistes. @rastier_textes_1996[p.19] définit la
notion comme «une suite linguistique empirique attestée, produite dans une
pratique sociale déterminée, et fixée sur un support quelconque». La définition
semble étrangement longue et complexe: l'objet apparaît évident et est bien peu
discuté dans la littérature sur la linguistique appliquée par rapport à celle de
domaines comme la sémiotique [@rastier_semiotique_2001]. La linguistique semble
lui préférer comme objet d'étude les systèmes complets que représentent les
langages dans leur ensemble ou bien les productions langagières jusqu'au niveau
de la phrase, celui où se déploie la syntaxe, «niveau ultime» selon Benveniste
[@rastier_genres_1999, p.83]. Parmi les quelques sens attribués au mot «texte»
au début de ce paragraphe, si c'est bien le premier qui intéresse cette section,
le dernier — le texte comme «matière» — joue un rôle important dans le reste de
cette thèse et il faut en dire quelques mots.
être utilisé tant pour désigner une unité sémantique d'usage du langage
[@halliday_cohesion_1976, pp.1-2] qu'une simple «matière» travaillée par les
méthodes automatiques évoquées à la section \ref{sec:EdlA_TAL}
(p.\pageref{sec:EdlA_TAL}) voire pour signifier dans la langue courante une
production écrite (par opposition à orale). @rastier_textes_1996[p.19] définit
la notion comme «une suite linguistique empirique attestée, produite dans une
pratique sociale déterminée, et fixée sur un support quelconque». Comme pour de
nombreux objets linguistiques, l'évidence apparente dont la notion peut sembler
relever s'estompe en essayant de mieux la cerner. Elle engendre dans la
communauté linguistique des débats dont la définition technique précédente
représente une prise de position qui refuse de «fixer dans la phrase le niveau
ultime» [@benveniste_problemes_1966, p.131] et nourrit la réflexion de domaines
comme la sémiotique [@rastier_semiotique_2001]. Dans le cadre de cette section,
la notion de texte envisagée se rapproche de la définition de Halliday & Hasan
sans en conserver toute la porté conceptuelle puisque la cohérence sémantique
des textes établit surtout la base de la segmentation des œuvres utilisée pour
l'analyse. Le dernier sens évoqué ci-dessus — le texte comme «matière» — joue un
rôle important dans le reste de cette thèse et il faut d'abord en dire quelques
mots.
Les deux emplois sont presque contraires; car le texte comme unité se définit
implicitement par ses contours, par contraste avec les autres textes qui en sont
......@@ -40,15 +44,15 @@ notion de frontière ne s'y applique plus. D'ailleurs, dans le premier cas
«texte» est dénombrable alors que dans le second, traité véritablement comme un
continu, il se retrouve manipulé comme une quantité indénombrable:
@rastier_genres_1999[p.85] marquent cette opposition entre *des* et *du*
texte(s). L'emploi indénombrable convient assez bien à l'école londonienne qui
cherche le sens des mots dans une nasse d'emplois la plus grande possible
[@krishnamurthy_corpusdriven_2008, p.232] : «faites confiance au texte» («Trust
the text») exhorte @sinclair_trust_2004 — l'emploi indénombrable est ici clair,
personne ne se demande «auquel ?». Cet emploi est encore plus répandu dans les
méthodes d'[@=AA] traitées à la fin de la section \ref{sec:EdlA_TAL} où «texte»
ne désigne souvent plus que la nature des données en entrée — par opposition à
«image» ou «audio» — souvent même qualifiées de texte «brut» (voir la section
\ref{sec:text_format} à ce sujet).
texte(s). L'école londonienne perçoit l'importance cruciale de la taille des
corpus pour produire des descriptions exhaustives des lexiques
[@krishnamurthy_corpusdriven_2008, pp.232-233] mais l'attention que porte par
exemple @sinclair_trust_2004 à l'authenticité et à l'intégrité *des* textes
l'empêche de considérer le texte comme une simple substance. En revanche cet
emploi prévaut dans les méthodes d'[@=AA] traitées à la fin de la section
\ref{sec:EdlA_TAL} où «texte» ne désigne souvent plus que la nature des données
en entrée — par opposition à «image» ou «audio» — souvent même qualifiées de
texte «brut» (voir la section \ref{sec:text_format} à ce sujet).
Une distinction semblable se retrouve dans la manière dont le texte ou les
textes peuvent être assemblés pour former un corpus d'étude.
......
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment