Skip to content
Snippets Groups Projects
Commit d31c0052 authored by Alice Brenon's avatar Alice Brenon
Browse files

Remove phrase which distracted from the point of the whole sentence

parent 10e829cd
No related branches found
No related tags found
No related merge requests found
...@@ -535,30 +535,29 @@ Mais la reproductibilité (au sens large à nouveau, hors de celui défini par l ...@@ -535,30 +535,29 @@ Mais la reproductibilité (au sens large à nouveau, hors de celui défini par l
tableau \ref{table:reproducibility_4_flavours}) peut également apporter aux tableau \ref{table:reproducibility_4_flavours}) peut également apporter aux
phases d'investigation des [@=HN]. La nature irrégulière des objets d'étude gêne phases d'investigation des [@=HN]. La nature irrégulière des objets d'étude gêne
le développement de traitements s'appliquant parfaitement à toutes les données. le développement de traitements s'appliquant parfaitement à toutes les données.
À l'échelle mésoscopique du présent corpus — la taille proverbialement grande À l'échelle mésoscopique du présent corpus — la taille des encyclopédies est
des encyclopédies empêche une étude qualitative d'une des œuvres en détail, à proverbialement grande des encyclopédies, mais les volumes de données en jeu
fortiori de deux, mais les volumes de données en jeu restent très largement restent très largement inférieurs aux mégadonnées générées par les collectes
inférieurs aux mégadonnées générées par les collectes automatiques de automatiques de dispositifs numériques — il faut considérer que tout ce qui peut
dispositifs numériques — il faut considérer que tout ce qui peut arriver arriver arrivera. En ce qui concerne les désignants par exemple, il suffit
arrivera. En ce qui concerne les désignants par exemple, il suffit quasiment quasiment d'envisager l'existence d'une régularité et de tenter de la capturer
d'envisager l'existence d'une régularité et de tenter de la capturer dans un dans un motif pour qu'il soit contredit par une donnée du corpus, qu'elle ait
motif pour qu'il soit contredit par une donnée du corpus, qu'elle ait réellement réellement été produite telle quelle par un choix ou une erreur humaine ou
été produite telle quelle par un choix ou une erreur humaine ou qu'elle émerge à qu'elle émerge à cause des bruits générés par les imperfections des différentes
cause des bruits générés par les imperfections des différentes étapes de étapes de traitement (vieillissement du papier et de l'encre, qualité de la
traitement (vieillissement du papier et de l'encre, qualité de la numérisation, numérisation, performances de l'[@=OCR]…). Ainsi, dans ce type d'étude il s'agit
performances de l'[@=OCR]…). Ainsi, dans ce type d'étude il s'agit en permanence en permanence de placer un curseur entre ce qui est acceptable pour répondre à
de placer un curseur entre ce qui est acceptable pour répondre à une question une question précise et ce qui est perfectible en vue d'études futures. Trouver
précise et ce qui est perfectible en vue d'études futures. Trouver cet équilibre cet équilibre engendre un va-et-vient continu entre traitement des données et
engendre un va-et-vient continu entre traitement des données et analyses. Pour analyses. Pour cette raison, les choix faits dans la représentation du corpus et
cette raison, les choix faits dans la représentation du corpus et en particulier en particulier dans la conception des métadonnées favorisent la plus grande
dans la conception des métadonnées favorisent la plus grande flexibilité, en flexibilité, en tâchant de minimiser l'effort nécessaire pour relancer les
tâchant de minimiser l'effort nécessaire pour relancer les traitements affectés traitements affectés par un changement dans une donnée. Cette stratégie repose
par un changement dans une donnée. Cette stratégie repose sur le constat sur le constat empirique qu'il est vain d'espérer que la première version sera
empirique qu'il est vain d'espérer que la première version sera la bonne et la bonne et qu'il vaut mieux considérer toutes les données en aval dans la
qu'il vaut mieux considérer toutes les données en aval dans la chaîne de chaîne de dépendance comme temporaires, susceptibles de mises à jour et donc
dépendance comme temporaires, susceptibles de mises à jour et donc jetables. La jetables. La détermination d'un ensemble de domaines de connaissance présentée à
détermination d'un ensemble de domaines de connaissance présentée à la la sous-section \ref{sec:domains_build_classes}
sous-section \ref{sec:domains_build_classes}
p.\pageref{sec:domains_build_classes} d'une façon très linéaire résulte en p.\pageref{sec:domains_build_classes} d'une façon très linéaire résulte en
réalité de ce type de négociation entre code et données. Naturellement, pour que réalité de ce type de négociation entre code et données. Naturellement, pour que
ces allers et retours conduisent à un processus d'amélioration continue plutôt ces allers et retours conduisent à un processus d'amélioration continue plutôt
......
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment