Token indices sequence length is longer than the specified maximum sequence length for this model (1204 > 512). Running this sequence through the model will result in indexing errors
Token indices sequence length is longer than the specified maximum sequence length for this model (1204 > 512). Running this sequence through the model will result in indexing errors
%% Cell type:code id: tags:
%% Cell type:code id: tags:
``` python
``` python
model = BertForSequenceClassification.from_pretrained(model_path).to(gpu_name) #.to("cuda")
model = BertForSequenceClassification.from_pretrained(model_path).to(gpu_name) #.to("cuda")
"ABACUS. L’abacus ou abaque était un instrument en\nusage dans l’antiquité pour faciliter les calculs arithmé¬\ntiques. Il paraît que c’était dans l’origine une petite table\nsur laquelle on traçait les figures et où l’on exécutait les\nopérations. Cet instrument semble aussi ancien que l’arith¬\nmétique, qui d’ailleurs s’appelait abacus au moyen âge ;\non le trouve chez les Grecs, les Romains, les Chinois, les\nAllemands et les Français. Sa forme varia avec le temps ;\nil devint enfin un cadre long divisé par plusieurs cordes\nparallèles, dans chacune desquelles étaient enfilées dix\npetites boules. La première ligne à droite était celle des\nunités, la seconde celle des dizaines, la troisième celle des\ncentaines, etc. Pour écrire un premier nombre sur l’abacus\non commençait par relever toutes les boules à la partie\nsupérieure de l’instrument, et ensuite on abaissait sur\nchaque ligne, à la partie inférieure, un nombre de boules\négal aux unités de l’ordre de ces lignes. Ainsi par exemple,\npour écrire le nombre 3,564, on abaissait 4 boules à la\npartie inférieure de la première ligne, 6 à celle de la\nseconde, 5 à celle de la troisième et 3 à celle de la qua¬\ntrième. Le nombre 3,564 se trouvait ainsi représenté\ncomme il l’est dans la figure 1. — Ce nombre étant\nécrit, s’agissait-il de lui ajouter un autre nombre, 53,729,\non commençait par abaisser 9 boules de la partie supé¬\nrieure de la première ligne à la partie inférieure ;\ncomme, dans le cas présent, il n’en restait que 6, après\navoir abaissé ces 6 boules, on relevait les 10 à la\npartie supérieure, en abaissant une boule pour cette\ndizaine à la seconde colonne, et on achevait l’opération\nsur la première en abaissant 3 boules pour compléter les\n9 qu’il s’agissait d’abaisser. Passant à la seconde colonne\non abaissait 2 boules pour le chiffre 2 des dizaines du\nnombre 53,729. Arrivé à la troisième colonne, on abais¬\nsait d’abord les 5 boules restantes, ensuite on remontait\nle tout en abaissant pour la dizaine une boule dans la\nquatrième colonne et on redescendait 2 boules à la troi¬\nsième colonne pour compléter le chiffre 7. Passant à la\nuatrième colonne, on abaissait 3 boules pour le chiffre\ndes mille, et enfin on abaissait 5 boules à la cinquième\ncolonne pour le chiffre 5 des dizaines de mille. L’appa¬\nrence finale de l’abacus était, après cette opération, celle\nde la figure 2, et le nombre 57,293, qui s’y trouve écrit\nà la partie inférieure, est la somme des deux nombres\n3,564 et 53,729.Pour ajouter un nouveau nombre à 57,293\non agirait de la même manière et ainsi de suite. On voit\ndonc qu’à l’aide de cet instrument, les additions des\nnombres peuvent s’effectuer avec la plus grande facilité ;\nil en est de même des soustractions qu’on peut exécuter\npar une marche inverse de celle que nous venons de\ndécrire. — L’abacus, abandonné par toutes les nations de\nl’Europe à l’exception de la Russie, est encore extrême¬\nment répandu en Chine, où on le trouve dans toutes les\nmaisons de commerce; il est également en usage dans\ncertaines parties de l’Inde et dans nos écoles primaires\nsous le nom de boulier compteur.\nL’usage de l'abacus suppose, comme on vient de le voir,\nparfaitement établi le système de numération décimale.\nA qui sommes-nous redevables de cette invention si\nféconde, ou du moins de son introduction en Europe ?\nChasles l’attribue à Doëce (V. ce mot) ; cette opinion a\nété hautement combattue par Libri. — D’après Chasles,\nBoèce se servait, sous le nom à'apices, de caractères\nnommés igin, andras, ormis, arbas, quimas, calcis,\nzénis, témenias et celentis, correspondant à nos chiffres\n1, 2, 3, 4, 5, 6, 7, 8, 9 ; quant à Yabacus, ce serait\nun tableau divisé par des lignes horizontales et verticales,\nformant des cases dans lesquelles devaient être inscrits\nces caractères, de façon que les unités de même ordre des\ndifférents nombres sur lesquels devait porter l’opération\nse trouvassent dans une même colonne verticale ; la case\ncorrespondante à un certain ordre d’unités devait être\npassée lorsque le nombre manquait dans cet ordre d’unités.\nLes opérations d’ailleurs se seraient faites sur ce tableau,\ncomme nous les faisons aujourd’hui. Ce serait, comme on\nvoit, un immense progrès sur l’opération purement méca¬\nnique que nous avons décrite précédemment. — D’après le\nmême géomètre, le zéro n’aurait pas tardé à apparaître sous\nle nom desipos, de sorte que les occidentaux auraient eu,\nlongtemps avant leurs relations avec les Arabes, un système\nde numération écrite entièrement identique à celui dont\nnous nous servons aujourd’hui. — D’après Libri, tout\ncela ne serait que chimères et visions. Notre système de\nnumération, d’origine hindoue, nous serait venu des Arabes\nau xii6 siècle ; tous les écrivains de cette époque le\ndisent ; tous les traités d’arithmétique le proclament ;\nla question ne saurait donc être douteuse.\nCependant les preuves alléguées par Chasles sont\ntirées d’anciennes copies manuscrites de l’Arithmétique de\nBoëce, qu’il paraît avoir étudiées avec soin ; et il serait\ndifficile d’admettre que ce qu’il dit y avoir vu ne s’y\ntrouvât pas. Tout au plus pourrait-on prétendre que les\nmanuscrits en question contiendraient des interpolations\nfaites depuis Boëce. Mais cette hypothèse présente encore\ndes difficultés parce que Boëce, d’après Chasles, attribue¬\nrait la connaissance de ce système aux Grecs (à quelques\nGrecs bien peu nombreux sans doute, car aucun ouvrage grec\nantérieur à Boëce, écrit à Athènes, à Alexandrie ou à Con¬\nstantinople, n’en fait mention, et Eutocius même n’y fait pas\nallusion). — Que conclure ? Nous croyons avec Libri\nque notre système de numération nous vient des Hindous\net nous pensons que Chasles se trompe en lui donnant\nune origine grecque ou latine. Mais on ne voit pas pourquoi\nBoëce, qui avait voyagé en Orient, n’aurait pas pu être\ninitié à l’arithmétique des Hindous par un marchand grec de\nConstantinople, que ses voyages auraient conduit dans\nl’Inde.On objecte, il est vrai, que Boëce est antérieur à Arya-\nbhata, l’auteur du plus ancien traité d’arithmétique indien\nconnu ; mais il n’est guère probable qu’Aryabhata ait\ndécouvert seul tout ce qui se trouve dans son ouvrage\noù, sans doute, figurent bien des choses connues avant\nl’auteur en Hindoustan. — Cependant, pourquoi la tradi¬\ntion ne ferait-elle remonter qu’au xne siècle l’introduction\ndu système décimal de numération parmi les nations occi¬\ndentales ? Pourquoi surtout cette introduction aurait-elle\nété regardée alors comme un événement tout nouveau,\npourquoi aurait-elle fait époque ? Cela s’expliquerait peut-\nêtre parce que, à partir de Boëce, les ténèbres n’avaient\nfait que s’épaissir sur toute l’Europe, jusqu’à l’invasion de\nl’Espagne par les Arabes, et que les connaissances qu’il\navait pu acquérir en Grèce, n’ayant pas eu le temps\nde se répandre, avaient fini par ne plus Lisser de\ntraces.\nChasles, à l’appui de cette opinion, cite un Traité de\nl’Abacus, de Raoul, évêque de Laon, où il serait dit\nque ce système de numération était tombé dans l’oubli\nchez les nations occidentales et que Gerbert et Hermann\nl’avaient remis en pratique. — Nous ne voyons d’invrai¬\nsemblable dans tout cela que l’idée de Chasles d’attri¬\nbuer une origine grecque ou latine à notre système de\nnumération et de pousser l’exagération de son système\njusqu’à se demander sérieusement, à propos de l’Arénaire,\nsi Archimède ne connaissait pas le système de l’abacus. —\nSi Chasles avait seulement voulu dire qu’Archimède con¬\nnaissait l’A6aÇ, comptoir, damier, buffet, qui est dénommé\ndans le premier vers du Jardin des racines grecques,\nsorte de machine à calculer que nous avons décrite au\ncommencement de cet article et telle qu’elle existe aujour¬\nd’hui en Chine, son hypothèse serait plus que probable.\nMais nous ne pensons pas que ce soit ce qu’a voulu dire\nChasles ; car alors il ne s’agirait plus d’un fait scien¬\ntifique comparable à l’invention de la méthode qui permit\nd’écrire tous les nombres avec neuf caractères seulement\net un zéro. — Il ne s’agit pas en effet de la numération\nparlée des Grecs, qui fut toujours décimale, il s’agit de\nleur numération écrite. Or, que les abax, dans les colonnes\nou les rainures desquels on faisait mouvoir des cailloux ou\nde petites boules, rappelassent la numération parlée déci¬\nmale, cela n’aurait même pas lieu d'étonner, mais ne prou¬\nverait rien pour la numération écrite. — Au reste, on voit\nquelquefois les nations perfectionner leurs méthodes,\njamais on ne les voit en changer totalement les bases.\nNous sommes assurément bien éloignés de vouloir faire\naux Grecs, même à Pappus et à Eutocius, l’injure de\ncroire qu’ils n’eussent pas été mille fois capables d’in-\nventer le système décimal de numération avec les neuf\ncliitfres et le zéro, si leur manière d’être et de penser les\neût davantage portés aux spéculations arithmétiques. Il ne\nfaut pas pour cela beaucoup de génie et ils auraient pu en\nrevendre aux Latins de la décadence, aux Hindous, aux\nArabes et à tous nos abacistes ; ce qu’il fallait, c’était une\ncertaine disposition d’esprit, dépendant d une certaine con¬\nformation cérébrale.\n"
"ABACUS. L’abacus ou abaque était un instrument en\nusage dans l’antiquité pour faciliter les calculs arithmé¬\ntiques. Il paraît que c’était dans l’origine une petite table\nsur laquelle on traçait les figures et où l’on exécutait les\nopérations. Cet instrument semble aussi ancien que l’arith¬\nmétique, qui d’ailleurs s’appelait abacus au moyen âge ;\non le trouve chez les Grecs, les Romains, les Chinois, les\nAllemands et les Français. Sa forme varia avec le temps ;\nil devint enfin un cadre long divisé par plusieurs cordes\nparallèles, dans chacune desquelles étaient enfilées dix\npetites boules. La première ligne à droite était celle des\nunités, la seconde celle des dizaines, la troisième celle des\ncentaines, etc. Pour écrire un premier nombre sur l’abacus\non commençait par relever toutes les boules à la partie\nsupérieure de l’instrument, et ensuite on abaissait sur\nchaque ligne, à la partie inférieure, un nombre de boules\négal aux unités de l’ordre de ces lignes. Ainsi par exemple,\npour écrire le nombre 3,564, on abaissait 4 boules à la\npartie inférieure de la première ligne, 6 à celle de la\nseconde, 5 à celle de la troisième et 3 à celle de la qua¬\ntrième. Le nombre 3,564 se trouvait ainsi représenté\ncomme il l’est dans la figure 1. — Ce nombre étant\nécrit, s’agissait-il de lui ajouter un autre nombre, 53,729,\non commençait par abaisser 9 boules de la partie supé¬\nrieure de la première ligne à la partie inférieure ;\ncomme, dans le cas présent, il n’en restait que 6, après\navoir abaissé ces 6 boules, on relevait les 10 à la\npartie supérieure, en abaissant une boule pour cette\ndizaine à la seconde colonne, et on achevait l’opération\nsur la première en abaissant 3 boules pour compléter les\n9 qu’il s’agissait d’abaisser. Passant à la seconde colonne\non abaissait 2 boules pour le chiffre 2 des dizaines du\nnombre 53,729. Arrivé à la troisième colonne, on abais¬\nsait d’abord les 5 boules restantes, ensuite on remontait\nle tout en abaissant pour la dizaine une boule dans la\nquatrième colonne et on redescendait 2 boules à la troi¬\nsième colonne pour compléter le chiffre 7. Passant à la\nuatrième colonne, on abaissait 3 boules pour le chiffre\ndes mille, et enfin on abaissait 5 boules à la cinquième\ncolonne pour le chiffre 5 des dizaines de mille. L’appa¬\nrence finale de l’abacus était, après cette opération, celle\nde la figure 2, et le nombre 57,293, qui s’y trouve écrit\nà la partie inférieure, est la somme des deux nombres\n3,564 et 53,729.Pour ajouter un nouveau nombre à 57,293\non agirait de la même manière et ainsi de suite. On voit\ndonc qu’à l’aide de cet instrument, les additions des\nnombres peuvent s’effectuer avec la plus grande facilité ;\nil en est de même des soustractions qu’on peut exécuter\npar une marche inverse de celle que nous venons de\ndécrire. — L’abacus, abandonné par toutes les nations de\nl’Europe à l’exception de la Russie, est encore extrême¬\nment répandu en Chine, où on le trouve dans toutes les\nmaisons de commerce; il est également en usage dans\ncertaines parties de l’Inde et dans nos écoles primaires\nsous le nom de boulier compteur.\nL’usage de l'abacus suppose, comme on vient de le voir,\nparfaitement établi le système de numération décimale.\nA qui sommes-nous redevables de cette invention si\nféconde, ou du moins de son introduction en Europe ?\nChasles l’attribue à Doëce (V. ce mot) ; cette opinion a\nété hautement combattue par Libri. — D’après Chasles,\nBoèce se servait, sous le nom à'apices, de caractères\nnommés igin, andras, ormis, arbas, quimas, calcis,\nzénis, témenias et celentis, correspondant à nos chiffres\n1, 2, 3, 4, 5, 6, 7, 8, 9 ; quant à Yabacus, ce serait\nun tableau divisé par des lignes horizontales et verticales,\nformant des cases dans lesquelles devaient être inscrits\nces caractères, de façon que les unités de même ordre des\ndifférents nombres sur lesquels devait porter l’opération\nse trouvassent dans une même colonne verticale ; la case\ncorrespondante à un certain ordre d’unités devait être\npassée lorsque le nombre manquait dans cet ordre d’unités.\nLes opérations d’ailleurs se seraient faites sur ce tableau,\ncomme nous les faisons aujourd’hui. Ce serait, comme on\nvoit, un immense progrès sur l’opération purement méca¬\nnique que nous avons décrite précédemment. — D’après le\nmême géomètre, le zéro n’aurait pas tardé à apparaître sous\nle nom desipos, de sorte que les occidentaux auraient eu,\nlongtemps avant leurs relations avec les Arabes, un système\nde numération écrite entièrement identique à celui dont\nnous nous servons aujourd’hui. — D’après Libri, tout\ncela ne serait que chimères et visions. Notre système de\nnumération, d’origine hindoue, nous serait venu des Arabes\nau xii6 siècle ; tous les écrivains de cette époque le\ndisent ; tous les traités d’arithmétique le proclament ;\nla question ne saurait donc être douteuse.\nCependant les preuves alléguées par Chasles sont\ntirées d’anciennes copies manuscrites de l’Arithmétique de\nBoëce, qu’il paraît avoir étudiées avec soin ; et il serait\ndifficile d’admettre que ce qu’il dit y avoir vu ne s’y\ntrouvât pas. Tout au plus pourrait-on prétendre que les\nmanuscrits en question contiendraient des interpolations\nfaites depuis Boëce. Mais cette hypothèse présente encore\ndes difficultés parce que Boëce, d’après Chasles, attribue¬\nrait la connaissance de ce système aux Grecs (à quelques\nGrecs bien peu nombreux sans doute, car aucun ouvrage grec\nantérieur à Boëce, écrit à Athènes, à Alexandrie ou à Con¬\nstantinople, n’en fait mention, et Eutocius même n’y fait pas\nallusion). — Que conclure ? Nous croyons avec Libri\nque notre système de numération nous vient des Hindous\net nous pensons que Chasles se trompe en lui donnant\nune origine grecque ou latine. Mais on ne voit pas pourquoi\nBoëce, qui avait voyagé en Orient, n’aurait pas pu être\ninitié à l’arithmétique des Hindous par un marchand grec de\nConstantinople, que ses voyages auraient conduit dans\nl’Inde.On objecte, il est vrai, que Boëce est antérieur à Arya-\nbhata, l’auteur du plus ancien traité d’arithmétique indien\nconnu ; mais il n’est guère probable qu’Aryabhata ait\ndécouvert seul tout ce qui se trouve dans son ouvrage\noù, sans doute, figurent bien des choses connues avant\nl’auteur en Hindoustan. — Cependant, pourquoi la tradi¬\ntion ne ferait-elle remonter qu’au xne siècle l’introduction\ndu système décimal de numération parmi les nations occi¬\ndentales ? Pourquoi surtout cette introduction aurait-elle\nété regardée alors comme un événement tout nouveau,\npourquoi aurait-elle fait époque ? Cela s’expliquerait peut-\nêtre parce que, à partir de Boëce, les ténèbres n’avaient\nfait que s’épaissir sur toute l’Europe, jusqu’à l’invasion de\nl’Espagne par les Arabes, et que les connaissances qu’il\navait pu acquérir en Grèce, n’ayant pas eu le temps\nde se répandre, avaient fini par ne plus Lisser de\ntraces.\nChasles, à l’appui de cette opinion, cite un Traité de\nl’Abacus, de Raoul, évêque de Laon, où il serait dit\nque ce système de numération était tombé dans l’oubli\nchez les nations occidentales et que Gerbert et Hermann\nl’avaient remis en pratique. — Nous ne voyons d’invrai¬\nsemblable dans tout cela que l’idée de Chasles d’attri¬\nbuer une origine grecque ou latine à notre système de\nnumération et de pousser l’exagération de son système\njusqu’à se demander sérieusement, à propos de l’Arénaire,\nsi Archimède ne connaissait pas le système de l’abacus. —\nSi Chasles avait seulement voulu dire qu’Archimède con¬\nnaissait l’A6aÇ, comptoir, damier, buffet, qui est dénommé\ndans le premier vers du Jardin des racines grecques,\nsorte de machine à calculer que nous avons décrite au\ncommencement de cet article et telle qu’elle existe aujour¬\nd’hui en Chine, son hypothèse serait plus que probable.\nMais nous ne pensons pas que ce soit ce qu’a voulu dire\nChasles ; car alors il ne s’agirait plus d’un fait scien¬\ntifique comparable à l’invention de la méthode qui permit\nd’écrire tous les nombres avec neuf caractères seulement\net un zéro. — Il ne s’agit pas en effet de la numération\nparlée des Grecs, qui fut toujours décimale, il s’agit de\nleur numération écrite. Or, que les abax, dans les colonnes\nou les rainures desquels on faisait mouvoir des cailloux ou\nde petites boules, rappelassent la numération parlée déci¬\nmale, cela n’aurait même pas lieu d'étonner, mais ne prou¬\nverait rien pour la numération écrite. — Au reste, on voit\nquelquefois les nations perfectionner leurs méthodes,\njamais on ne les voit en changer totalement les bases.\nNous sommes assurément bien éloignés de vouloir faire\naux Grecs, même à Pappus et à Eutocius, l’injure de\ncroire qu’ils n’eussent pas été mille fois capables d’in-\nventer le système décimal de numération avec les neuf\ncliitfres et le zéro, si leur manière d’être et de penser les\neût davantage portés aux spéculations arithmétiques. Il ne\nfaut pas pour cela beaucoup de génie et ils auraient pu en\nrevendre aux Latins de la décadence, aux Hindous, aux\nArabes et à tous nos abacistes ; ce qu’il fallait, c’était une\ncertaine disposition d’esprit, dépendant d une certaine con¬\nformation cérébrale.\n"
%% Cell type:code id: tags:
%% Cell type:code id: tags:
``` python
``` python
content = "Instrument de musique" #df_LGE.content[2][:512]
content = "Instrument de musique" #df_LGE.content[2][:512]
word_attributions = cls_explainer(content if len(content) < 512 else content[:512])
word_attributions = cls_explainer(content if len(content) < 512 else content[:512])
word_attributions
word_attributions
```
```
%% Output
%% Output
[('[CLS]', 0.0),
[('[CLS]', 0.0),
('Instrument', 0.5555782891531604),
('Instrument', 0.5555782891531604),
('de', 0.24325958616394933),
('de', 0.24325958616394933),
('musique', 0.7950833530900966),
('musique', 0.7950833530900966),
('[SEP]', 0.0)]
('[SEP]', 0.0)]
%% Cell type:code id: tags:
%% Cell type:code id: tags:
``` python
``` python
cls_explainer.predicted_class_name
cls_explainer.predicted_class_name
```
```
%% Output
%% Output
'Musique'
'Musique'
%% Cell type:code id: tags:
%% Cell type:code id: tags:
``` python
``` python
cls_explainer.visualize()
cls_explainer.visualize()
```
```
%% Output
%% Output
<IPython.core.display.HTML object>
<IPython.core.display.HTML object>
%% Cell type:code id: tags:
%% Cell type:code id: tags:
``` python
``` python
```
```
%% Cell type:markdown id: tags:
%% Cell type:markdown id: tags:
* récupérer les mots positifs par domaine (EDdA et LGE)
* récupérer les mots positifs par domaine (EDdA et LGE)
* faire des nuages de mots et comparer les plus fréquents entre EDdA et LGE (corpus parallèle)
* faire des nuages de mots et comparer les plus fréquents entre EDdA et LGE (corpus parallèle)