ModOAP BaOIA

Cas d'étude : les romans scolaires de la IIIe République

Présentation


Le roman scolaire est un genre éphémère apparu dans la deuxième moitié du XIXe siècle et qui a connu son heure de gloire sous la troisième République. Ce projet pédagogique innovant consistait à capter l’attention des enfants par une histoire, en général les aventures initiatiques d’enfants, afin de transmettre aux écoliers des connaissances en histoire, géographie, sciences, français et surtout en morale et instruction civique… Il s’agit bien de manuels scolaires : les passages narratifs sont régulièrement interrompus par des développements didactiques parvenant à une parfaite interdisciplinarité. Ils sont tombés peu à peu en désuétude. Ces romans d’éducation transmettaient des connaissances comme des valeurs : l’identification aux personnages permettait l’adhésion sentimentale aussi bien qu’intellectuelle à la République et à la Nation. L’enjeu pour la jeune République était de taille : former de futurs citoyens partisans de ce régime et prêts à donner leur vie pour leur patrie dans un contexte de défaite contre l’Allemagne et de colonisation. Quel monde présentait-on aux enfants dans ces romans ? Quel univers de référence ? Quelle représentation de la nation française ?

Corpus


Le plus célèbre des romans scolaires est le Tour de la France par deux enfants mais il en existe d’autres référencés dans le corpus « L’éducation et l’école en France ».
Nous avons travaillé sur un corpus de 22 romans uniquement des ouvrages destinés à des élèves, utilisés comme manuels dans des écoles, tous disponibles en mode texte sur Gallica : Jean Felbert, Alain Redon, Le ménage de Mme Sylvain, Moussa et Gigla, Le tour de l’Europe pendant la guerre, Les étapes d’un petit Algérien, Jean Lavenir, Les causeries d’un grand-père, La France en zigzag, Les Enfants de Marcel, Tu seras ouvrière, Tu seras citoyen, Suzette, Tu seras soldat, Francinet, Simon de Nantua, Les biens de la terre, Le Tour de France par deux enfants, A travers nos colonies, Madame Adeline ou récits d’une institutrice, Petite-Pierre ou le bon cultivateur, Maurice ou le travail. 

Statistiques générales sur le corpus


Le corpus comprend un ensemble de 1868151 mots, inégalement répartis parmi les 22 romans scolaires étudiés. Le tableau ci-dessous présente la répartition des mots au sein du corpus :



Le texte des romans scolaires a été extrait depuis les fichiers d'océrisation au format ALTO mis à disposition par Gallica. Le texte est divisé à l'échelle des paragraphes, reconnus par OCR.
La reconnaissance optique des caractères est imparfaite et certains termes mal orthographiés ne peuvent pas être pris en compte dans ce travail. Le taux de reconnaissance pour les romans du corpus varie de 83.98 % à 99.98 %, pour une moyenne sur l'ensemble du corpus de 94.03%.
Une vingtaine des erreurs les plus courantes de reconnaissance optique de caractères ont été corrigées manuellement.

Le texte a ensuite subi des pré-traitements linguistiques, opérés grâce à l'outil Spacy :
- segmentation lexicale
- lemmatisation
- étiquetage grammatical
- filtre des mots grammaticaux
- reconnaissance d'entités nommées

Enfin, certains termes ont été filtrés manuellement lors du calcul, parce qu'ils résultaient d'erreurs d'OCR ou parce qu'ils présentaient des ambiguités.