Corpus Écrit de Français Langue Étrangère

Le Corpus Écrit de Français Langue Étrangère (CEFLE) est un corpus de textes écrits en français L2 par des apprenants suédophones. Ce corpus a été élaboré à l’Université de Lund, Suède, durant l’année scolaire 2003/04. À l’heure actuelle, un nombre limité de textes sont publiés sous forme de fichier de texte. Dans un projet de recherche prévu pour l’année 2009, le copus entier sera publié sur ce site avec des textes annotés pour des phénomènes morphosyntaxiques accompagnés d'un moteur de recherche.

Présentation du corpus

Le corpus CEFLE a été créé pour combler le manque de corpus en français L2 écrit dans un contexte d'apprentissage en Suède. Ce corpus contient approximativement 400 textes écrits par des apprenants du français au lycée en Suède et 60 textes écrits par des scripteurs francophones dans un groupe contrôle. Les textes se répartissent en quatre tâches différentes.
Les apprenants du français L2
110 apprenants du français au lycée ont été suivis pendant une année scolaire, entre le mois de septembre 2003 et le mois de mai 2004.  Ces apprenants ont entre 16 et 19 ans pendant la période de recherche et ils suivent des cours de français de niveaux différents : 1re, 2e, 4e et 5e année de français. Au printemps 2006, le corpus a été complété avec encore des textes écrits par des apprenants débutants et par des apprenants avancés (voir Sous-corpus transversal). Les apprenants suédois du Corpus CEFLE se caractérisent de la manière suivante:
  • La majorité des apprenants du français ont le suédois comme seule langue maternelle (L1). Un petit nombre d'apprenants sont bilingues dès la naissance.
  • Les élèves suédois étudient tous l'anglais depuis l'âge de 9 ans. L'anglais correspond donc à la première L2 des apprenants de ce corpus. Au lycée, ils ont atteint un niveau élevé d'anglais à l'oral et à l'écrit.
  • Dans de nombreux cas, les apprenants du franais ont également quelques connaissances d’une troisième (et parfois d’une quatrième et d’une cinqième) langue, par exemple l’allemand, l’espagnol, l’italien, le russe ou le latin, qu’ils ont commencé à étudier au collège ou au lycée.
  • Les apprenants ont écrit leurs textes en français dans une salle d’ordinateurs au lycée, lors d’un cours de français.
Tous les apprenants du français ont rempli un questionnaire sur leurs connaissances de différentes langues, sur le contact avec le français, sur la motivation pour apprendre le français, sur les notes en français et en suédois, etc.
Le groupe contrôle
À la population d’apprenants de français L2 s’ajoute un groupe contrôle, comprenant 30 élèves français appartenant à des classes entre la troisième et la terminale. Les Français du groupe contrôle ont donc approximativement le même âge que les apprenants suédois. Ces scripteurs ont tous le français comme L1. Quelques rares élèves du groupe contrôle sont bilingues, ayant acquis deux langues, dont le français, dès la naissance. Bien que scolarisés en français, les élèves dans les classes concernés qui ont une autre L1 que le français ont été exclus de cette étude. Dans le groupe contrôle se trouvent :
  • dix élèves du lycée F qui ont écrit leurs textes lors d’un échange scolaire à Lund en avril 2004. La majorité des élèves sont en première ou en terminale.
  • vingt élèves en classe de troisième au lycée G qui ont écrit leurs textes lors d’un cours de français au lycée à la fin de l’année scolaire (juin 2004).
Les scripteurs francophones ont dû écrire leurs textes à la main. Les textes ont ensuite été transcrits pour permettre des analyses automatiques en analogie avec les textes écrits en L2.
Les tâches
Les textes du corpus CEFLE ont été produits dans le but de créer un corpus dont les textes ont été écrits avec peu de restrictions et dans un but communicatif. Deux genres de tâches ont été présentées aux apprenants du corpus. D’abord, il est question de deux rédactions de caractère descriptif et narratif traitant de la vie des apprenants:
  • Moi, ma famille et mes amis
  • Un souvenir de voyage.
Ensuite, il s'agit de deux séries d’images qui ont été créées afin de susciter des narrations sous forme écrite :
  • L’homme sur l’île
  • Le voyage en Italie.
Dans toutes les tâches et dans la mesure du possible, le nombre et le genre ont été élicités. Les apprenants du projet ont écrit les quatre textes mentionnés ci-dessus, à l’exception des débutants qui n’ont écrit que deux textes : Moi, ma famille et mes amis et Le voyage en Italie. Pour des raisons pratiques, l’ordre des tâches accomplies n’a pas été le même pour toutes les classes de français. Le tableau 1 résume le design du corpus.Tout chercheur s’intéressant aux tâches du Corpus CEFLE est invité à prendre contact avec la responsable du corpus : malin.agren@rom.lu .se


Tableau 1 : La distribution des tâches écrites dans les classes de français L2.

1re entrevue2e entrevue3e entrevue4e entrevue
1re année--MoiItalie
2e annéeMoiSouvenirItalieHomme
4e annéeHommeSouvenirItalieMoi
5e annéeHommeSouvenirItalieMoi
ContrôleMoiItalie--

Légende : Moi : Texte narratif Moi, ma famille et mes amis, Homme : Série d’images, L’homme sur l’île, Souvenir : Texte narratif, Un souvenir de voyage ; Italie : Série d’images. Le voyage en Italie ; Gris foncé : Étude transversale (Ågren, 2008) ; Gris clair : Étude longitudinale (Ågren, 2008).

En vue d’éliminer, autant que possible, que des facteurs externes à notre étude n'influencent les résultats, un certain nombre de facteurs ont été gardés constants tout au long de l’étude.
  • La langue maternelle de tous les participants était la même et ils avaient approximativement le même âge.
  • L’expérimentatrice était toujours la même.
  • Tous les textes (sauf ceux du groupe contrôle) ont été écrits dans une salle d’ordinateur.
  • L'accent a été mis sur l’importance du contenu et de la communication du message, et non de sa forme.
  • Il a été précisé que la tâche à accomplir n’était pas un test, le résultat ne comptant pas pour la note du cours.
  • Le professeur de français était absent lors des sessions dans la salle des ordinateurs.
  • Le temps pour accomplir la tâche était limité (45-55 minutes).
Les textes ont été écrits sur ordinateur dans un format texte. L'utilisation du logiciel Word a été écartée afin d'éviter qu'il y ait de la correction automatique et afin de faciliter le traitement possible des fichiers dans le logiciel CLAN, qui ne traite que des documents correspondant au format .txt.
Références bibliographiques
Ågren, M. (2008), À la recherche de la morphologie silencieuse. Sur le développement du pluriel en français L2 écrit, Études Romanes de Lund 84, Thèse de doctorat, Université de Lund. Bardovi-Harlig, K. (2000): « Tense and Aspect in Second Language Acquisition : Form, Meaning and Use », Language Learning 50 (0). Bartning, I. et Schlyter, S. (2004): « Itinéraires acquisitionnels et stades de développement en français L2 », Journal of French Lenguage Studies 14 : 281-299.

Présentation des textes

Les textes en français L2 qui sont à la base de l’étude de Ågren (2008) sont présentés sur ce site dans deux sections séparées, appelées Sous-corpus transversal (basé sur la tâche ‘Le voyage en Italie’) et Sous-corpus longitudinal (basé sur les quatre tâches).
Gestionnaire de pages: Malin.Agrenrom.luse | 2009-06-15