Le Corpus Écrit de Français Langue Étrangère (CEFLE) est un corpus de textes écrits en français L2 par des apprenants suédophones. Ce corpus a été élaboré à l’Université de Lund, Suède, durant l’année scolaire 2003/04. À l’heure actuelle, un nombre limité de textes sont publiés sous forme de fichier de texte. Dans un projet de recherche prévu pour l’année 2009, le copus entier sera publié sur ce site avec des textes annotés pour des phénomènes morphosyntaxiques accompagnés d'un moteur de recherche.
Le corpus CEFLE a été créé pour combler le manque de corpus en français L2 écrit dans un contexte d'apprentissage en Suède. Ce corpus contient approximativement 400 textes écrits par des apprenants du français au lycée en Suède et 60 textes écrits par des scripteurs francophones dans un groupe contrôle. Les textes se répartissent en quatre tâches différentes.
110 apprenants du français au lycée ont été suivis pendant une année scolaire, entre le mois de septembre 2003 et le mois de mai 2004. Ces apprenants ont entre 16 et 19 ans pendant la période de recherche et ils suivent des cours de français de niveaux différents : 1re, 2e, 4e et 5e année de français. Au printemps 2006, le corpus a été complété avec encore des textes écrits par des apprenants débutants et par des apprenants avancés (voir Sous-corpus transversal).
Les apprenants suédois du Corpus CEFLE se caractérisent de la manière suivante:
Tous les apprenants du français ont rempli un questionnaire sur leurs connaissances de différentes langues, sur le contact avec le français, sur la motivation pour apprendre le français, sur les notes en français et en suédois, etc.
À la population d’apprenants de français L2 s’ajoute un groupe contrôle, comprenant 30 élèves français appartenant à des classes entre la troisième et la terminale. Les Français du groupe contrôle ont donc approximativement le même âge que les apprenants suédois. Ces scripteurs ont tous le français comme L1. Quelques rares élèves du groupe contrôle sont bilingues, ayant acquis deux langues, dont le français, dès la naissance. Bien que scolarisés en français, les élèves dans les classes concernés qui ont une autre L1 que le français ont été exclus de cette étude. Dans le groupe contrôle se trouvent :
Les scripteurs francophones ont dû écrire leurs textes à la main. Les textes ont ensuite été transcrits pour permettre des analyses automatiques en analogie avec les textes écrits en L2.
Les textes du corpus CEFLE ont été produits dans le but de créer un corpus dont les textes ont été écrits avec peu de restrictions et dans un but communicatif. Deux genres de tâches ont été présentées aux apprenants du corpus.
D’abord, il est question de deux rédactions de caractère descriptif et narratif traitant de la vie des apprenants:
Ensuite, il s'agit de deux séries d’images qui ont été créées afin de susciter des narrations sous forme écrite :
Dans toutes les tâches et dans la mesure du possible, le nombre et le genre ont été élicités. Les apprenants du projet ont écrit les quatre textes mentionnés ci-dessus, à l’exception des débutants qui n’ont écrit que deux textes : Moi, ma famille et mes amis et Le voyage en Italie. Pour des raisons pratiques, l’ordre des tâches accomplies n’a pas été le même pour toutes les classes de français. Le tableau 1 résume le design du corpus.
Tout chercheur s’intéressant aux tâches du Corpus CEFLE est invité à prendre contact avec la responsable du corpus : malin.agren@rom.lu .se
Tableau 1 : La distribution des tâches écrites dans les classes de français L2.
| 1re entrevue | 2e entrevue | 3e entrevue | 4e entrevue | |
| 1re année | - | - | Moi | Italie |
| 2e année | Moi | Souvenir | Italie | Homme |
| 4e année | Homme | Souvenir | Italie | Moi |
| 5e année | Homme | Souvenir | Italie | Moi |
| Contrôle | Moi | Italie | - | - |
Légende : Moi : Texte narratif Moi, ma famille et mes amis, Homme : Série d’images, L’homme sur l’île, Souvenir : Texte narratif, Un souvenir de voyage ; Italie : Série d’images. Le voyage en Italie ; Gris foncé : Étude transversale (Ågren, 2008) ; Gris clair : Étude longitudinale (Ågren, 2008).
En vue d’éliminer, autant que possible, que des facteurs externes à notre étude n'influencent les résultats, un certain nombre de facteurs ont été gardés constants tout au long de l’étude.
Les textes ont été écrits sur ordinateur dans un format texte. L'utilisation du logiciel Word a été écartée afin d'éviter qu'il y ait de la correction automatique et afin de faciliter le traitement possible des fichiers dans le logiciel CLAN, qui ne traite que des documents correspondant au format .txt.
Ågren, M. (2008), À la recherche de la morphologie silencieuse. Sur le développement du pluriel en français L2 écrit, Études Romanes de Lund 84, Thèse de doctorat, Université de Lund.
Bardovi-Harlig, K. (2000): « Tense and Aspect in Second Language Acquisition : Form, Meaning and Use », Language Learning 50 (0).
Bartning, I. et Schlyter, S. (2004): « Itinéraires acquisitionnels et stades de développement en français L2 », Journal of French Lenguage Studies 14 : 281-299.
Les textes en français L2 qui sont à la base de l’étude de Ågren (2008) sont présentés sur ce site dans deux sections séparées, appelées Sous-corpus transversal (basé sur la tâche ‘Le voyage en Italie’) et Sous-corpus longitudinal (basé sur les quatre tâches).
Responsable de la page: Malin Ågren Webmaster: webmaster
Éditeur: Centre de langues et de littérature
Dernière mise à jour: 06/15/2009