Complexité syntaxique et sémantique
études de corpus - n°14

Ce volume des Cahiers Forell est l’aboutissement du travail d’une équipe (ou « Opération » de l’EA 1226), le Cercle de Recherches Linguistiques de Poitiers, étalé sur plus d’un an. Ce travail  repose sur la confrontation de données langagières diverses (langues différentes, variation, traductions) et leur analyse linguistique à la lumière d'une pluralité d'approches théoriques. C’est un travail collectif: chaque contribution a fait l’objet d’un exposé, d’une discussion et de relectures au sein du groupe.

La question de l’utilisation d’un corpus dans l’analyse linguistique n’est pas nouvelle: il faut savoir comment on le traite, quel type de corpus on utilise, quels sont les cas où l’on ne peut échapper au corpus collecté à partir de l’écrit faute de locuteurs, quelles précautions prendre pour éviter qu’il ne devienne une simple collection de beaux spécimens.

Les contributions proposées dans ce volume peuvent se fonder sur une forme de corpus préexistant : par exemple des corpus informatisés tels que le LOB, le Brown, le COLT ou le British National Corpus, sur l’anglais, ou bien ceux réalisés par deux chercheurs sur les variétés canadiennes de français, ou encore, dans le cadre d’études lexicales, les entrées du dictionnaire. Il peut s’agirau contraire de corpus collectés pour une recherche déterminée : corpus réuni à des fins sociologiques, extraits de lectures personnelles ou enquêtes réalisées « sur le terrain » pour le français ou l’anglais.

Les travaux présentés ici ne sont qu’une « coupe » synchronique dans la vie d’un groupe de recherches. La part d’exploitation et de constitution des corpus ainsi que celle du traitement informatique des textes s’affirmeront plus que jamais dans les activités de l’équipe aux côtés de la réflexion théorique: c’est pourquoi ce recueil constitue à la fois un bilan de parcours mais aussi préfigure certaines des orientations de recherche à venir.