französisch heute 3/1999, S. 309-327

 

Dirk Siepmann

 

Linguistique de corpus et grammaire : une nouvelle donne pour l’enseignement du français langue étrangère

 

1. Introduction

 

Le présent article se situe à la frontière séparant linguistique et didactique des langues vivantes. Il s’inscrit dans un champ de recherche négligé par les francistes jusqu’à une période récente, mais susceptible d’avoir des répercussions importantes sur l’enseignement du français langue étrangère : celui de la linguistique de corpus. En effet, les gros corpus de textes électroniques aujourd’hui disponibles, notamment sous leur forme étiquetée ou arborée, permettent une approche lexicale des faits grammaticaux qui ne tardera pas à révolutionner la conception des grammaires pédagogiques du français. En vue d’un premier déblayage du terrain, on commence par examiner la notion même de « linguistique de corpus » pour tenter ensuite d’en illustrer les apports, aussi bien systématiques que ponctuels, au domaine de la grammaire. Chemin faisant, on fournit non seulement des éclairages inédits sur certains points grammaticaux, mais on comble aussi certaines lacunes des grammaires et des dictionnaires, de sorte que les enseignants de français qui s’intéressent moins à la théorie qu’à la pratique de la langue y trouveront également leur compte. On finit par une réflexion plus générale sur la portée pédagogique de la linguistique de corpus.

Il reste à signaler que cet article se place dans le droit prolongement des travaux pionniers sur l’anglais entrepris par John Sinclair (1990, 1991, 1995, 1996b) et par Gill Francis (1993), tout en nuançant et développant leur pensée. Ces travaux ont inspiré nombre d’autres chercheurs, dont l’angliciste allemand Dieter Mindt (p.ex. 1993, 1995a, 1995b).

 

2. Qu’est-ce que la linguistique de corpus ?

 

Un corpus, c’est, dans le sens linguistique du terme, « un ensemble fini d’énoncés réels réuni en vue de l’étude d’un phénomène linguistique » (Petit Robert). Pour parler clair, le linguiste de corpus, au lieu de forger lui-même des exemples de ce qu’il croit être l’usage, se fonde sur des textes authentiques et des textes authentiques seulement. Quant à savoir si ces textes doivent former un tout homogène, les avis divergent ; l’on opère parfois une distinction entre les simples « collections de textes » (text archives en anglais) et les corpus proprement dits, construits d’après des critères de rassemblement bien précis (Sinclair 1996a).[1] Selon le point de vue adopté, on peut faire remonter plus ou moins loin dans le temps les premiers travaux linguistiques à partir de corpus. Ainsi, on peut supposer que le De lingua latina d’un Varron, datant du premier siècle avant Jésus-Christ et dont quelques volumes seulement sont parvenus jusqu’à nous, a dû s’appuyer sur un corpus fourni d’exemples. Plus proche de nous, le Dictionnaire des mots et des choses de Pierre Richelet (1680) est le premier à intégrer un grand nombre de citations d’auteur, à une époque où l’Académie, elle, y répugne - comme elle continuera, d’ailleurs, de le faire jusqu’en 1986.

Au cours des trois premiers quarts du XXe siècle, les linguistes se fondent sur des observations faites à partir de corpus dans quatre domaines principaux : grammaire, lexicographie, étude des dialectes et didactique des langues vivantes (Kennedy 1998). Qu’il suffise de mentionner, en linguistique française, le monumental Bon Usage de Grevisse, dont la première édition remonte à 1936, la non moins imposante Grammaire française de Togeby, achevée par ses collaborateurs après sa mort accidentelle en 1974, ainsi que les travaux de Gougenheim visant à délimiter un vocabulaire de base.

A partir des années soixante, l’avènement d’ordinateurs de plus en plus puissants commence à rendre obsolète l’analyse manuelle des textes. La critique de naguère, selon laquelle le travail sur corpus est trop coûteux en temps, ne sera dorénavant plus valable. L’année 1961 marque le véritable coup d’envoi des travaux sur corpus, avec la constitution du premier corpus informatisé par une équipe de chercheurs de l’université Brown aux Etats-Unis. En France, à la même époque, on commence à rassembler la base textuelle Frantext. Ce fonds, désormais interrogeable sur Internet et comptant actuellement quelque 180 millions de mots (pris ici au sens statistique d’ « unité séparée par deux blancs »), a servi à la rédaction du Trésor de la Langue Française. Enfin, avec l’arrivée du traitement de texte dans les années quatre-vingt, la plupart des données textuelles sont automatiquement saisies sur support électronique, ce qui permet l’acroissement des corpus écrits par plusieurs ordres de grandeur. Les plus vastes d’entre eux, tous de langue anglaise, flirtent aujourd’hui avec la barre magique du milliard de mots. Pour fixer les idées, précisons que le présent article compte 9000 mots, de sorte qu’un corpus de 100 millions de mots, comme le British National Corpus, équivaut à environ 11100 articles de même taille ! Force est pourtant de reconnaître que les corpus de l’oral sont moins volumineux, étant donné l’impossibilité, pour l’heure, de convertir automatiquement en texte écrit des enregistrements de langue parlée. La partie orale du British National Corpus, par exemple, ne comprend que 10 millions de mots.

Signalons enfin que, vu la diversité des approches fondées sur la linguistique de corpus, celle-ci ne peut être comprise comme une discipline linguistique au même titre que la syntaxe, la sémantique ou la pragmalinguistique (cf. McEnery/Wilson 1996: 2). C’est plutôt une nouvelle manière de procéder, susceptible d’être appliquée à n’importe quel objet d’étude et capable, comme nous le verrons maintenant pour la grammaire, d’ouvrir de nouvelles perspectives.

 

3. Que nous apporte la linguistique de corpus dans le domaine grammatical?

 

3.1. Apports systématiques

 

Pour bien apprécier les enjeux contemporains de la recherche en grammaire, il importe de commencer par un bref aperçu historique. C’est Chomsky qui, au milieu du siècle, déplace le centre de gravité de la linguistique de l’empirisme vers le rationalisme. Selon lui, le véritable objet d’étude de la linguistique serait le savoir linguistique du locuteur natif ou, plus précisément, une « compétence linguistique » projetée dans l’absolu plutôt qu’une « performance » forcément entachée d’erreurs. Or, les corpus renferment des données fondées sur la performance ; en bonne logique, toujours selon Chomsky, ils ne sauraient contribuer à la modélisation de la compétence linguistique. Conséquence : nombre de linguistes, dans les années cinquante à quatre-vingt, abandonnent le travail sur corpus, préférant se fier à leur seule intuition. Notons au passage que ce changement d’orientation offre quelque analogie avec l’évolution d’autres sciences, comme par exemple la psychologie, où on voit pendant longtemps s’opposer cognitivistes et behavioristes. C’est d’ailleurs contre la théorie de l’acquisition linguistique du behavioriste Skinner que Chomsky émet des critiques judicieuses.

Avec le recul, on s’aperçoit que la principale contribution de la grammaire d’inspiration chomskienne à la linguistique réside dans la mise en évidence de la générativité du langage ; d’où le terme de « grammaire générative », lequel renvoie à la capacité des langues naturelles d’engendrer, à partir d’un ensemble fini de règles syntaxiques, un nombre potentiellement infini de phrases. Etant donné cette infinitude du langage, aucun corpus, si grand soit-il, ne saurait en être le seul explicandum. Ce constat est d’une telle banalité aujourd’hui qu’on hésite à croire qu’avant Chomsky, d’aucuns étaient convaincus que le but du linguiste était de rendre compte des seules phrases réunies dans son corpus de travail (p.ex. Harris 1951).

Force est cependant de constater que le recours à la seule introspection prônée par Chomsky est vicié à la base. En effet, les phrases-exemples obtenues par ce moyen sont souvent artificielles, et ce pour deux raisons principales.

D’abord, ce sont, dans le meilleur des cas, des idéalisations, dans le pire des cas, des inventions pures et simples. Voyons deux exemples glanés au hasard dans des écrits d’obédience chomskienne :

 

(1) Il a été perdu une valise par un voyageur (Delaveau/Kerleroux 1985: 31)

(2) Qui crois-tu que Jean pense que Marie aime? (Encyclopaedia Universalis, s.v. Chomsky)

 

Le locuteur natif, interrogé sur l’acceptabilité de ce genre de phrases, répond souvent en forme de boutade : « Oui, ça pourrait se dire. Mais on ne le dit jamais. ». Le caractère artificiel de ces phrases-exemples vient de ce qu’ils s’inscrivent dans un raisonnement purement théorique. Celui-ci a pour seule fonction de contraster, hors de tout contexte, deux ou plusieurs structures isolées afin de donner du relief aux contraintes syntaxiques sous-jacentes (cf. Francis 1993: 138). Ainsi, dans le premier exemple, il s’agit de mettre en évidence les propriétés syntaxiques des constructions comportant un il impersonnel en position de sujet. Mise en correspondance avec « Il a été perdu une valise », la phrase-exemple permet d’observer que le sujet référentiel de la phrase (« un voyageur ») peut être réalisé facultativement, ce qui n’est pas le cas pour les constructions introduites par un verbe impersonnel tel que « il faut ». Or, c’est précisément l’adjonction du groupe prépositionnel « par un voyageur » qui rend la phrase inacceptable. Tout en étant parfaitement conforme aux règles grammaticales au sens étroit, elle n’obéit pas aux exigences de pertinence discursive. Il est en effet difficile d’imaginer des contextes réels dans lesquels pourrait s’inscrire un énoncé de cette nature. Il serait possible de tenir le même type de raisonnement à propos du deuxième exemple ; nous en laissons le soin au lecteur.

La deuxième raison de l’artificialité des exemples dérivant de l’introspection, c’est leur manque de fiabilité. Sinclair a souvent insisté sur ce point, maints exemples à l’appui ; plus récemment, des germanistes français travaillant sur corpus sont venus confirmer ses mises en garde contre le caractère trompeur des intuitions :

 

Que de fois, en effet, n’avons-nous pas été surpris par la réalité de l’usage, que de fois n’avons-nous pas constaté que l’idée que nous nous faisions de ces mots, de leur comportement syntaxique ou de leur fonctionnement sémantique, était prise en défaut sur tel point ou méritait un complément d’examen sur tel autre. (Métrich/Faucher/Courdier 1994: 10)


Il convient toutefois de nuancer quelque peu la priorité absolue accordée au corpus par Sinclair et son équipe de Cobuild. Certes, il n’est pas indiqué, comme le suggère Aarts (1991, cité d’après Francis 1993), de faire appel à l’intuition pour inventer de toutes pièces une grammaire et de ne la tester qu’ensuite sur les phrases d’un corpus. Encore faut-il reconnaître que l’intuition peut aider le linguiste à dénicher des phénomènes dignes de son intérêt et à éviter les erreurs d’analyse que peut commettre l’ordinateur. Le Collins Cobuild Collocations CD-ROM (Sinclair 1995) est un exemple dissuasif de la façon dont l’absence d’intervention humaine peut conduire à des erreurs gravissimes (cf. mon compte-rendu de l’ouvrage [Siepmann 1998]).

On est fondé à conclure qu’une grammaire nouvelle, et plus particulièrement la grammaire pédagogique[2], doit prendre le contre-pied de l’approche hypothético-déductive, qui consiste, on l’a vu, à contraster des potentialités et non pas des réalités langagières. Francis (1993: 138) parle à ce sujet de grammaire « non-contrastive » : il s’agit de ne pas travailler dans la pure abstraction chomskienne, mais bien plutôt de montrer comment fonctionne chaque structure et chaque lexie prise en elle-même. Cette critique faite, l’incontestable mérite de la grammaire générative-transformationnelle est d’avoir démontré que le recours au corpus n’est pas suffisant pour rendre un compte explicite du fonctionnement d’une langue. Un juste milieu est à trouver entre l’exploitation du corpus et l’introspection, mais, en raison du manque de fiabilité des données obtenues par l’introspection, le corpus aura le dernier mot.

 

Il est temps d’élargir le champ de notre analyse aux grammaires traditionnelles (entendez : celles qui ne se situent pas dans la ligne de pensée de Chomsky). Les deux types de grammaire ont en commun, pour ainsi dire, de mettre la charrue devant les boeufs. Expliquons-nous. Comme le soulignent les modèles de production du langage tels que Bot (1992), tout acte d’énonciation comprend quatre phases successives : 1. désir de s’exprimer et choix du code 2. lexicalisation 3. choix de la morphosyntaxe 4. articulation ou rédaction. Dans un premier temps, le locuteur natif choisit parmi une multitude d’unités lexicales celles qui conviennent le mieux à l’acte de communication qu’il souhaite accomplir ; c’est seulement après que ces unités lexicales s’insèrent dans une structure syntaxique susceptible de les accueillir. En dernière analyse, lexique et syntaxe s’avèrent donc indissociables. Or, la grande majorité des grammaires traditionnelles partent du principe, fût-ce implicitement, que la syntaxe constitue un niveau d’organisation indépendant. Du coup, elles inversent le processus qu’on vient de décrire. Tout se passe comme si les constituants phrastiques - sujet, verbe, objet, complément d’objet, etc. - étaient autant de trous que l’on puisse boucher presque indifféremment avec du lexique. En nous inspirant largement des travaux sur l’anglais de Francis (1993), prenons un exemple concret : celui de l’infinitif précédé par la préposition de et utilisé en fonction d’attribut du complément d’objet. Grevisse (1994: 458) note à son propos que « le complément d’objet accompagné d’un attribut est souvent un infinitif introduit par la préposition de ou une proposition ». On voit explicitée ici la démarche des grammairiens traditionnels, laquelle part uniquement de la structure en soi. On cherchera en vain quelque précision que ce soit sur la nature des lexies qui y sont habituellement incorporées, encore que, par la force des choses, Grevisse soit bien obligé d’en utiliser quelques-unes dans son exemplier (croire/considérer comme inutile, rendre impossible, trouver avantageux)[3]. Un bref sondage du corpus donne à voir une image plus rigoureuse de la réalité langagière :

 

étaient apparues. Agnès trouvait aberrant de faire et refaire des poches de saharien

 l'ouverture d'un musée trouvent absurde de démonter ces boiseries : " Ce décor perd

  salariés d'Air France estiment acceptable l'idée de baisser leurs salairesL'état d

 Le duc (André Lefaur), croit alors utile de préciser : " Messieurs, messieurs, la d

au Sir Mortimer Gussage croit bon de convier Kemble à son dîner. Ce repas, au cours

 e quand un académicien jugea bon de dévoiler que le français ressemblait au latin c

. A l'heure où certains croient bon de distinguer le culte et la   culture, il impor

se livrait Bukowski, ni trouvé bon de s'opposer à son expulsion. Encore maintenant,

uple de terroristes, je trouve important de montrer la réalité. Malheureusement, cer

ons de ce temps, car je trouverais indécent de faire mousser l'histoire d'un enfant

 pays développés : cela rend indispensable de disposer d’indicateurs sur les taux d’

  ses cinq métiers, ils jugent nécessaire de céder les activités de nutrition animal

, le secrétaire général estime nécessaire de clarifier le rôle des " casques bleus "

iverses que M. Vignoble estime nécessaire de clarifier la situation. Les montages fi

tervenant que lorsqu'il juge nécessaire de corriger certains excès ou de s'en démarq

ril terrifiant. Et s'il juge prématuré de dire que ces gouvernements ont entrepris u

açonnerie ni juive ; je trouvais répugnant de signer, mais personne ne s'y refusait.

 

Point n’est besoin d’analyser cet extrait de concordance[4] pour s’apercevoir que la structure en question est soumise à de fortes contraintes. Ce qui frappe de prime abord, c’est que les verbes et adjectifs déclencheurs de cet emploi de l’infinitif sont en nombre restreint. Les verbes ressortissent à deux champs sémantiques, dont le premier ne compte qu’un seul élément (rendre), alors que le second est mieux pourvu (estimer, croire, juger, penser, trouver, considérer comme, + ?). Les adjectifs, eux, constituent un groupe un peu plus étendu, mais assez homogène ; parmi les plus fréquents, qui représentent plus de la moitié des occurrences, on trouve bon, commode, important, nécessaire, normal, opportun, possible, préférable et utile. Loin derrière viennent des vocables tels que prudent, absurde ou, dans la langue familière, limite (cf. l’allemand grenzwertig). On peut également noter que ces adjectifs se répartissent en deux classes, les uns exprimant une modalité affective (bon, invivable), les autres marquant une modalité intellectuelle (possible, nécessaire).

Il convient aussi de repérer l’imbrication des deux catégories grammaticales considérées, certains adjectifs formant avec certains verbes des collocations stables (p.ex. croire/juger + bon, juger + prématuré dans la langue de presse, trouver + normal / limite dans la langue parlée), alors que d’autres s’associent plus librement (croire/penser/juger/trouver + possible).

Enfin, si l’on creuse encore, on verra que toutes ces unités associatives véhiculent une même fonction, celle d’exprimer une attitude évaluatrice par rapport au contenu de la proposition infinitive. C’est là le point crucial de l’approche « lexico-grammaticale » (Francis 1993[5]) que nous venons d’illustrer : la mise en lumière des liens d’interdépendance entre fonctions communicatives, lexique et structures. Cette approche sera développée dans la suite du présent article.

 

Cela étant, on peut s’interroger sur les avantages offerts par l’analyse de corpus assistée par ordinateur. Quel est son plus par rapport au dépouillement manuel ? La réponse est triple : d’abord, les vastes corpus électroniques permettent, en règle générale, d’obtenir un nombre plus important d’attestations d’un phénomène donné ou de prendre en compte des faits de plus vaste nature. Cela entraîne le corollaire qu’on peut se faire une idée très précise de la fréquence d’emploi d’un syntagme, des transformations dont il est passible, etc. N’oublions pas en effet qu’aucun locuteur natif ne possède une maîtrise complète de sa langue maternelle, raison pour laquelle l’introspection ne peut jamais donner à voir qu’une partie de la langue. A chacun de faire le test en essayant de répondre à ces deux questions : 1. Quels autres noms peuvent occuper la position sujet dans le type de construction illustré par les deux phrases suivantes ? 2. Quelle est leur fréquence respective dans la construction en question ?

 

L’heure n’est pas aux plaisanteries.

L’heure est au consensus.

 

(Les réponses seront données ultérieurement ; il y a fort à parier que ni le lecteur de langue maternelle française ni le franciste confirmé ne parviendra à énumérer la liste complète des noms en question, ni à plus forte raison de deviner leur fréquence. C.Q.F.D.)

Ensuite, le travail sur corpus donne à chaque exemple son indispensable cachet d’authenticité ; nul besoin désormais d’inventer des énoncés qui risqueraient d’être peu naturels.

Enfin et surtout, certains faits de langue, quoique de plein usage, tendent à échapper à l’observation « à l’oeil nu ». L’observateur humain, pour minutieux qu’il soit, a tendance à s’attarder sur les structures inattendues et les raffinements de style, laissant passer à travers les mailles de son filet tout ce qui relève du banal. Cela est particulièrement vrai pour le linguiste qui étudie sa propre langue maternelle, où tout lui paraît aller de soi.

 

De tout quoi il ressort que le travail à partir de gros corpus a d’indéniables avantages : il permet l’élaboration de lexiques-grammaires presque exhaustifs, ancrés fermement dans la langue réelle, et pouvant prétendre, plus que les grammaires traditionnelles, à refléter des réalités cognitives.[6] La tâche des grammairiens du futur consistera à décrire les propriétés syntaxiques de la majorité des unités lexicales et, dans une optique complémentaire, de spécifier les unités lexicales susceptibles d’entrer dans une structure grammaticale donnée (cf. Francis 1993: 155).[7] Mission impossible ? Tâche herculéenne tout au moins, mais qui a déjà été accomplie pour une partie du lexique anglais, à savoir les verbes (Sinclair 1996b).

 

Dans ce qui suit, nous allons exemplifier de façon raisonnée certains éléments d’un lexique-grammaire du français. Pour ce faire, nous empruntons à Sinclair (1991) l’idée selon laquelle les combinaisons de mots s’étendent sur un continuum bipolaire allant du plus figé au moins figé. Ainsi, on conçoit aisément que les expressions idiomatiques sont presque totalement figées. Une fois, en effet, qu’on choisit de prendre position en disant ou en écrivant, par exemple, honni soit qui mal y pense, il n’y a plus de variation possible - à moins de vouloir faire de l’esprit. Autrement dit, à une intention communicative très précise correspond ici une seule structure. C’est déjà moins le cas pour une locution telle que jeter un pavé dans la mare, face à laquelle on peut avoir de nombreuses variantes, comme en témoigne la concordance suivante :

 

us tout en gagnant moins ". Ensuite, ce pavé dans la mare était lancé par quelqu

andes figures de Solidarité, a lancé un pavé dans la mare en déclarant publiquem

ion dans la balance, mais en lançant un pavé dans la mare. " Je suis convaincu q

, le 29 mai, ce qui est apparu comme un pavé dans la mare. S'il n'est pas mis fi

 l'éditorialiste de la Lettre a jeté un pavé dans la mare néogaulliste. Sous le

té ", Edouard   Balladur a jeté un beau pavé dans la mare syndicale (le Monde du

atronal du bâtiment a jeté un véritable pavé dans la   mare en affirmant que la

section socialiste, envoyait un premier pavé dans la mare. Il soupçonnait des ma

r l'instant du moins, à lancer quelques pavés dans la mare du débat sur la " fra

hoisi par le juge Garzon pour jeter son pavé dans la mare sent le coup politique

 

En l’occurrence, le verbe jeter est concurrencé par lancer et envoyer. On voit aussi que l’on peut isoler le syntagme un pavé dans la mare pour l’employer avec d’autres verbes (apparaître comme un pavé dans la mare). En outre, les deux noms pavé et mare sont susceptibles de certaines modifications - autant de choix lexico-syntaxiques qui donnent une relative liberté aux locuteurs désireux de s’exprimer au moyen de cette locution.

 

Notre premier exemple, qui illustre un phénomène situé vers le pôle « moins figé » du continuum phraséologique, concerne la combinatoire des noms et plus particulièrement l’infinitif complément de nom. Nous sommes là dans un domaine grammatical encore largement inexploré ; à notre connaissance, Sandfeld (1943) et Spang-Hanssen (1963) sont les seuls à s’y être aventurés[8]. Même si les grands dictionnaires monolingues, les dictionnaires de collocation et les grammaires citent quelques rares exemples d’emploi, leur traitement de ce phénomène est loin d’être satisfaisant, surtout du point de vue des apprenants du français langue étrangère.

L’ensemble des noms qui nous intéresse ici présente la propriété commune d’être construit avec l’infinitif introduit par la préposition à. Le tableau suivant regroupe quelques lignes extraites d’une concordance, les mots-pôles étant triés par ordre alphabétique :

 

 gardera pour lui les raisons de son avidité à voir disparaître le gentleman-ch

 années, en particulier par sa disponibilité à agir sur des théâtres extérieurs

 parlé des cahiers de 1905 et son insistance à l’accompagner ensuite au Café de l

 qui n’est qu’à lui. Une prodigieuse liberté à passer, ni vu ni connu, de la pros

uelque discipline que ce soit, il y a profit à vérifier, à affiner, à améliorer

stionnaires celles-ci n’ont aucune réticence à recourir à une technique d’estim

de Toulon, Orange et Marignane leur timidité à appliquer le programme du Front Na

et l’on comprend alors qu’il y avait urgence à venir observer ce Chinatown géant

 

On perçoit sur ces exemples que les noms étudiés se différencient par leur sémantisme. Ils se laissent ranger en trois grandes familles de sens aux frontières perméables :

 

1.    difficulté*, capacité*, efficacité*, aisance, habileté, facilité, aptitude, faculté, disposition, propension - incapacité*, impossibilité*, impuissance, inaptitude, inefficacité, incompétence, inexpérience, etc.

 

Cette première famille de sens comprend des noms ayant trait à la capacité, ou à l’incapacité, du locuteur à faire quelque chose.

 

2.    acharnement*, application, ardeur*, art*, aspiration, aversion, avidité*, complaisance, culpabilité*, curiosité*, dextérité, diligence, disponibilité, engagement*, faiblesse, fierté*, fièvre*, hâte*, hésitation, impatience*, insistance, invitation*, joie*, liberté*, naïveté*, obstination*, opiniâtreté, plaisir*, pudeur, pugnacité, rage*, rapidité, répugnance, résistance, réticence, scrupule*, satisfaction*, tenacité, tiédeur, timidité, vigilance, vigueur, virtuosité, bonne/mauvaise volonté[9], etc.

 

Cette deuxième famille de sens comprend des noms ayant trait, de près ou de loin, aux qualités intellectuelles et morales.

 

3.    avantage, intérêt, profit, danger, importance, urgence

 

Les membres de ce troisième groupe ont ceci de particulier qu’ils ne s’emploient avec à que dans des constructions du type avoir + nom + à : avoir avantage à, avoir intérêt à, avoir un intérêt direct à, etc. Comme le précise Blumenthal (1992), le nom intérêt se trouve aussi exceptionnellement avec de : les Toulousains n’ont pas intérêt de miser sur ... Avec tous les noms de ce groupe, on trouve souvent le présentatif il y a : il y a avantage à, l’avantage qu’il y a à. Dans toutes les autres constructions, les noms de ce groupe s’emploient avec de (cf. il est dans votre intérêt de, etc.).

 

Ajoutons, pour être complet, que l’usage flotte entre à et de (ou pour) pour certains des noms appartenant aux groupes 1 et 2 (nous les avons marqués d’un astérisque). Cette alternance entre les deux prépositions semble attribuable à cinq facteurs principaux :

 

·      Le degré de figement de la collocation ; les collocations figées dans lesquelles entrent les noms évoqués ci-dessus sont formées avec l’infinitif précédé de la préposition de (la joie de jouer, la liberté d’entreprendre, la capacité d’apprendre à apprendre, une avidité de vivre; mais, avec un autre type de nom : une machine à remonter le temps).

·      La forte tendance à rattacher l’article défini à un infinitif introduit par la préposition de (la satisfaction d’être accepté) (cf. Spang-Hanssen 1963: 103) et à combiner les autres déterminants - article indéfini, article partitif, adjectif possessif, adverbe - avec la préposition à (j’ai une grande satisfaction à tourner ce film, leur art à donner de l’amour).

·      L’opposition entre la qualité constante (sa curiosité à trouver dans d’autres environnements de quoi rester ce poète ...) et le cas particulier (satisfaire sa curiosité de revoir Cayenne). Cette distinction s’applique particulièrement aux noms formant collocation avec avoir (avoir la naïveté de croire, si vous avez la curiosité de lire, avoir des velléités d’être acteur). Spang-Hanssen (1963: 116) parle dans ces cas de « de prédicatif » : il eut la faiblesse/l’habileté/la lâcheté d’accepter.

·      La question de savoir si l’infinitif est voir, employé comme variante stylistique du passif ou d’une complétive avec que (+ subjonctif), auquel cas l’infinitif introduit par la préposition de est de rigueur.

·      La question de savoir si l’infinitif est à un temps composé, auquel cas l’infinitif avec de s’impose.

 

Il arrive que deux ou plusieurs de ces facteurs jouent en même temps. Ainsi, pour ne prendre qu’un exemple, avoir la naïveté de croire non seulement constitue une collocation usuelle, mais particularise la notion de naïveté. Précisons néanmoins que ces distinctions sont parfois délicates à établir ou tout simplement inexistantes, comme c’est le cas pour le nom engagement, qui se construit indifféremment avec de ou à. L’euphonie, elle aussi, peut jouer un rôle. On pourrait prolonger notre analyse en prenant en compte le pluriel de ces noms, la possibilité d’insérer un complément entre le nom et l’infinitif (la prétention du langage poétique à figurer quelque objet), etc.

L’analyse que nous venons de proposer illustre à merveille la vision unifiée de la langue que seul peut offrir le travail à partir de gros corpus. Le corpus utilisé comprend quelque 90 millions de mots. En admettant qu’un corpus plus volumineux permettrait de pousser plus avant l’analyse, il faut reconnaître qu’il aurait été impossible d’aboutir aux mêmes résultats par le recours à l’introspection.

 

Avec notre deuxième exemple, nous restons dans la combinatoire des noms. Qu’est-ce que les noms avantage, différence, nuance, particularité et réserve (entre autres) ont en commun ? Afin de répondre à cette question, voyons un extrait de concordance :

 

  ple de ce qui doit se faire, avec cet avantage que les Vietnamiens n'ont pas à

chéisme nécessaire. La démocratie a cet avantage qu'elle ménage ces moments de m

s décidée par Laval en 1935 (avec cette différence qu'alors les traitements réel

 à peu près tout à son enfance. A cette différence qu'au lieu de se démarquer, c

 aux prisonniers politiques, avec cette différence qu'elle ne milite pas pour la

 un rôle analogue, en effet. Avec cette différence qu'il indiquait une figure pr

lus gros qu'un très gros chien, à cette différence qu'il s'agit bien d'un cheval

ent dans cette logique. Mais avec cette particularité qu'il n'existe pas un, mai

UT des Caisses d'épargne présente cette particularité qu'il n'y a pas de proprié

titre que les autres gemmes, avec cette particularité que la perle est une gemme

eut attaquer, on dira secte. Avec cette réserve que cette prétendue secte n'a ja

otant même quelques progrès, avec cette réserve que Gershwin " a plus de   talen

 

Il est évident que, outre leur caractère abstrait, les noms examinés n’offrent guère de parenté sémantique. Ce qui nous amène néanmoins à les classer dans une même catégorie, c’est leur fonction communicative. En effet, ils servent tous à apporter, au moyen de la complétive qui les suit, un commentaire ou une précision à ce qui vient d’être dit. Il est du reste possible d’observer une relation précise entre le nom et le contenu de la complétive ; celle-ci représente, pour reprendre l’expression de Winter (1982), la « réalisation lexicale » du nom. Autrement dit, l’idée contenue dans la complétive est « annoncée » par le nom. Enfin, on voit aisément que la construction de ces noms avec une complétive est sujette à de fortes contraintes phraséologiques. Par exemple, avantage et inconvénient ne se rencontrent guère que dans des syntagmes du type avec cet (l’) avantage/cet (l’) inconvénient que ou avoir/présenter cet avantage que. Il est donc impossible de traduire littéralement en français une phrase allemande du type das verschaffte ihm den politischen Vorteil, daß (...). Il suffit, en fait, de modifier le nom par un adjectif pour se voir obligé de recourir à d’autres constructions syntaxiques, témoin la phrase suivante :

 

La traduction présente un autre inconvénient majeur, qui est de réduire la nécessité pour l’apprenant de construire des réseaux lexicaux internes.

 

D’où l’intérêt capital de ces noms pour une grammaire pédagogique du français et pour une grammaire comparée du français et de l’allemand. La frange est d’ailleurs assez floue entre les noms précités et une classe voisine de noms, tels que espoir et idée, susceptibles d’être suivis d’une complétive, mais soumis à moins de restrictions phraséologiques. Le manque de place et la visée du présent article nous interdisent de discuter dans le détail, comme le ferait un lexique-grammaire complet, ces diverses classes sémantico-fonctionnelles.

 

Avec notre dernier exemple, nous fournissons la solution de l’exercice proposé plus haut. Voici quelques données authentiques extraites du corpus :

 

 à l'Est, s'est-il inquiété, l'ambiance est au chacun pour soi, les riches se dé

ace à ces nouveaux périls, l’atmosphère était au pardon. Quatre ans après la fin

négociaient avec l'Etat juif, le climat est au pessimisme le plus sombre. Bloqué

é des premiers conciliabules, le climat restait au pessimisme, mercredi matin,

orte de poudre et de fards. Or l'époque est au naturel, aux modestes rehaussemen

 l’entendre? Probablement pas. L’époque n’est pas à la description, lui préférant

turelle, affirme sans répit que l'heure est au consensus, à la prudence et au pr

de se passer d'intermédiaires : l'heure est à la vente directe au client final.

ture de la tragédie algérienne. L'heure est à la violence, avec ses embrouillami

e suite. Ça tombe bien : tantôt la mode est au vogueing, cette danse qui consist

l'absence délibérée de sérieux. La mode est à la blague, à la provocation gratui

pour un camp ou pour l'autre : le temps est au sauvetage des vies qui restent. D

n d'un documentaire animalier. Le temps est à la parole et aux prévisions. Les b

 produits. Il est clair que la tendance est à la diminution de la production de

ectifs) qu'en Afrique, mais la tendance est à la progression, aidée en cela par

ment, à la direction générale,   le ton est à la dédramatisation. Certes, tous l

vec Clinton ! "   Côté officiel, le ton est à la prudence. M. Al Hachemi, respon

enforcé.   Deuxième certitude : le vent est au changement. L'hebdomadaire Die Ze

 

Nous avons affaire ici à une structure assez fréquente, mais signalée ni par les dictionnaires ni par les grammaires.[10] Elle est basée sur un patron de phrase invariable : GN + (ne pas) être / rester + à GN. A l’intérieur de celui-ci, la position de sujet ne peut être occupée que par un nombre très limité de noms non modifiables par un adjectif et obligatoirement précédés de l’article défini. Les neuf noms ambiance, atmosphère, climat, époque, heure, mode, temps, tendance et ton représentent en effet près de 100 pour cent des occurrences. En revanche, le complément indirect introduit par à obéit à moins de contraintes. La seule restriction d’ordre syntaxique est que le groupe nominal présent dans ce complément doit être précédé de l’article défini. Notons encore que les verbes être et rester n’apparaissent qu’à trois temps - présent, imparfait, passé simple - dont le présent domine largement.

A la variabilité restreinte de la construction correspond l’unicité de l’interprétation sémantique que l’on peut en donner. Elle pourrait être définie en ces termes : « nous nous trouvons à un moment de l’histoire (ou dans une situation) qui est caractérisé(e) par (le pessimisme / la violence / le changement, etc.) ».

On est alors amené non pas à enregistrer une simple locution dans un dictionnaire7, mais plutôt à recenser, dans un lexique-grammaire, une forme de phrase présentant un sémantisme régulier et admettant un libre choix des lexies pour l’un de ses constituants. Cette structure n’est ni complètement figée, comme le sont les expressions idiomatiques, ni complètement libre ; par conséquent, elle occupe une place assez centrale dans le continuum phraséologique.

Remarquons enfin que cette construction intéressera aussi les contrastivistes, en raison de la diversité des traductions auxquelles elle donne lieu. Il n’y a pas de correspondance univoque entre la structure française et une structure allemande - tant s’en faut. Voyons quelques exemples : die Tendenz ist steigend (la tendance est à la progression), die Stimmung ist aufrührerisch (l’ambiance est à la fronde), es besteht / es gibt eine Tendenz / einen Trend zur Produktionssenkung / der Trend geht zur Produktionssenkung / es ist eine Tendenz zur Produktionssenkung zu beobachten / festzustellen / zu verzeichnen (la tendance est à la baisse de la production), jetzt geht es darum, noch so viele Leben wie möglich zu retten (le temps est au sauvetage des vies qui restent).

 

3.2. Apports ponctuels

 

Les développements précédents, le lecteur attentif l’aura remarqué, s’appliquaient à l’élaboration d’une grammaire exhaustive du français, car il s’agissait de faire ressortir les avantages systématiques de l’approche lexico-grammaticale. En revanche, les apports ponctuels de celle-ci, sur lesquels nous allons nous pencher dans ce qui suit, ne peuvent logiquement concerner qu’une grammaire pédagogique sélective. Ces apports sont donc ponctuels en ce sens qu’ils contribuent à améliorer les grammaires pédagogiques existantes, lesquelles atteignent aujourd’hui un assez haut degré de représentativité dans le choix des domaines grammaticaux qui intéressent l’apprenant. On peut distinguer quatre types d’apports ponctuels, qui seront illustrés chacun d’un ou de plusieurs exemples:

 

En premier lieu, la correction des règles. En effet, beaucoup de grammaires scolaires établissent des règles pour le moins douteuses. Meißner (1999a: 20-21) donne pour exemple de cette tendance les règles gouvernant l’alternance entre le futur simple et le futur périphrastique.

 

En second lieu, le remplacement des phrases-exemples artificielles ou des usages vieillis, transmis d’une génération de grammairiens à la suivante, par des énoncés rigoureusement authentiques et contemporains. Un exemple nous est fourni par le chapitre sur « l’indicatif et le subjonctif dans la subordonnée » qui figure dans la toute récente réédition de la grammaire de Klein-Kleineidam (1998). On y trouve la phrase-exemple suivante :


(Jean se plaint de son père : )

Il interdit que nous allions au ciné. (Klein/Kleineidam 1998: 140)

 

De toute évidence, nous sommes en présence d’une phrase artificielle qui n’apparaîtrait jamais sous cette forme dans le type de discours oral que suggèrent le contexte (Jean se plaint de son père) et la troncation ciné. En l’espèce, on aurait fortement tendance à employer une construction infinitive du genre il nous interdit d’aller au ciné. Employé avec une complétive, interdire (au sens de défendre) appartient surtout à la langue politique et administrative. En voici quelques exemples authentiques :

 

Le président Ramos avait interdit que le cortège passe par Manille.

La loi interdit qu’on touche aux tombes des juifs, explique un rabbin.

J’ai interdit que ce système continue.

 

Ces cas d’inadéquation des grammaires sont légion ; inutile de les accumuler.

 

En troisième lieu, l’élimination de tous les phénomènes langagiers trop peu fréquents pour avoir un intérêt pédagogique.[11] Il s’agit de ne plus noyer l’apprenant dans un océan de formes somme toute peu usitées, surtout par rapport à l’oral. Ainsi, on aura quelque peine à entendre une forme conjuguée du verbe se distraire dans la bouche d’un Français. Il n’est donc nul besoin de le recenser dans une « Grundgrammatik », comme le font p.ex. Klein/Kleineidam 1998. Mais les verbes ne sont pas seuls en cause ; une analyse fouillée révèlerait que les grammaires scolaires accordent une attention disproportionnée à toutes sortes de phénomènes. Il en est ainsi des adverbes irréguliers comme excellemment ou immensément, qui figurent dans le Grammatisches Beiheft de Découvertes 3 (Göller/Spengler 1996: 22), alors qu’ils sont fort rares et ne présentent aucune utilité pour l’apprenant en troisième année de français. Là encore, d’ailleurs, si l’on juge indispensable d’intégrer ce genre d’adverbes, du moins faudrait-il signaler les restrictions syntaxiques auxquelles ils sont soumis ; immensément, par exemple, ne se trouve guère que devant des adjectifs (p.ex. immensément riche / populaire / fier / ...).

 

En quatrième lieu, l’adjonction de renseignements sur les phénomènes fréquents.11 Au niveau scolaire, il y aurait avantage à signaler, par exemple, l’ajout presque systématique d’un pronom dans le code oral, là où le code écrit n’en met pas :

 

t’en as rien à foutre de ce que je pense

je trouve ça limite qu’il nous ait rien dit

 

Deuxième exemple : l’emploi des prépositions. Dit-on je l’ai rencontré à une fête plutôt que je l’ai rencontré dans une fête ? Aucune grammaire ne nous le signale, et certains ouvrages vieillis n’apportent des précisions que sur l’emploi des prépositions avec des festivités auxquelles nos élèves n’auront sûrement pas l’occasion d’assister (dans un bal, dans un banquet). La réponse est que l’usage contemporain préfère la préposition à.

Au niveau universitaire, il faudrait, par exemple, indiquer la liste complète des noms, verbes et adjectifs qui prennent le verbe support savoir précédé d’une préposition lorsqu’ils introduisent une question indirecte :

 

curieux / inquiet / impatient (etc.) de savoir

téléphoner, faxer, réfléchir, s’interroger / interroger qqn, débattre (etc.) + pour savoir

s’inquiéter de savoir, attendre [afin] de savoir, se préoccuper de savoir, se soucier de savoir, tenter de savoir, exiger de savoir, la question de savoir, le problème de savoir, (des négociations) sur le point de savoir, (partagés) sur le fait de savoir, le souci de savoir, le tout est de savoir, l’important est de savoir, il s’agit de savoir (etc.)[12]

 

Des remarques analogues pourraient s’appliquer à d’autres points de grammaire.

 

A la fin de cette section, un constat étonnant s’impose : en dépit des milliers d’études consacrées à la grammaire du français, nos descriptions de celui-ci, qu’elles aient une visée linguistique ou pédagogique, ne reflètent souvent pas la réalité langagière. Il a été amplement démontré dans les pages précédentes que le seul moyen de remédier aux carences observées consiste à entreprendre des recherches sur corpus. Quant au cadre d’analyse à adopter, nous avons vu que l’approche lexico-grammaticale s’avère fort prometteuse.[13]

 

4. Quelle est la portée pédagogique de la linguistique de corpus ?

 

Les retombées pédagogiques des recherches sur corpus se situent sur deux plans : d’une part, le travail sur corpus, à l’aide de concordanciers, peut être conçu comme une nouvelle méthode de l’enseignement des langues et de la traduction. On parle alors d’ « apprentissage guidé par les données » (data-driven learning [Tim Johns]). D’autre part, l’approche lexico-grammaticale que nous venons d’illustrer permet de refonder la grammaire pédagogique sur de nouvelles bases.

 

Commençons par les concordanciers et l’usage que l’on peut en faire dans l’enseignement de la grammaire. Chalmel (1998) explore, dans un numéro antérieur de la présente revue, les possibilités méthodologiques offertes par les concordanciers monolingues (on peut regretter qu’elle ne fasse aucune mention de l’abondante littérature anglo-saxonne sur ce sujet):

 

Konkordanzprogramme wie das 1993 erschienene MICROCONCORD von Mike Scott und Tim Johns (Oxford University Press) bieten den Lernenden die Möglichkeit, sich mit sowohl strukturellen als auch lexikalischen Problemen auseinanderzusetzen und dabei die Fertigkeiten des Menschen als Informationsverarbeiter einzusetzen. Ihnen wird ein Textkorpus zur Verfügung gestellt, das es ihnen ermöglicht, Bedeutung und Gebrauch eines jeden Wortes selbst zu analysieren, indem sie dessen unmittelbaren Kontext beobachten und daraus Rückschlüsse ziehen. (Chalmel 1998: 52)

 

Chalmel illustre ses propos par deux exemples du travail sur corpus dans la classe de français, à savoir des concordances relatives à l’emploi du subjonctif et à la position des pronoms d’objet. Le domaine d’application de la linguistique de corpus ne s’arrête cependant pas là, comme nous l’avons montré dans la section précédente. On ne soulignera jamais assez que, outre des sujets évidents tels que la position des adjectifs ou celle des adverbes, les recherches de l’apprenant peuvent porter sur n’importe quel phénomène rencontré au hasard d’une lecture ou d’un exercice : la combinatoire de tel verbe, l’usage de telle préposition, l’emploi des pronoms relatifs, etc. Le concordancier s’avère donc un outil précieux favorisant l’éveil au langage (language awareness) et permettant aux apprenants avancés de trouver réponse à toutes leurs questions.

Dès lors, il paraît clair que l’enseignement de la rédaction et celui de la traduction vont tirer un plein profit du travail sur corpus. Dans ces domaines, les concordanciers classiques sont utilement complétés par les concordanciers bilingues capables d’analyser des textes « alignés », c’est-à-dire des couples de textes présentés en vis-à-vis et dont l’un est une traduction de l’autre. Se servant d’un concordancier bilingue (MULTICONCORD), Jean Rézeau a rédigé des leçons de grammaire comparée du français et de l’anglais, leçons accessibles en ligne à l’adresse http://www.uhb.fr/ rezeau_j et qui portent sur des sujets aussi variés que l’emploi de la préposition pour ou la construction for + groupe nominal + to-infinitif. A l’aide du même logiciel, les chercheurs du Groupe de Lexicographie Germanique de l’Université de Nancy II ont élaboré un dictionnaire des particules (Métrich/Faucher/Courdier 1994). Notre recherche, précédemment évoquée, sur les constructions du type « l’heure est au consensus » est un autre exemple de la façon dont la description d’un phénomène monolingue peut nous amener à poser des questions d’ordre traductologique.

A noter que les professeurs de langue et les enseignants de traduction auront désormais tous les moyens de mettre les nouveaux « mots de vocabulaire » en contexte. Prenons quelques exemples concrets. Avant d’introduire les unités lexicales désignant les parties du corps humain (tête, main, pied, oreille, etc.), le professeur de langue pourra procéder à une interrogation du corpus pour trouver les prépositions avec lesquelles ces noms se combinent le plus souvent. De même, lorsqu’il aura affaire à un patron phrastique comme ce que je sais, c’est que ..., il lui sera facile d’indiquer le lexique qui s’y associe communément. Avec des expressions toutes faites comme nuance (en fin de phrase) ou première nouvelle, il disposera d’un nombre suffisant d’occurrences pour spécifier leurs conditions d’emploi. Dans l’idéal, le professeur de traduction, lui, devrait pouvoir nommer toutes les variantes possibles d’un tour donné. S’il s’agit, pour prendre un exemple simple, de rendre en bon français un marqueur du discours comme es ist anzumerken, daß / it should be noted that, il faudra indiquer toute la gamme des possibilités, à savoir il faut remarquer que, il convient de remarquer que, remarquons que, on remarquera que, il est digne de remarque que, (il est) à remarquer que, on est conduit à remarquer que, il faut noter/signaler que, etc. (cf. Siepmann, en préparation). Comme pour le travail en classe de langue, ce genre de recherche peut porter sur n’importe quel phénomène langagier, du mot (la volonté de dialoguer / la disposition à dialoguer) à la phrase (l’atmosphère / l’ambiance / le climat est au compromis), en passant par les conventions textuelles (p.ex. l’emploi de questions rhétoriques au début des articles de presse français) ou les différences stylistiques entre deux langues (p.ex. l’analyse distributionnelle de and/et, cf. Quillard/Akhras 1996)

Pour une discussion complète du travail sur corpus en classe de langue, nous renvoyons le lecteur à Johns/King (1991), Murison-Bowie (1993) et Rüschoff/Wolff (1999).

 

Plus fondamentalement, le travail sur corpus permet de résoudre au moins trois problèmes auxquels l’enseignement du français langue étrangère, et plus particulièrement, l’enseignement grammatical, se heurte depuis toujours :

 

·      premièrement, la séparation des structures et des fonctions communicatives ;

·      deuxièmement, l’important décalage entre l’effort consacré à l’enseignement de la grammaire et celui consacré à l’enseignement du lexique (d’après Zimmermann 1984, entre 40 et 60 pour cent de nos cours sont consacrés à la grammaire) ;

·      troisièmement, l’incompréhensibilité des règles et de la terminologie grammaticales (cf. p.ex. Lübke 1989).

 

Une telle affirmation appelle toute une série d’explications. Nous avons montré plus haut que structures et fonctions communicatives sont indissociables : à un motif énonciatif correspondent d’abord un certain nombre d’unités lexicales, qui construisent à leur tour un environnement syntaxique déterminé. Nous avons vu aussi que les gros corpus nous permettent de construire un lexique-grammaire capable de spécifier la totalité des prototypes lexico-grammaticaux et, par voie de conséquence, la totalité des prototypes sémantico-fonctionnels entrant dans la composition d’une langue donnée. Par « prototype », nous entendons ici l’occurrence la plus fréquente d’une unité associative structure-lexique donnée. Si on revient à la construction « GN + (ne pas) être / rester + à GN », abondamment illustrée plus haut, on pourrait affirmer qu’un énoncé comme « l’heure est au changement » constitue le prototype de toute une classe d’expressions basées sur le même patron de phrase et ayant en commun un élément de sens. Inversement, la tournure « le vent est au changement » apparaît comme un cas limite de cette classe d’expressions, de même qu’un pingouin ne serait pas considéré comme un membre prototype de la classe des oiseaux. La notion de prototype, souvent appliquée au lexique (cf. p.ex. Aitchison 1996), est issue de la psychologie cognitive. C’est à Hüllen (1992) que revient le mérite d’avoir démontré l’utilité potentielle du concept pour la grammaire pédagogique.

Au lieu de procéder, comme le suggère Hüllen (1992: 23), à un sondage représentatif pour vérifier ce qu’est le prototype d’une unité associative donnée, nous proposons d’exploiter les données sur la fréquence que nous fournissent les gros corpus. Aussi pourrait-on envisager une fusion entre lexique-grammaire et grammaire cognitive qui nous permettra de contraster le typique avec l’atypique, le conventionnel avec le non-conventionnel, la norme « statistico-cognitive » avec l’écart. De là à la relativisation des notions de faute et de norme « didactique » (cf. Meißner 1999b), il n’y aura plus qu’un pas à franchir.

La construction de lexiques-grammaires pédagogiques permettra de rendre justice non seulement au caractère fonctionnel de la grammaire pédagogique et à la primauté du lexique dans l’enseignement des langues vivantes, mais aussi aux revendications récentes visant à faire une plus large place à l’oral dans la société du multi-média (Meißner 1999b). Au lieu de présenter, en fin de volume, des glossaires pauvres en « explications sur le vocabulaire » et « ne servant à rien d’autre qu’à faciliter la traduction (version) des textes dont la principale fonction est d’illustrer le thème grammatical » (Meißner 1999b: 14), les méthodes du futur présenteront aux apprenants des prototypes lexico-grammaticaux extrapolables, leur permettant ainsi de constituer un dense réseau d’associations mentales entre les fonctions communicatives, le lexique et les structures.

Les manuels de rédaction à l’usage des apprenants avancés de Gallagher/Siepmann (en préparation) représentent un premier pas dans ce sens. Les auteurs partent de fonctions linguistiques telles que « donner un exemple », « forger un concept » ou « exprimer une cause » pour décrire les prototypes lexico-grammaticaux, y compris les termes articulants, qui trouvent un emploi fréquent dans l’expression d’idées scientifiques. Leurs ouvrages se donnent pour premier but de faire découvrir au scripteur le potentiel de créativité inhérent à chaque prototype et de le guider ainsi vers une écriture « libre » qui exploite à fond les ressources de la langue étrangère. D’une manière un peu différente mais tout aussi innovante, Holten/Marasco (1998) opèrent une distinction entre la grammaire commune à tous les types d’anglais scientifique, le discours « informatif » (informational writing), le discours « argumentatif » (writing to persuade) et d’autres types de discours. Ainsi, par exemple, ils situent les auxiliaires de mode à l’intérieur du discours argumentatif. Cette approche novatrice est discutée de façon détaillée par Byrd (1998).

A noter, enfin, qu’un lexique-grammaire pédagogique, en collant à la surface de la langue sans faire appel à une quelconque structure profonde, pourrait avoir suffisamment de simplicité formelle pour ne pas s’éloigner outre mesure - ni dans sa conception ni dans son contenu - de la grammaire scolaire telle que nous la connaissons aujourd’hui. Ainsi que l’attestent les exemples précités et Sinclair (1990), l’usage de métalangage pourra, au contraire, être réduit au strict minimum.

 

5. En guise de conclusion

 

Pour terminer, rappelons que la linguistique de corpus, tout en permettant de résoudre des problèmes séculaires liés à l’enseignement des langues vivantes, ne saurait avoir la prétention de constituer un nouveau paradigme, ni à plus forte raison de poser, à elle seule, les fondements d’une nouvelle grammaire pédagogique. Cela, avons-nous dit, parce qu’elle n’est pas une discipline linguistique autonome, mais un ensemble de techniques et de méthodes permettant une nouvelle approche des faits de langue. On sait d’ailleurs que, vu la diversité des facteurs à prendre en compte, la prudence est de mise lorsqu’il s’agit d’établir un rapport entre description linguistique et description pédagogique d’une langue (cf. Bausch 1979, Dirven 1990, Mindt 1995b). Ces mises au point étant bien entendues, il est clair que le lexique-grammaire présente l’avantage d’être compatible avec tous les grands systèmes conceptuels et donc, à priori, avec une description de la langue jugée appropriée par les didacticiens. La grammaire pédagogique, croyons-nous, voit ainsi s’ouvrir des horizons plus larges.

 

Bibliographie

 

Aitchison, Jean, 1996. Words in the Mind: An Introduction to the Mental Lexicon, 2ème éd., Oxford, Blackwell.

 

Bausch, Karl-Richard (éd.), 1979. Beiträge zur didaktischen Grammatik, Königstein, Scriptor.

 

Blumenthal, Peter, 1992. Fehlerhafter Präpositionengebrauch in der französischen Fremdsprache, in Albert Barrera-Vidal/Manfred Raupach/Ekkehard Zöfgen (éds.), Grammatica vivat. Konzepte, Beschreibungen und Analysen zum Thema „Fremdsprachengrammatik“. In memoriam Hartmut Kleineidam, Tübingen, Narr, 113-135.

 

Bonnard, Henri, Leisinger, Hanno et Walther Traub, 1976. Grammatisches Wörterbuch Französisch. Dortmund: Lensing.

 

Bot, Kees de, 1992. A Bilingual Production Model: Levelt’s Speaking Model Adapted, Applied Linguistics 13, 1-24.

 

Byrd, Patricia, 1998. Grammar FROM context: Re-thinking the teaching of grammar at various proficiency levels, http://lookingahead.heinle.com/filing/from.htm.

 

Chalmel, Agnès, 1998. Konkordanzen: innovative konstruktivistische Lernmedien zur Erzeugung von Sprachbewußtheit, französisch heute 1, 45-56.

 

Confais, Jean Paul, 1978. Grammaire explicative, Munich: Hueber.

 

Dirven, René, 1990. Pedagogical Grammar, Language Teaching 23, 1-18.

 

Encyclopaedia Universalis.

 

Francis, Gill, 1993. A Corpus-Driven Approach to Grammar, in Mona Baker, Gill Francis et Elegna Tognini-Bonelli, Text and Technology : In honour of John Sinclair, Amsterdam/Philadelphia, Benjamins, 137-156.

 

Gallagher, John D. et Dirk Siepmann (en préparation), Writing in English: a Guide for Advanced Learners, Academics and Translators.

Gallagher, John D. et Dirk Siepmann (en préparation), Ecrire en français. Guide de l’expression écrite à l’usage des étudiants en français langue étrangère.

Gallagher, John D. et Dirk Siepmann (en préparation), Vom Wort zum Text. Ein Lehr- und Nachschlagewerk zur Textproduktion im Deutschen.

 

Göller, Alfred et Wolfgang Spengler, 1996. Etudes françaises : Découvertes (Série verte). Grammatisches Beiheft, Stuttgart, Klett.

 

Goleman, Daniel, 1997. Quand l’esprit dialogue avec le corps. Entretiens avec le Dalaï-Lama sur la conscience, les émotions et la santé, Paris, Trédaniel.

 

Gross, Gaston, 1986. Les constructions nominales et l’élaboration d’un lexique-grammaire, Langue française 69, 5-27.

 

Gross, Gaston, 1989. Les constructions converses du français, Genève/Paris, Droz.

 

Haas, Joachim et Danielle Tanc, 1983. Französische Grammatik, Francfort sur le Main, Diesterweg.

 

Harris, Zellig S., 1951. Methods in Structural Linguistics, Chicago, University of Chicago Press.

 

Holten, Christine et Judith Marasco, 1998. Looking Ahead 4. Mastering Academic Writing, Boston, Heinle&Heinle.

 

Huber, Herbert et Max Bouchette, 1982. Quel article?, Francfort sur le Main, Diesterweg.

 

Johns, Tim et P. King, 1991. Classroom Concordancing, ELR Journal (New Series), vol. 4, Birmingham, Centre for English Language Studies, University of Birmingham.

 

Klein, Hans-Wilhelm et Hartmut Kleineidam, 1998. Etudes Françaises : Grundgrammatik, Stuttgart, Klett.

 

Laporte, Eric (éd.), 1999. Lexique-grammaire des adjectifs, Langages (133).

 

Lübke, Diethard, 1989. Benutzerfreundlichkeit französischer Schulgrammatiken, Der fremdsprachliche Unterricht 96, 23-26.

 

McEnery, Tony et Andrew Wilson, 1996.  Corpus Linguistics, Edinburgh, Edinburgh University Press.

 

Meißner, Franz-Joseph, 1999a. Grammatik im Französischunterricht der Sekundarstufe - wieviel, welche, wie?

 

Meißner, Franz-Joseph, 1999b. La faute entre oralité et scripturalité et seize paradoxes méthodologiques de FLE, ...

 

Métrich, René, Faucher, Eugène et Gilbert Courdier, 1994. Les invariables difficiles. Dictionnaire allemand-français des particules, connecteurs, interjections et autres « mots de la communication » (3ème éd.), Groupe de Lexicographie Germanique de l’Université de Nancy II.

 

Mindt, Dieter, 1993. Sprachdaten - Computer - Grammatiken für den Fremdsprachenunterricht, in Darski, Jozef et Zygmunt Vetulani (éds.), Sprache - Kommunikation - Informatik: Akten des 26. Linguistischen Kolloquiums, Poznan 1991, Tübingen, Niemeyer.

 

Mindt, Dieter, 1995a. An Empirical Grammar of the English Verb : Modal Verbs, Berlin, Cornelsen.

 

Mindt, Dieter, 1995b. Schulgrammatik vs. Grammatik der englischen Sprache, in Claus Gnutzmann/Frank G. Königs, Perspektiven des Grammatikunterrichts, Tübingen, Narr, 47-68.

 

Murison-Bowie, Simon, 1993. MICROCONCORD Manual: An Introduction to the Practices and Principles of Concordancing in Language Teaching, Oxford, Oxford University Press.

 

Quillard, Geneviève et Georges Akhras, 1996. And/et : Analyse distributionnelle de la conjonction copulative en français et en anglais, Meta 3, 459-470.

 

Rüschoff, Bernd et Dieter Wolff, 1999. Fremdsprachenlernen in der Wissensgesellschaft: zum Einsatz der neuen Technologien in Schule und Unterricht, Munich, Hueber.

 

Siepmann, Dirk, 1998. Compte-rendu de John Sinclair (éd.), Collins Cobuild Collocations CD-ROM, Fremdsprachen und Hochschule 53, 134-137.

 

Siepmann, Dirk (en préparation). Text Organisation across Languages: a Study of Multi-Word Discourse Markers in English, French and German Academic and Journalistic Texts with Implications for the Teaching of Writing and Translation.

 

Sinclair, John (éd.), 1990. Collins Cobuild English Grammar, Londres, Collins.

 

Sinclair, John, 1991. Corpus, Concordance, Collocation, Oxford, Oxford University Press.

 

Sinclair, John (éd.), 1995. Collins Cobuild Collocations on CD-ROM, Londres, HarperCollins.

 

Sinclair, John, 1996a. Preliminary Recommendations on Corpus Typology, Rap. tech., EAGLES, mai 1996, CEE.

 

Sinclair, John (éd.), 1996b. Collins Cobuild Grammar Patterns 1: Verbs, Londres, Collins.

 

Spang-Hanssen, Ebbe, 1963. Les Prépositions incolores du Français moderne, Copenhague, G.E.C. Gads.

 

Winter, Eugene, 1982. Towards a Contextual Grammar of English, Londres, George Allen and Unwin.

 

Zimmermann, Günter, 1984. Erkundungen zur Praxis des Grammatikunterrichts, Francfort sur le Main, Diesterweg.



[1] Notons encore que la définition du Petit Robert ne tient pas compte de l’émergence récente de corpus de suivi (monitor corpora), qui, loin d’être des ensembles finis, sont approvisionnés en données textuelles « fraîches » à intervalles réguliers et, partant, évoluent avec leur temps.

[2] A bon entendeur, salut : nous ne suggérons en aucune manière que la grammaire pédagogique puisse être une simple adaptation de la grammaire linguistique (voir la conclusion du présent article).

[3] Ne sont pas prises en compte ici les combinaisons verbe + adjectif qui peuvent être construites avec une complétive introduite par la conjonction que. Grevisse semble d’ailleurs suggérer qu’il y a un libre choix entre la proposition infinitive et la complétive avec que, ce qui est loin d’être le cas. Pour ne citer qu’un exemple, la collocation rendre manifeste (cf. p.ex.: En outre, l’opération de déplacement rend manifeste que ses constituants sont interprétés comme des sujets ...) ne peut être suivi de l’infinif avec de.

[4] On entend par « concordance » une liste comportant les occurrences d’une unité-pôle (node en anglais) environnée de ses contextes d’emploi.

[5] Des efforts en vue de la construction d’un lexique-grammaire sont aussi menés en France (cf. p.ex. Laporte 1999), avec cependant une orientation plutôt théorique.

[6] Là encore, on relève des parallèles avec l’évolution d’autres sciences. Après une période résolument tournée vers l’empirisme, les neurosciences et la psychologie, par exemple, tentent de mettre à profit le savoir introspectif des grands maîtres bouddhistes pour accéder à une meilleure compréhension des possibilités d’éducation émotionnelle (cf. p.ex. Goleman 1997). De même que le psychologue tente de relier expérience intérieure et observation scientifique, de même le linguiste affine ses intuitions en sollicitant le corpus.

[7] Si l’on peut considérer certaines structures simples, telles que S-V, comme étant relativement libres du point de vue lexical, elles obéissent sans doute à des contraintes plus fortes qu’il n’y paraît à première vue. Comme le dit John Sinclair : « To illustrate a simple subject-verb clause, something like ‘Birds sing’ is not good enough. With the Cobuild database it is not difficult to find examples even of a fairly rare event like this structure. ‘Trains stopped’ is a genuine example, and so is ‘Frey agreed’. » (Sinclair 1990 : xi; c’est nous qui soulignons)

[8] Bonnard (1976) et Blumenthal (1992) répertorient également quelques exemples d’emploi. Gross (1986, 1989) ne tient pas compte de l’infinitif complément de nom.

[9] Sont laissés en marge de l’analyse les collocations figées telles que avoir hâte de, avoir honte de, avoir l’intérêt de, avoir la joie de, avoir le plaisir de, avoir qualité à/pour, avoir scrupule à, avoir peine à ou avoir plaisir à. Haas/Tanc (1983: 188-189) mentionnent un petit nombre de ces locutions verbales dans lesquelles l’infinitif se rattache au groupe verbal plutôt qu’au nom (cf. Spang-Hanssen 1963: 113). Nous ne prenons pas non plus en compte les constructions, assez fréquentes, dans lesquelles l’infinitif se rattache au groupe verbe + objet direct (p.ex. ne pas voir d’inconvénient à).

[10] Seul le Petit Robert cite, p. 1088, la structure négative l’heure n’est pas à qqc, la classant à tort parmi les locutions.

[11] Les didacticiens s’interrogent depuis longtemps déjà sur la sélection des faits grammaticaux propres à être intégrés dans l’enseignement. Qu’il suffise de mentionner les projets menés par le Conseil de l’Europe sur le Niveau Seuil.

[12] Il faut dire à la décharge des grammaires universitaires qu’un certain nombre de ces lexies sont mentionnées par Haas/Tanc (1983) et par Confais (1978).

[13] Nous ne nions nullement l’utilité d’autres approches. Ainsi, on voit mal comment l’approche lexico-grammaticale pourrait être appliquée à la description du style indirect libre.