Linguistique
de corpus et grammaire : une nouvelle donne pour l’enseignement du français
langue étrangère
1.
Introduction
Le présent article se
situe à la frontière séparant linguistique et didactique des langues vivantes.
Il s’inscrit dans un champ de recherche négligé par les francistes jusqu’à une
période récente, mais susceptible d’avoir des répercussions importantes sur
l’enseignement du français langue étrangère : celui de la linguistique de
corpus. En effet, les gros corpus de textes électroniques aujourd’hui
disponibles, notamment sous leur forme étiquetée ou arborée, permettent une
approche lexicale des faits grammaticaux qui ne tardera pas à révolutionner la
conception des grammaires pédagogiques du français. En vue d’un premier
déblayage du terrain, on commence par examiner la notion même de « linguistique
de corpus » pour tenter ensuite d’en illustrer les apports, aussi bien
systématiques que ponctuels, au domaine de la grammaire. Chemin faisant, on
fournit non seulement des éclairages inédits sur certains points grammaticaux,
mais on comble aussi certaines lacunes des grammaires et des dictionnaires, de
sorte que les enseignants de français qui s’intéressent moins à la théorie qu’à
la pratique de la langue y trouveront également leur compte. On finit par une
réflexion plus générale sur la portée pédagogique de la linguistique de corpus.
Il reste à signaler que
cet article se place dans le droit prolongement des travaux pionniers sur
l’anglais entrepris par John Sinclair (1990, 1991, 1995, 1996b) et par Gill
Francis (1993), tout en nuançant et développant leur pensée. Ces travaux ont
inspiré nombre d’autres chercheurs, dont l’angliciste allemand Dieter Mindt
(p.ex. 1993, 1995a, 1995b).
2. Qu’est-ce que la linguistique de corpus ?
Un corpus, c’est, dans
le sens linguistique du terme, « un ensemble fini d’énoncés réels réuni en vue
de l’étude d’un phénomène linguistique » (Petit
Robert). Pour parler clair, le linguiste de corpus, au lieu de forger
lui-même des exemples de ce qu’il croit être l’usage, se fonde sur des textes
authentiques et des textes authentiques seulement. Quant à savoir si ces textes
doivent former un tout homogène, les avis divergent ; l’on opère parfois une
distinction entre les simples « collections de textes » (text archives en anglais) et les corpus proprement dits, construits
d’après des critères de rassemblement bien précis (Sinclair 1996a).[1] Selon le point de vue adopté, on peut faire remonter plus ou moins loin
dans le temps les premiers travaux linguistiques à partir de corpus. Ainsi, on
peut supposer que le De lingua latina
d’un Varron, datant du premier siècle avant Jésus-Christ et dont quelques
volumes seulement sont parvenus jusqu’à nous, a dû s’appuyer sur un corpus
fourni d’exemples. Plus proche de nous, le Dictionnaire
des mots et des choses de Pierre Richelet (1680) est le premier à intégrer
un grand nombre de citations d’auteur, à une époque où l’Académie, elle, y
répugne - comme elle continuera, d’ailleurs, de le faire jusqu’en 1986.
Au cours des trois
premiers quarts du XXe siècle, les linguistes se fondent sur des observations
faites à partir de corpus dans quatre domaines principaux : grammaire,
lexicographie, étude des dialectes et didactique des langues vivantes (Kennedy
1998). Qu’il suffise de mentionner, en linguistique française, le monumental Bon Usage de Grevisse, dont la première
édition remonte à 1936, la non moins imposante Grammaire française de Togeby, achevée par ses collaborateurs après
sa mort accidentelle en 1974, ainsi que les travaux de Gougenheim visant à
délimiter un vocabulaire de base.
A partir des années
soixante, l’avènement d’ordinateurs de plus en plus puissants commence à rendre
obsolète l’analyse manuelle des textes. La critique de naguère, selon laquelle
le travail sur corpus est trop coûteux en temps, ne sera dorénavant plus
valable. L’année 1961 marque le véritable coup d’envoi des travaux sur corpus,
avec la constitution du premier corpus informatisé par une équipe de chercheurs
de l’université Brown aux Etats-Unis. En France, à la même époque, on commence
à rassembler la base textuelle Frantext.
Ce fonds, désormais interrogeable sur Internet et comptant actuellement quelque
180 millions de mots (pris ici au sens statistique d’ « unité séparée par deux
blancs »), a servi à la rédaction du Trésor
de la Langue Française. Enfin, avec l’arrivée du traitement de texte dans
les années quatre-vingt, la plupart des données textuelles sont automatiquement
saisies sur support électronique, ce qui permet l’acroissement des corpus
écrits par plusieurs ordres de grandeur. Les plus vastes d’entre eux, tous de
langue anglaise, flirtent aujourd’hui avec la barre magique du milliard de
mots. Pour fixer les idées, précisons que le présent article compte 9000 mots,
de sorte qu’un corpus de 100 millions de mots, comme le British National Corpus, équivaut à environ 11100 articles de même
taille ! Force est pourtant de reconnaître que les corpus de l’oral sont moins
volumineux, étant donné l’impossibilité, pour l’heure, de convertir
automatiquement en texte écrit des enregistrements de langue parlée. La partie
orale du British National Corpus, par exemple, ne comprend que 10 millions de
mots.
Signalons enfin que, vu
la diversité des approches fondées sur la linguistique de corpus, celle-ci ne
peut être comprise comme une discipline linguistique au même titre que la
syntaxe, la sémantique ou la pragmalinguistique (cf. McEnery/Wilson 1996: 2).
C’est plutôt une nouvelle manière de procéder, susceptible d’être appliquée à
n’importe quel objet d’étude et capable, comme nous le verrons maintenant pour
la grammaire, d’ouvrir de nouvelles perspectives.
3. Que nous apporte la linguistique de corpus dans le
domaine grammatical?
3.1. Apports systématiques
Pour bien apprécier les
enjeux contemporains de la recherche en grammaire, il importe de commencer par
un bref aperçu historique. C’est Chomsky qui, au milieu du siècle, déplace le
centre de gravité de la linguistique de l’empirisme vers le rationalisme. Selon
lui, le véritable objet d’étude de la linguistique serait le savoir
linguistique du locuteur natif ou, plus précisément, une « compétence
linguistique » projetée dans l’absolu plutôt qu’une « performance » forcément
entachée d’erreurs. Or, les corpus renferment des données fondées sur la
performance ; en bonne logique, toujours selon Chomsky, ils ne sauraient
contribuer à la modélisation de la compétence linguistique. Conséquence :
nombre de linguistes, dans les années cinquante à quatre-vingt, abandonnent le
travail sur corpus, préférant se fier à leur seule intuition. Notons au passage
que ce changement d’orientation offre quelque analogie avec l’évolution
d’autres sciences, comme par exemple la psychologie, où on voit pendant
longtemps s’opposer cognitivistes et behavioristes. C’est d’ailleurs contre la
théorie de l’acquisition linguistique du behavioriste Skinner que Chomsky émet
des critiques judicieuses.
Avec le recul, on
s’aperçoit que la principale contribution de la grammaire d’inspiration chomskienne
à la linguistique réside dans la mise en évidence de la générativité du langage
; d’où le terme de « grammaire générative », lequel renvoie à la capacité des
langues naturelles d’engendrer, à partir d’un ensemble fini de règles
syntaxiques, un nombre potentiellement infini de phrases. Etant donné cette
infinitude du langage, aucun corpus, si grand soit-il, ne saurait en être le
seul explicandum. Ce constat est
d’une telle banalité aujourd’hui qu’on hésite à croire qu’avant Chomsky,
d’aucuns étaient convaincus que le but du linguiste était de rendre compte des
seules phrases réunies dans son corpus de travail (p.ex. Harris 1951).
Force est cependant de
constater que le recours à la seule introspection prônée par Chomsky est vicié
à la base. En effet, les phrases-exemples obtenues par ce moyen sont souvent
artificielles, et ce pour deux raisons principales.
D’abord, ce sont, dans
le meilleur des cas, des idéalisations, dans le pire des cas, des inventions
pures et simples. Voyons deux exemples glanés au hasard dans des écrits
d’obédience chomskienne :
(1) Il a été perdu une valise par un voyageur (Delaveau/Kerleroux 1985: 31)
(2) Qui crois-tu que Jean pense que Marie aime? (Encyclopaedia Universalis, s.v. Chomsky)
Le locuteur natif,
interrogé sur l’acceptabilité de ce genre de phrases, répond souvent en forme
de boutade : « Oui, ça pourrait se dire. Mais on ne le dit jamais. ». Le
caractère artificiel de ces phrases-exemples vient de ce qu’ils s’inscrivent
dans un raisonnement purement théorique. Celui-ci a pour seule fonction de
contraster, hors de tout contexte, deux ou plusieurs structures isolées afin de
donner du relief aux contraintes syntaxiques sous-jacentes (cf. Francis 1993:
138). Ainsi, dans le premier exemple, il s’agit de mettre en évidence les
propriétés syntaxiques des constructions comportant un il impersonnel en position de sujet. Mise en correspondance avec «
Il a été perdu une valise », la phrase-exemple permet d’observer que le sujet
référentiel de la phrase (« un voyageur ») peut être réalisé facultativement,
ce qui n’est pas le cas pour les constructions introduites par un verbe
impersonnel tel que « il faut ». Or, c’est précisément l’adjonction du groupe
prépositionnel « par un voyageur » qui rend la phrase inacceptable. Tout en étant
parfaitement conforme aux règles grammaticales au sens étroit, elle n’obéit pas
aux exigences de pertinence discursive. Il est en effet difficile d’imaginer
des contextes réels dans lesquels pourrait s’inscrire un énoncé de cette
nature. Il serait possible de tenir le même type de raisonnement à propos du
deuxième exemple ; nous en laissons le soin au lecteur.
La deuxième raison de
l’artificialité des exemples dérivant de l’introspection, c’est leur manque de
fiabilité. Sinclair a souvent insisté sur ce point, maints exemples à l’appui ;
plus récemment, des germanistes français travaillant sur corpus sont venus
confirmer ses mises en garde contre le caractère trompeur des intuitions :
Que de fois, en effet, n’avons-nous pas été surpris par la réalité de l’usage,
que de fois n’avons-nous pas constaté que l’idée que nous nous faisions de ces
mots, de leur comportement syntaxique ou de leur fonctionnement sémantique,
était prise en défaut sur tel point ou méritait un complément d’examen sur tel
autre. (Métrich/Faucher/Courdier 1994: 10)
Il convient toutefois de nuancer quelque peu la priorité absolue accordée au
corpus par Sinclair et son équipe de Cobuild.
Certes, il n’est pas indiqué, comme le suggère Aarts (1991, cité d’après
Francis 1993), de faire appel à l’intuition pour inventer de toutes pièces une
grammaire et de ne la tester qu’ensuite sur les phrases d’un corpus. Encore
faut-il reconnaître que l’intuition peut aider le linguiste à dénicher des
phénomènes dignes de son intérêt et à éviter les erreurs d’analyse que peut
commettre l’ordinateur. Le Collins
Cobuild Collocations CD-ROM (Sinclair 1995) est un exemple dissuasif de la
façon dont l’absence d’intervention humaine peut conduire à des erreurs
gravissimes (cf. mon compte-rendu de l’ouvrage [Siepmann 1998]).
On est fondé à conclure
qu’une grammaire nouvelle, et plus particulièrement la grammaire pédagogique[2], doit prendre le contre-pied de l’approche hypothético-déductive, qui
consiste, on l’a vu, à contraster des potentialités et non pas des réalités
langagières. Francis (1993: 138) parle à ce sujet de grammaire «
non-contrastive » : il s’agit de ne pas travailler dans la pure abstraction
chomskienne, mais bien plutôt de montrer comment fonctionne chaque structure et
chaque lexie prise en elle-même. Cette critique faite, l’incontestable mérite
de la grammaire générative-transformationnelle est d’avoir démontré que le
recours au corpus n’est pas suffisant pour rendre un compte explicite du
fonctionnement d’une langue. Un juste milieu est à trouver entre l’exploitation
du corpus et l’introspection, mais, en raison du manque de fiabilité des
données obtenues par l’introspection, le corpus aura le dernier mot.
Il est temps d’élargir
le champ de notre analyse aux grammaires traditionnelles (entendez : celles qui
ne se situent pas dans la ligne de pensée de Chomsky). Les deux types de
grammaire ont en commun, pour ainsi dire, de mettre la charrue devant les
boeufs. Expliquons-nous. Comme le soulignent les modèles de production du
langage tels que Bot (1992), tout acte d’énonciation comprend quatre phases
successives : 1. désir de s’exprimer et choix du code 2. lexicalisation 3.
choix de la morphosyntaxe 4. articulation ou rédaction. Dans un premier temps,
le locuteur natif choisit parmi une multitude d’unités lexicales celles qui
conviennent le mieux à l’acte de communication qu’il souhaite accomplir ; c’est
seulement après que ces unités lexicales s’insèrent dans une structure
syntaxique susceptible de les accueillir. En dernière analyse, lexique et syntaxe
s’avèrent donc indissociables. Or, la grande majorité des grammaires
traditionnelles partent du principe, fût-ce implicitement, que la syntaxe
constitue un niveau d’organisation indépendant. Du coup, elles inversent le
processus qu’on vient de décrire. Tout se passe comme si les constituants
phrastiques - sujet, verbe, objet, complément d’objet, etc. - étaient autant de
trous que l’on puisse boucher presque indifféremment avec du lexique. En nous
inspirant largement des travaux sur l’anglais de Francis (1993), prenons un
exemple concret : celui de l’infinitif précédé par la préposition de et utilisé en fonction d’attribut du
complément d’objet. Grevisse (1994: 458) note à son propos que « le complément
d’objet accompagné d’un attribut est souvent un infinitif introduit par la
préposition de ou une proposition ».
On voit explicitée ici la démarche des grammairiens traditionnels, laquelle
part uniquement de la structure en soi. On cherchera en vain quelque précision
que ce soit sur la nature des lexies qui y sont habituellement incorporées,
encore que, par la force des choses, Grevisse soit bien obligé d’en utiliser
quelques-unes dans son exemplier (croire/considérer
comme inutile, rendre impossible, trouver avantageux)[3]. Un bref sondage du corpus donne à voir une image plus rigoureuse de la
réalité langagière :
|
étaient
apparues. Agnès trouvait aberrant de faire et refaire des poches de
saharien |
|
l'ouverture d'un musée trouvent absurde
de démonter ces boiseries : " Ce décor perd |
|
salariés d'Air France estiment
acceptable l'idée de baisser leurs salairesL'état d |
|
Le duc (André Lefaur), croit alors utile
de préciser : " Messieurs, messieurs, la d |
|
au
Sir Mortimer Gussage croit bon de convier Kemble à son dîner. Ce
repas, au cours |
|
e quand un académicien jugea bon de
dévoiler que le français ressemblait au latin c |
|
. A
l'heure où certains croient bon de distinguer le culte et la culture, il impor |
|
se
livrait Bukowski, ni trouvé bon de s'opposer à son expulsion. Encore
maintenant, |
|
uple
de terroristes, je trouve important de montrer la réalité.
Malheureusement, cer |
|
ons
de ce temps, car je trouverais indécent de faire mousser l'histoire
d'un enfant |
|
pays développés : cela rend
indispensable de disposer d’indicateurs sur les taux d’ |
|
ses cinq métiers, ils jugent nécessaire
de céder les activités de nutrition animal |
|
,
le secrétaire général estime nécessaire de clarifier le rôle des
" casques bleus " |
|
iverses
que M. Vignoble estime nécessaire de clarifier la situation. Les
montages fi |
|
tervenant
que lorsqu'il juge nécessaire de corriger certains excès ou de s'en
démarq |
|
ril
terrifiant. Et s'il juge prématuré de dire que ces gouvernements ont
entrepris u |
|
açonnerie
ni juive ; je trouvais répugnant de signer, mais personne ne s'y
refusait. |
Point n’est besoin d’analyser
cet extrait de concordance[4] pour s’apercevoir que la structure en question est soumise à de fortes
contraintes. Ce qui frappe de prime abord, c’est que les verbes et adjectifs
déclencheurs de cet emploi de l’infinitif sont en nombre restreint. Les verbes
ressortissent à deux champs sémantiques, dont le premier ne compte qu’un seul
élément (rendre), alors que le second
est mieux pourvu (estimer, croire, juger,
penser, trouver, considérer comme, + ?). Les adjectifs, eux, constituent un
groupe un peu plus étendu, mais assez homogène ; parmi les plus fréquents, qui
représentent plus de la moitié des occurrences, on trouve bon, commode, important, nécessaire, normal, opportun,
possible, préférable et utile.
Loin derrière viennent des vocables tels que prudent, absurde ou, dans
la langue familière, limite (cf.
l’allemand grenzwertig). On peut
également noter que ces adjectifs se répartissent en deux classes, les uns
exprimant une modalité affective (bon,
invivable), les autres marquant une
modalité intellectuelle (possible, nécessaire).
Il convient aussi de
repérer l’imbrication des deux catégories grammaticales considérées, certains
adjectifs formant avec certains verbes des collocations stables (p.ex. croire/juger + bon, juger + prématuré dans
la langue de presse, trouver + normal /
limite dans la langue parlée), alors que d’autres s’associent plus
librement (croire/penser/juger/trouver +
possible).
Enfin, si l’on creuse
encore, on verra que toutes ces unités associatives véhiculent une même
fonction, celle d’exprimer une attitude évaluatrice par rapport au contenu de
la proposition infinitive. C’est là le point crucial de l’approche «
lexico-grammaticale » (Francis 1993[5]) que nous venons d’illustrer : la mise en lumière des liens
d’interdépendance entre fonctions communicatives, lexique et structures. Cette
approche sera développée dans la suite du présent article.
Cela étant, on peut
s’interroger sur les avantages offerts par l’analyse de corpus assistée par
ordinateur. Quel est son plus par rapport au dépouillement manuel ? La réponse
est triple : d’abord, les vastes corpus électroniques permettent, en règle
générale, d’obtenir un nombre plus important d’attestations d’un phénomène
donné ou de prendre en compte des faits de plus vaste nature. Cela entraîne le
corollaire qu’on peut se faire une idée très précise de la fréquence d’emploi
d’un syntagme, des transformations dont il est passible, etc. N’oublions pas en
effet qu’aucun locuteur natif ne possède une maîtrise complète de sa langue
maternelle, raison pour laquelle l’introspection ne peut jamais donner à voir
qu’une partie de la langue. A chacun de faire le test en essayant de répondre à
ces deux questions : 1. Quels autres noms peuvent occuper la position sujet
dans le type de construction illustré par les deux phrases suivantes ? 2.
Quelle est leur fréquence respective dans la construction en question ?
L’heure n’est pas aux plaisanteries.
L’heure est au consensus.
(Les réponses seront
données ultérieurement ; il y a fort à parier que ni le lecteur de langue
maternelle française ni le franciste confirmé ne parviendra à énumérer la liste
complète des noms en question, ni à plus forte raison de deviner leur
fréquence. C.Q.F.D.)
Ensuite, le travail sur
corpus donne à chaque exemple son indispensable cachet d’authenticité ; nul
besoin désormais d’inventer des énoncés qui risqueraient d’être peu naturels.
Enfin et surtout,
certains faits de langue, quoique de plein usage, tendent à échapper à
l’observation « à l’oeil nu ». L’observateur humain, pour minutieux qu’il soit,
a tendance à s’attarder sur les structures inattendues et les raffinements de
style, laissant passer à travers les mailles de son filet tout ce qui relève du
banal. Cela est particulièrement vrai pour le linguiste qui étudie sa propre langue
maternelle, où tout lui paraît aller de soi.
De tout quoi il ressort
que le travail à partir de gros corpus a d’indéniables avantages : il permet
l’élaboration de lexiques-grammaires presque exhaustifs, ancrés fermement dans
la langue réelle, et pouvant prétendre, plus que les grammaires
traditionnelles, à refléter des réalités cognitives.[6] La tâche des grammairiens du futur consistera à décrire les propriétés
syntaxiques de la majorité des unités lexicales et, dans une optique
complémentaire, de spécifier les unités lexicales susceptibles d’entrer dans
une structure grammaticale donnée (cf. Francis 1993: 155).[7] Mission impossible ? Tâche herculéenne tout au moins, mais qui a déjà été
accomplie pour une partie du lexique anglais, à savoir les verbes (Sinclair
1996b).
Dans ce qui suit, nous
allons exemplifier de façon raisonnée certains éléments d’un lexique-grammaire
du français. Pour ce faire, nous empruntons à Sinclair (1991) l’idée selon
laquelle les combinaisons de mots s’étendent sur un continuum bipolaire allant
du plus figé au moins figé. Ainsi, on conçoit aisément que les expressions
idiomatiques sont presque totalement figées. Une fois, en effet, qu’on choisit
de prendre position en disant ou en écrivant, par exemple, honni soit qui mal y pense, il n’y a plus de variation possible - à
moins de vouloir faire de l’esprit. Autrement dit, à une intention
communicative très précise correspond ici une seule structure. C’est déjà moins
le cas pour une locution telle que jeter
un pavé dans la mare, face à laquelle on peut avoir de nombreuses
variantes, comme en témoigne la concordance suivante :
|
us tout en gagnant moins
". Ensuite, ce pavé dans la mare était lancé par quelqu |
|
andes figures de Solidarité,
a lancé un pavé dans la mare en déclarant publiquem |
|
ion dans la balance, mais en
lançant un pavé dans la mare. " Je suis convaincu q |
|
, le 29 mai, ce qui est
apparu comme un pavé dans la mare. S'il n'est pas mis fi |
|
l'éditorialiste de la Lettre a jeté un pavé dans la mare
néogaulliste. Sous le |
|
té ", Edouard Balladur a jeté un beau pavé dans la mare
syndicale (le Monde du |
|
atronal du bâtiment a jeté
un véritable pavé dans la mare en
affirmant que la |
|
section socialiste, envoyait
un premier pavé dans la mare. Il soupçonnait des ma |
|
r l'instant du moins, à
lancer quelques pavés dans la mare du débat sur la " fra |
|
hoisi par le juge Garzon
pour jeter son pavé dans la mare sent le coup politique |
En l’occurrence, le
verbe jeter est concurrencé par lancer et envoyer. On voit aussi que l’on peut isoler le syntagme un pavé dans la mare pour l’employer
avec d’autres verbes (apparaître comme un
pavé dans la mare). En outre, les deux noms pavé et mare sont
susceptibles de certaines modifications - autant de choix lexico-syntaxiques
qui donnent une relative liberté aux locuteurs désireux de s’exprimer au moyen
de cette locution.
Notre premier exemple,
qui illustre un phénomène situé vers le pôle « moins figé » du continuum
phraséologique, concerne la combinatoire des noms et plus particulièrement
l’infinitif complément de nom. Nous sommes là dans un domaine grammatical
encore largement inexploré ; à notre connaissance, Sandfeld (1943) et
Spang-Hanssen (1963) sont les seuls à s’y être aventurés[8]. Même si les grands dictionnaires monolingues, les dictionnaires de
collocation et les grammaires citent quelques rares exemples d’emploi, leur
traitement de ce phénomène est loin d’être satisfaisant, surtout du point de
vue des apprenants du français langue étrangère.
L’ensemble des noms qui
nous intéresse ici présente la propriété commune d’être construit avec
l’infinitif introduit par la préposition à.
Le tableau suivant regroupe quelques lignes extraites d’une concordance, les
mots-pôles étant triés par ordre alphabétique :
|
gardera pour lui les raisons de son avidité à voir disparaître
le gentleman-ch |
|
années, en particulier par sa disponibilité à agir sur des
théâtres extérieurs |
|
parlé des cahiers de 1905 et son insistance à l’accompagner
ensuite au Café de l |
|
qui n’est qu’à lui. Une prodigieuse liberté à passer, ni vu ni
connu, de la pros |
|
uelque discipline que ce
soit, il y a profit à vérifier, à affiner, à améliorer |
|
stionnaires celles-ci n’ont
aucune réticence à recourir à une technique d’estim |
|
de Toulon, Orange et
Marignane leur timidité à appliquer le programme du Front Na |
|
et l’on comprend alors qu’il
y avait urgence à venir observer ce Chinatown géant |
On perçoit sur ces
exemples que les noms étudiés se différencient par leur sémantisme. Ils se
laissent ranger en trois grandes familles de sens aux frontières perméables :
1. difficulté*, capacité*, efficacité*,
aisance, habileté, facilité, aptitude, faculté, disposition, propension -
incapacité*, impossibilité*, impuissance, inaptitude, inefficacité,
incompétence, inexpérience, etc.
Cette première famille de sens comprend des noms
ayant trait à la capacité, ou à l’incapacité, du locuteur à faire quelque
chose.
2. acharnement*, application, ardeur*, art*,
aspiration, aversion, avidité*, complaisance, culpabilité*,
curiosité*, dextérité, diligence, disponibilité, engagement*,
faiblesse, fierté*, fièvre*, hâte*,
hésitation, impatience*, insistance, invitation*,
joie*, liberté*, naïveté*, obstination*,
opiniâtreté, plaisir*, pudeur, pugnacité, rage*, rapidité, répugnance,
résistance, réticence, scrupule*, satisfaction*, tenacité, tiédeur, timidité,
vigilance, vigueur, virtuosité, bonne/mauvaise volonté[9], etc.
Cette deuxième famille de sens comprend des noms
ayant trait, de près ou de loin, aux qualités intellectuelles et morales.
3. avantage, intérêt, profit, danger, importance, urgence
Les membres de ce troisième groupe ont ceci de
particulier qu’ils ne s’emploient avec à que
dans des constructions du type avoir +
nom + à : avoir avantage à, avoir intérêt à, avoir un intérêt direct à, etc. Comme le précise Blumenthal
(1992), le nom intérêt se trouve
aussi exceptionnellement avec de : les Toulousains n’ont pas intérêt de miser
sur ... Avec tous les noms de ce groupe, on trouve souvent le présentatif il y a : il y a avantage à, l’avantage qu’il
y a à. Dans toutes les autres constructions, les noms de ce groupe
s’emploient avec de (cf. il est dans votre intérêt de, etc.).
Ajoutons, pour être
complet, que l’usage flotte entre à
et de (ou pour) pour certains des noms appartenant aux groupes 1 et 2 (nous
les avons marqués d’un astérisque). Cette alternance entre les deux
prépositions semble attribuable à cinq facteurs principaux :
·
Le degré de figement de la collocation ; les
collocations figées dans lesquelles entrent les noms évoqués ci-dessus sont
formées avec l’infinitif précédé de la préposition de (la joie de jouer, la
liberté d’entreprendre, la capacité d’apprendre à apprendre, une avidité de
vivre; mais, avec un autre type de nom :
une machine à remonter le temps).
·
La forte tendance à rattacher l’article défini à
un infinitif introduit par la préposition de
(la satisfaction d’être accepté) (cf.
Spang-Hanssen 1963: 103) et à combiner les autres déterminants - article
indéfini, article partitif, adjectif possessif, adverbe - avec la préposition à (j’ai
une grande satisfaction à tourner ce film, leur art à donner de l’amour).
·
L’opposition entre la qualité constante (sa curiosité à trouver dans d’autres
environnements de quoi rester ce poète ...) et le cas particulier (satisfaire sa curiosité de revoir Cayenne). Cette distinction s’applique
particulièrement aux noms formant collocation avec avoir (avoir la naïveté de
croire, si vous avez la curiosité de lire, avoir des velléités d’être acteur).
Spang-Hanssen (1963: 116) parle dans ces cas de « de prédicatif » : il eut la
faiblesse/l’habileté/la lâcheté d’accepter.
·
La question de savoir si l’infinitif est voir, employé comme variante stylistique
du passif ou d’une complétive avec que
(+ subjonctif), auquel cas l’infinitif introduit par la préposition de est de rigueur.
·
La question de savoir si l’infinitif est à un
temps composé, auquel cas l’infinitif avec de
s’impose.
Il arrive que deux ou
plusieurs de ces facteurs jouent en même temps. Ainsi, pour ne prendre qu’un
exemple, avoir la naïveté de croire
non seulement constitue une collocation usuelle, mais particularise la notion
de naïveté. Précisons néanmoins que ces distinctions sont parfois délicates à
établir ou tout simplement inexistantes, comme c’est le cas pour le nom engagement, qui se construit
indifféremment avec de ou à. L’euphonie, elle aussi, peut jouer un
rôle. On pourrait prolonger notre analyse en prenant en compte le pluriel de
ces noms, la possibilité d’insérer un complément entre le nom et l’infinitif (la prétention du langage poétique à figurer
quelque objet), etc.
L’analyse que nous
venons de proposer illustre à merveille la vision unifiée de la langue que seul
peut offrir le travail à partir de gros corpus. Le corpus utilisé comprend
quelque 90 millions de mots. En admettant qu’un corpus plus volumineux
permettrait de pousser plus avant l’analyse, il faut reconnaître qu’il aurait
été impossible d’aboutir aux mêmes résultats par le recours à l’introspection.
Avec notre deuxième
exemple, nous restons dans la combinatoire des noms. Qu’est-ce que les noms avantage, différence, nuance, particularité
et réserve (entre autres) ont en
commun ? Afin de répondre à cette question, voyons un extrait de concordance :
|
ple de ce qui doit se faire, avec cet avantage que les
Vietnamiens n'ont pas à |
|
chéisme nécessaire. La
démocratie a cet avantage qu'elle ménage ces moments de m |
|
s décidée par Laval en 1935
(avec cette différence qu'alors les traitements réel |
|
à peu près tout à son enfance. A cette différence qu'au lieu de
se démarquer, c |
|
aux prisonniers politiques, avec cette différence qu'elle ne
milite pas pour la |
|
un rôle analogue, en effet. Avec cette différence qu'il
indiquait une figure pr |
|
lus gros qu'un très gros
chien, à cette différence qu'il s'agit bien d'un cheval |
|
ent dans cette logique. Mais
avec cette particularité qu'il n'existe pas un, mai |
|
UT des Caisses d'épargne
présente cette particularité qu'il n'y a pas de proprié |
|
titre que les autres gemmes,
avec cette particularité que la perle est une gemme |
|
eut attaquer, on dira secte.
Avec cette réserve que cette prétendue secte n'a ja |
|
otant même quelques progrès,
avec cette réserve que Gershwin " a plus de talen |
Il est évident que,
outre leur caractère abstrait, les noms examinés n’offrent guère de parenté
sémantique. Ce qui nous amène néanmoins à les classer dans une même catégorie,
c’est leur fonction communicative. En effet, ils servent tous à apporter, au
moyen de la complétive qui les suit, un commentaire ou une précision à ce qui
vient d’être dit. Il est du reste possible d’observer une relation précise
entre le nom et le contenu de la complétive ; celle-ci représente, pour
reprendre l’expression de Winter (1982), la « réalisation lexicale » du nom.
Autrement dit, l’idée contenue dans la complétive est « annoncée » par le nom.
Enfin, on voit aisément que la construction de ces noms avec une complétive est
sujette à de fortes contraintes phraséologiques. Par exemple, avantage et inconvénient ne se rencontrent guère que dans des syntagmes du type
avec cet (l’) avantage/cet (l’)
inconvénient que ou avoir/présenter
cet avantage que. Il est donc impossible
de traduire littéralement en français une phrase allemande du type das verschaffte ihm den politischen
Vorteil, daß (...). Il suffit, en fait, de modifier le nom par un adjectif
pour se voir obligé de recourir à d’autres constructions syntaxiques, témoin la
phrase suivante :
La traduction présente un autre inconvénient majeur, qui est de réduire la
nécessité pour l’apprenant de construire des réseaux lexicaux internes.
D’où l’intérêt capital
de ces noms pour une grammaire pédagogique du français et pour une grammaire
comparée du français et de l’allemand. La frange est d’ailleurs assez floue
entre les noms précités et une classe voisine de noms, tels que espoir et idée, susceptibles d’être suivis d’une complétive, mais soumis à
moins de restrictions phraséologiques. Le manque de place et la visée du
présent article nous interdisent de discuter dans le détail, comme le ferait un
lexique-grammaire complet, ces diverses classes sémantico-fonctionnelles.
Avec notre dernier
exemple, nous fournissons la solution de l’exercice proposé plus haut. Voici
quelques données authentiques extraites du corpus :
|
à l'Est, s'est-il inquiété, l'ambiance
est au chacun pour soi, les riches se dé |
|
ace
à ces nouveaux périls, l’atmosphère était au pardon. Quatre ans après
la fin |
|
négociaient
avec l'Etat juif, le climat est au pessimisme le plus sombre. Bloqué |
|
é
des premiers conciliabules, le climat restait au pessimisme, mercredi
matin, |
|
orte
de poudre et de fards. Or l'époque est au naturel, aux modestes
rehaussemen |
|
l’entendre? Probablement pas. L’époque
n’est pas à la description, lui préférant |
|
turelle,
affirme sans répit que l'heure est au consensus, à la prudence et au
pr |
|
de
se passer d'intermédiaires : l'heure est à la vente directe au client
final. |
|
ture
de la tragédie algérienne. L'heure est à la violence, avec ses
embrouillami |
|
e
suite. Ça tombe bien : tantôt la mode est au vogueing, cette danse qui
consist |
|
l'absence
délibérée de sérieux. La mode est à la blague, à la provocation gratui |
|
pour
un camp ou pour l'autre : le temps est au sauvetage des vies qui
restent. D |
|
n
d'un documentaire animalier. Le temps est à la parole et aux
prévisions. Les b |
|
produits. Il est clair que la tendance
est à la diminution de la production de |
|
ectifs)
qu'en Afrique, mais la tendance est à la progression, aidée en cela
par |
|
ment,
à la direction générale, le ton
est à la dédramatisation. Certes, tous l |
|
vec
Clinton ! " Côté officiel, le
ton est à la prudence. M. Al
Hachemi, respon |
|
enforcé. Deuxième certitude : le vent est
au changement. L'hebdomadaire Die
Ze |
Nous avons affaire ici à
une structure assez fréquente, mais signalée ni par les dictionnaires ni par
les grammaires.[10] Elle est basée sur un patron de phrase invariable : GN + (ne pas) être /
rester + à GN. A l’intérieur de celui-ci, la position de sujet ne peut être
occupée que par un nombre très limité de noms non modifiables par un adjectif
et obligatoirement précédés de l’article défini. Les neuf noms ambiance, atmosphère, climat, époque, heure,
mode, temps, tendance et ton représentent
en effet près de 100 pour cent des occurrences. En revanche, le complément
indirect introduit par à obéit à
moins de contraintes. La seule restriction d’ordre syntaxique est que le groupe
nominal présent dans ce complément doit être précédé de l’article défini.
Notons encore que les verbes être et rester n’apparaissent qu’à trois temps -
présent, imparfait, passé simple - dont le présent domine largement.
A la variabilité
restreinte de la construction correspond l’unicité de l’interprétation
sémantique que l’on peut en donner. Elle pourrait être définie en ces termes :
« nous nous trouvons à un moment de l’histoire (ou dans une situation) qui est
caractérisé(e) par (le pessimisme / la violence / le changement, etc.) ».
On est alors amené non
pas à enregistrer une simple locution dans un dictionnaire7, mais plutôt à recenser, dans un
lexique-grammaire, une forme de phrase présentant un sémantisme régulier et
admettant un libre choix des lexies pour l’un de ses constituants. Cette
structure n’est ni complètement figée, comme le sont les expressions
idiomatiques, ni complètement libre ; par conséquent, elle occupe une place
assez centrale dans le continuum phraséologique.
Remarquons enfin que
cette construction intéressera aussi les contrastivistes, en raison de la
diversité des traductions auxquelles elle donne lieu. Il n’y a pas de
correspondance univoque entre la structure française et une structure allemande
- tant s’en faut. Voyons
quelques exemples : die Tendenz ist
steigend (la tendance est à la
progression), die Stimmung ist
aufrührerisch (l’ambiance est à la
fronde), es besteht / es gibt eine
Tendenz / einen Trend zur Produktionssenkung / der Trend geht zur
Produktionssenkung / es ist eine Tendenz zur Produktionssenkung zu beobachten /
festzustellen / zu verzeichnen (la
tendance est à la baisse de la production), jetzt geht es darum, noch so viele Leben wie möglich zu retten (le temps est au sauvetage des vies qui
restent).
3.2. Apports ponctuels
Les développements
précédents, le lecteur attentif l’aura remarqué, s’appliquaient à l’élaboration
d’une grammaire exhaustive du français, car il s’agissait de faire ressortir
les avantages systématiques de l’approche lexico-grammaticale. En revanche, les
apports ponctuels de celle-ci, sur lesquels nous allons nous pencher dans ce
qui suit, ne peuvent logiquement concerner qu’une grammaire pédagogique
sélective. Ces apports sont donc ponctuels en ce sens qu’ils contribuent à
améliorer les grammaires pédagogiques existantes, lesquelles atteignent
aujourd’hui un assez haut degré de représentativité dans le choix des domaines
grammaticaux qui intéressent l’apprenant. On peut distinguer quatre types
d’apports ponctuels, qui seront illustrés chacun d’un ou de plusieurs exemples:
En premier lieu, la
correction des règles. En effet, beaucoup de grammaires scolaires établissent
des règles pour le moins douteuses. Meißner (1999a: 20-21) donne pour exemple
de cette tendance les règles gouvernant l’alternance entre le futur simple et
le futur périphrastique.
En second lieu, le
remplacement des phrases-exemples artificielles ou des usages vieillis,
transmis d’une génération de grammairiens à la suivante, par des énoncés
rigoureusement authentiques et contemporains. Un exemple nous est fourni par le
chapitre sur « l’indicatif et le subjonctif dans la subordonnée » qui figure
dans la toute récente réédition de la grammaire de Klein-Kleineidam (1998). On
y trouve la phrase-exemple suivante :
(Jean se plaint de son père : )
Il interdit que nous allions au ciné. (Klein/Kleineidam 1998: 140)
De toute évidence, nous
sommes en présence d’une phrase artificielle qui n’apparaîtrait jamais sous
cette forme dans le type de discours oral que suggèrent le contexte (Jean se plaint de son père) et la
troncation ciné. En l’espèce, on
aurait fortement tendance à employer une construction infinitive du genre il nous interdit d’aller au ciné.
Employé avec une complétive, interdire
(au sens de défendre) appartient surtout à la langue
politique et administrative. En voici quelques exemples authentiques :
Le président Ramos avait interdit que le cortège passe par Manille.
La loi interdit qu’on touche aux tombes des juifs, explique un rabbin.
J’ai interdit que ce système continue.
Ces cas d’inadéquation
des grammaires sont légion ; inutile de les accumuler.
En troisième lieu,
l’élimination de tous les phénomènes langagiers trop peu fréquents pour avoir
un intérêt pédagogique.[11] Il s’agit de ne plus noyer l’apprenant dans un océan de formes somme toute
peu usitées, surtout par rapport à l’oral. Ainsi, on aura quelque peine à
entendre une forme conjuguée du verbe se
distraire dans la bouche d’un Français. Il n’est donc nul besoin de le
recenser dans une « Grundgrammatik », comme le font p.ex. Klein/Kleineidam
1998. Mais les verbes ne sont pas seuls en cause ; une analyse fouillée
révèlerait que les grammaires scolaires accordent une attention
disproportionnée à toutes sortes de phénomènes. Il en est ainsi des adverbes
irréguliers comme excellemment ou immensément, qui figurent dans le Grammatisches Beiheft de Découvertes 3 (Göller/Spengler 1996:
22), alors qu’ils sont fort rares et ne présentent aucune utilité pour
l’apprenant en troisième année de français. Là encore, d’ailleurs, si l’on juge
indispensable d’intégrer ce genre d’adverbes, du moins faudrait-il signaler les
restrictions syntaxiques auxquelles ils sont soumis ; immensément, par exemple, ne se trouve guère que devant des
adjectifs (p.ex. immensément riche /
populaire / fier / ...).
En quatrième lieu,
l’adjonction de renseignements sur les phénomènes fréquents.11 Au
niveau scolaire, il y aurait avantage à signaler, par exemple, l’ajout presque
systématique d’un pronom dans le code oral, là où le code écrit n’en met pas :
t’en as rien à foutre de ce que je pense
je trouve ça limite qu’il nous ait rien dit
Deuxième exemple :
l’emploi des prépositions. Dit-on je l’ai
rencontré à une fête plutôt que je
l’ai rencontré dans une fête ? Aucune grammaire ne nous le signale, et
certains ouvrages vieillis n’apportent des précisions que sur l’emploi des
prépositions avec des festivités auxquelles nos élèves n’auront sûrement pas
l’occasion d’assister (dans un bal, dans
un banquet). La réponse est que l’usage contemporain préfère la préposition
à.
Au niveau universitaire,
il faudrait, par exemple, indiquer la liste complète des noms, verbes et
adjectifs qui prennent le verbe support savoir
précédé d’une préposition lorsqu’ils introduisent une question indirecte :
curieux / inquiet / impatient (etc.) de savoir
téléphoner, faxer, réfléchir, s’interroger
/ interroger qqn, débattre (etc.) + pour savoir
s’inquiéter de savoir, attendre [afin] de savoir, se
préoccuper de savoir, se soucier de savoir, tenter de savoir,
exiger de savoir, la question de savoir, le problème de
savoir, (des négociations) sur le point de savoir, (partagés) sur le
fait de savoir, le souci de savoir, le tout est de savoir, l’important
est de savoir, il s’agit de savoir (etc.)[12]
Des remarques analogues
pourraient s’appliquer à d’autres points de grammaire.
A la fin de cette
section, un constat étonnant s’impose : en dépit des milliers d’études
consacrées à la grammaire du français, nos descriptions de celui-ci, qu’elles
aient une visée linguistique ou pédagogique, ne reflètent souvent pas la
réalité langagière. Il a été amplement démontré dans les pages précédentes que
le seul moyen de remédier aux carences observées consiste à entreprendre des
recherches sur corpus. Quant au cadre d’analyse à adopter, nous avons vu que
l’approche lexico-grammaticale s’avère fort prometteuse.[13]
4. Quelle est la portée pédagogique de la linguistique de
corpus ?
Les retombées
pédagogiques des recherches sur corpus se situent sur deux plans : d’une part,
le travail sur corpus, à l’aide de concordanciers, peut être conçu comme une
nouvelle méthode de l’enseignement des langues et de la traduction. On parle
alors d’ « apprentissage guidé par les données » (data-driven learning [Tim Johns]). D’autre part, l’approche
lexico-grammaticale que nous venons d’illustrer permet de refonder la grammaire
pédagogique sur de nouvelles bases.
Commençons par les
concordanciers et l’usage que l’on peut en faire dans l’enseignement de la
grammaire. Chalmel (1998) explore, dans un numéro antérieur de la présente
revue, les possibilités méthodologiques offertes par les concordanciers
monolingues (on peut regretter qu’elle ne fasse aucune mention de l’abondante
littérature anglo-saxonne sur ce sujet):
Konkordanzprogramme wie das 1993
erschienene MICROCONCORD von Mike Scott und Tim Johns (Oxford University Press)
bieten den Lernenden die Möglichkeit, sich mit sowohl strukturellen als auch
lexikalischen Problemen auseinanderzusetzen und dabei die Fertigkeiten des
Menschen als Informationsverarbeiter einzusetzen. Ihnen wird ein Textkorpus zur
Verfügung gestellt, das es ihnen ermöglicht, Bedeutung und Gebrauch eines jeden
Wortes selbst zu analysieren, indem sie dessen unmittelbaren Kontext beobachten
und daraus Rückschlüsse ziehen. (Chalmel
1998: 52)
Chalmel illustre ses
propos par deux exemples du travail sur corpus dans la classe de français, à
savoir des concordances relatives à l’emploi du subjonctif et à la position des
pronoms d’objet. Le domaine d’application de la linguistique de corpus ne
s’arrête cependant pas là, comme nous l’avons montré dans la section
précédente. On ne soulignera jamais assez que, outre des sujets évidents tels
que la position des adjectifs ou celle des adverbes, les recherches de
l’apprenant peuvent porter sur n’importe quel phénomène rencontré au hasard
d’une lecture ou d’un exercice : la combinatoire de tel verbe, l’usage de telle
préposition, l’emploi des pronoms relatifs, etc. Le concordancier s’avère donc
un outil précieux favorisant l’éveil au langage (language awareness) et permettant aux apprenants avancés de trouver
réponse à toutes leurs questions.
Dès lors, il paraît
clair que l’enseignement de la rédaction et celui de la traduction vont tirer
un plein profit du travail sur corpus. Dans ces domaines, les concordanciers
classiques sont utilement complétés par les concordanciers bilingues capables
d’analyser des textes « alignés », c’est-à-dire des couples de textes présentés
en vis-à-vis et dont l’un est une traduction de l’autre. Se servant d’un
concordancier bilingue (MULTICONCORD), Jean Rézeau a rédigé des leçons de
grammaire comparée du français et de l’anglais, leçons accessibles en ligne à
l’adresse http://www.uhb.fr/ rezeau_j
et qui portent sur des sujets aussi variés que l’emploi de la préposition pour ou la construction for + groupe nominal + to-infinitif. A
l’aide du même logiciel, les chercheurs du Groupe
de Lexicographie Germanique de l’Université de Nancy II ont élaboré un
dictionnaire des particules (Métrich/Faucher/Courdier 1994). Notre recherche,
précédemment évoquée, sur les constructions du type « l’heure est au consensus
» est un autre exemple de la façon dont la description d’un phénomène
monolingue peut nous amener à poser des questions d’ordre traductologique.
A noter que les
professeurs de langue et les enseignants de traduction auront désormais tous
les moyens de mettre les nouveaux « mots de vocabulaire » en contexte. Prenons
quelques exemples concrets. Avant d’introduire les unités lexicales désignant
les parties du corps humain (tête, main,
pied, oreille, etc.), le professeur de langue pourra procéder à une
interrogation du corpus pour trouver les prépositions avec lesquelles ces noms
se combinent le plus souvent. De même, lorsqu’il aura affaire à un patron
phrastique comme ce que je sais, c’est
que ..., il lui sera facile d’indiquer le lexique qui s’y associe
communément. Avec des expressions toutes faites comme nuance (en fin de phrase) ou première
nouvelle, il disposera d’un nombre suffisant d’occurrences pour spécifier
leurs conditions d’emploi. Dans l’idéal, le professeur de traduction, lui,
devrait pouvoir nommer toutes les variantes possibles d’un tour donné. S’il
s’agit, pour prendre un exemple simple, de rendre en bon français un marqueur
du discours comme es ist anzumerken, daß
/ it should be noted that, il faudra indiquer toute la gamme des
possibilités, à savoir il faut remarquer que, il convient de remarquer que,
remarquons que, on remarquera que, il est digne de remarque que, (il est) à
remarquer que, on est conduit à remarquer que, il faut noter/signaler que, etc. (cf. Siepmann, en préparation).
Comme pour le travail en classe de langue, ce genre de recherche peut porter
sur n’importe quel phénomène langagier, du mot (la volonté de dialoguer / la disposition à dialoguer) à la phrase (l’atmosphère / l’ambiance / le climat est au
compromis), en passant par les conventions textuelles (p.ex. l’emploi de
questions rhétoriques au début des articles de presse français) ou les
différences stylistiques entre deux langues (p.ex. l’analyse distributionnelle
de and/et, cf. Quillard/Akhras 1996)
Pour une discussion
complète du travail sur corpus en classe de langue, nous renvoyons le lecteur à
Johns/King (1991), Murison-Bowie (1993) et Rüschoff/Wolff (1999).
Plus fondamentalement,
le travail sur corpus permet de résoudre au moins trois problèmes auxquels
l’enseignement du français langue étrangère, et plus particulièrement,
l’enseignement grammatical, se heurte depuis toujours :
·
premièrement, la séparation des structures et des
fonctions communicatives ;
·
deuxièmement, l’important décalage entre l’effort
consacré à l’enseignement de la grammaire et celui consacré à l’enseignement du
lexique (d’après Zimmermann 1984, entre 40 et 60 pour cent de nos cours sont
consacrés à la grammaire) ;
·
troisièmement, l’incompréhensibilité des règles et
de la terminologie grammaticales (cf. p.ex. Lübke 1989).
Une telle affirmation
appelle toute une série d’explications. Nous avons montré plus haut que
structures et fonctions communicatives sont indissociables : à un motif énonciatif
correspondent d’abord un certain nombre d’unités lexicales, qui construisent à
leur tour un environnement syntaxique déterminé. Nous avons vu aussi que les
gros corpus nous permettent de construire un lexique-grammaire capable de
spécifier la totalité des prototypes lexico-grammaticaux et, par voie de
conséquence, la totalité des prototypes sémantico-fonctionnels entrant dans la
composition d’une langue donnée. Par « prototype », nous entendons ici
l’occurrence la plus fréquente d’une unité associative structure-lexique
donnée. Si on revient à la construction « GN + (ne pas) être / rester + à GN »,
abondamment illustrée plus haut, on pourrait affirmer qu’un énoncé comme «
l’heure est au changement » constitue le prototype de toute une classe d’expressions
basées sur le même patron de phrase et ayant en commun un élément de sens.
Inversement, la tournure « le vent est au changement » apparaît comme un cas
limite de cette classe d’expressions, de même qu’un pingouin ne serait pas
considéré comme un membre prototype de la classe des oiseaux. La notion de
prototype, souvent appliquée au lexique (cf. p.ex. Aitchison 1996), est issue
de la psychologie cognitive. C’est à Hüllen (1992) que revient le mérite
d’avoir démontré l’utilité potentielle du concept pour la grammaire
pédagogique.
Au lieu de procéder,
comme le suggère Hüllen (1992: 23), à un sondage représentatif pour vérifier ce
qu’est le prototype d’une unité associative donnée, nous proposons d’exploiter
les données sur la fréquence que nous fournissent les gros corpus. Aussi
pourrait-on envisager une fusion entre lexique-grammaire et grammaire cognitive
qui nous permettra de contraster le typique avec l’atypique, le conventionnel
avec le non-conventionnel, la norme « statistico-cognitive » avec l’écart. De
là à la relativisation des notions de faute et de norme « didactique » (cf.
Meißner 1999b), il n’y aura plus qu’un pas à franchir.
La construction de
lexiques-grammaires pédagogiques permettra de rendre justice non seulement au
caractère fonctionnel de la grammaire pédagogique et à la primauté du lexique
dans l’enseignement des langues vivantes, mais aussi aux revendications
récentes visant à faire une plus large place à l’oral dans la société du
multi-média (Meißner 1999b). Au lieu de présenter, en fin de volume, des
glossaires pauvres en « explications sur le vocabulaire » et « ne servant à
rien d’autre qu’à faciliter la traduction (version) des textes dont la
principale fonction est d’illustrer le thème grammatical » (Meißner 1999b: 14),
les méthodes du futur présenteront aux apprenants des prototypes
lexico-grammaticaux extrapolables, leur permettant ainsi de constituer un dense
réseau d’associations mentales entre les fonctions communicatives, le lexique
et les structures.
Les manuels de rédaction
à l’usage des apprenants avancés de Gallagher/Siepmann (en préparation)
représentent un premier pas dans ce sens. Les auteurs partent de fonctions
linguistiques telles que « donner un exemple », « forger un concept » ou «
exprimer une cause » pour décrire les prototypes lexico-grammaticaux, y compris
les termes articulants, qui trouvent un emploi fréquent dans l’expression
d’idées scientifiques. Leurs ouvrages se donnent pour premier but de faire
découvrir au scripteur le potentiel de créativité inhérent à chaque prototype
et de le guider ainsi vers une écriture « libre » qui exploite à fond les
ressources de la langue étrangère. D’une manière un peu différente mais tout
aussi innovante, Holten/Marasco (1998) opèrent une distinction entre la
grammaire commune à tous les types d’anglais scientifique, le discours «
informatif » (informational writing),
le discours « argumentatif » (writing to
persuade) et d’autres types de discours. Ainsi, par exemple, ils situent
les auxiliaires de mode à l’intérieur du discours argumentatif. Cette approche
novatrice est discutée de façon détaillée par Byrd (1998).
A noter, enfin, qu’un
lexique-grammaire pédagogique, en collant à la surface de la langue sans faire
appel à une quelconque structure profonde, pourrait avoir suffisamment de
simplicité formelle pour ne pas s’éloigner outre mesure - ni dans sa conception
ni dans son contenu - de la grammaire scolaire telle que nous la connaissons
aujourd’hui. Ainsi que l’attestent les exemples précités et Sinclair (1990),
l’usage de métalangage pourra, au contraire, être réduit au strict minimum.
5. En guise de conclusion
Pour terminer, rappelons
que la linguistique de corpus, tout en permettant de résoudre des problèmes
séculaires liés à l’enseignement des langues vivantes, ne saurait avoir la
prétention de constituer un nouveau paradigme, ni à plus forte raison de poser,
à elle seule, les fondements d’une nouvelle grammaire pédagogique. Cela,
avons-nous dit, parce qu’elle n’est pas une discipline linguistique autonome,
mais un ensemble de techniques et de méthodes permettant une nouvelle approche
des faits de langue. On sait d’ailleurs que, vu la diversité des facteurs à
prendre en compte, la prudence est de mise lorsqu’il s’agit d’établir un
rapport entre description linguistique et description pédagogique d’une langue
(cf. Bausch 1979, Dirven 1990, Mindt 1995b). Ces mises au point étant bien
entendues, il est clair que le lexique-grammaire présente l’avantage d’être
compatible avec tous les grands systèmes conceptuels et donc, à priori, avec
une description de la langue jugée appropriée par les didacticiens. La
grammaire pédagogique, croyons-nous, voit ainsi s’ouvrir des horizons plus
larges.
Bibliographie
Aitchison, Jean, 1996. Words in the Mind: An
Introduction to the Mental Lexicon, 2ème éd., Oxford,
Blackwell.
Bausch, Karl-Richard (éd.), 1979. Beiträge zur didaktischen Grammatik,
Königstein, Scriptor.
Blumenthal, Peter, 1992. Fehlerhafter
Präpositionengebrauch in der französischen Fremdsprache, in Albert
Barrera-Vidal/Manfred Raupach/Ekkehard Zöfgen (éds.), Grammatica vivat. Konzepte, Beschreibungen und Analysen zum Thema
„Fremdsprachengrammatik“. In memoriam Hartmut Kleineidam, Tübingen, Narr,
113-135.
Bonnard, Henri, Leisinger, Hanno et Walther Traub,
1976. Grammatisches Wörterbuch
Französisch. Dortmund: Lensing.
Bot, Kees de, 1992. A
Bilingual Production Model: Levelt’s Speaking Model Adapted, Applied Linguistics 13, 1-24.
Byrd,
Patricia, 1998. Grammar FROM context:
Re-thinking the teaching of grammar at various proficiency levels,
http://lookingahead.heinle.com/filing/from.htm.
Chalmel, Agnès, 1998. Konkordanzen: innovative
konstruktivistische Lernmedien zur Erzeugung von Sprachbewußtheit, französisch heute 1, 45-56.
Confais, Jean Paul,
1978. Grammaire explicative, Munich:
Hueber.
Dirven,
René, 1990. Pedagogical Grammar, Language
Teaching 23, 1-18.
Encyclopaedia Universalis.
Francis,
Gill, 1993. A Corpus-Driven Approach to Grammar, in Mona Baker, Gill Francis et
Elegna Tognini-Bonelli, Text and
Technology : In honour of John Sinclair, Amsterdam/Philadelphia, Benjamins,
137-156.
Gallagher, John D. et Dirk Siepmann (en
préparation), Writing in English: a Guide
for Advanced Learners, Academics and Translators.
Gallagher, John D. et Dirk Siepmann (en
préparation), Ecrire en français. Guide
de l’expression écrite à l’usage des étudiants en français langue étrangère.
Gallagher,
John D. et Dirk Siepmann (en préparation),
Vom Wort zum Text. Ein Lehr- und Nachschlagewerk zur Textproduktion im
Deutschen.
Göller, Alfred et Wolfgang Spengler, 1996. Etudes françaises : Découvertes
(Série verte). Grammatisches Beiheft, Stuttgart, Klett.
Goleman, Daniel, 1997. Quand l’esprit dialogue avec le corps.
Entretiens avec le Dalaï-Lama sur la conscience, les émotions et la santé,
Paris, Trédaniel.
Gross, Gaston, 1986. Les
constructions nominales et l’élaboration d’un lexique-grammaire, Langue française 69, 5-27.
Gross, Gaston, 1989. Les constructions converses du français,
Genève/Paris, Droz.
Haas, Joachim et
Danielle Tanc, 1983. Französische Grammatik, Francfort sur le Main,
Diesterweg.
Harris, Zellig S., 1951. Methods in Structural Linguistics, Chicago, University of Chicago Press.
Holten, Christine et Judith Marasco, 1998. Looking Ahead 4. Mastering
Academic Writing, Boston, Heinle&Heinle.
Huber, Herbert et Max
Bouchette, 1982. Quel article?,
Francfort sur le Main, Diesterweg.
Johns,
Tim et P. King, 1991. Classroom
Concordancing, ELR Journal (New Series), vol. 4, Birmingham, Centre for
English Language Studies, University of Birmingham.
Klein, Hans-Wilhelm et Hartmut Kleineidam, 1998. Etudes Françaises : Grundgrammatik,
Stuttgart, Klett.
Laporte, Eric (éd.),
1999. Lexique-grammaire des adjectifs, Langages
(133).
Lübke, Diethard, 1989. Benutzerfreundlichkeit
französischer Schulgrammatiken, Der
fremdsprachliche Unterricht 96, 23-26.
McEnery,
Tony et Andrew Wilson, 1996. Corpus Linguistics, Edinburgh, Edinburgh
University Press.
Meißner, Franz-Joseph, 1999a. Grammatik im
Französischunterricht der Sekundarstufe - wieviel, welche, wie?
Meißner, Franz-Joseph, 1999b. La
faute entre oralité et scripturalité et seize paradoxes méthodologiques de FLE,
...
Métrich, René, Faucher, Eugène et Gilbert
Courdier, 1994. Les invariables
difficiles. Dictionnaire allemand-français des particules, connecteurs,
interjections et autres « mots de la communication » (3ème éd.), Groupe de
Lexicographie Germanique de l’Université de Nancy II.
Mindt, Dieter, 1993. Sprachdaten - Computer -
Grammatiken für den Fremdsprachenunterricht, in Darski, Jozef et Zygmunt
Vetulani (éds.), Sprache - Kommunikation
- Informatik: Akten des 26. Linguistischen Kolloquiums, Poznan 1991,
Tübingen, Niemeyer.
Mindt, Dieter, 1995a. An Empirical Grammar of the English Verb : Modal Verbs, Berlin, Cornelsen.
Mindt, Dieter, 1995b. Schulgrammatik vs. Grammatik
der englischen Sprache, in Claus Gnutzmann/Frank G. Königs, Perspektiven des Grammatikunterrichts,
Tübingen, Narr, 47-68.
Murison-Bowie, Simon,
1993. MICROCONCORD
Manual: An Introduction to the Practices and Principles of Concordancing in
Language Teaching, Oxford, Oxford University
Press.
Quillard, Geneviève et
Georges Akhras, 1996. And/et : Analyse
distributionnelle de la conjonction copulative en français et en anglais,
Meta 3, 459-470.
Rüschoff, Bernd et Dieter Wolff, 1999. Fremdsprachenlernen in der
Wissensgesellschaft: zum Einsatz der neuen Technologien in Schule und
Unterricht, Munich, Hueber.
Siepmann, Dirk, 1998. Compte-rendu de John Sinclair
(éd.), Collins Cobuild Collocations
CD-ROM, Fremdsprachen und Hochschule
53, 134-137.
Siepmann, Dirk (en préparation). Text Organisation across
Languages: a Study of Multi-Word Discourse Markers in English, French and
German Academic and Journalistic Texts with Implications for the Teaching of
Writing and Translation.
Sinclair,
John (éd.), 1990. Collins Cobuild English
Grammar, Londres, Collins.
Sinclair,
John, 1991. Corpus, Concordance,
Collocation, Oxford, Oxford University Press.
Sinclair,
John (éd.), 1995. Collins Cobuild
Collocations on CD-ROM, Londres, HarperCollins.
Sinclair,
John, 1996a. Preliminary Recommendations
on Corpus Typology, Rap. tech., EAGLES, mai 1996, CEE.
Sinclair,
John (éd.), 1996b. Collins Cobuild
Grammar Patterns 1: Verbs, Londres, Collins.
Spang-Hanssen,
Ebbe, 1963. Les
Prépositions incolores du Français moderne,
Copenhague, G.E.C. Gads.
Winter,
Eugene, 1982. Towards a Contextual
Grammar of English, Londres, George Allen and Unwin.
Zimmermann, Günter, 1984. Erkundungen zur Praxis des Grammatikunterrichts, Francfort sur le
Main, Diesterweg.
[1] Notons encore que la définition du Petit
Robert ne tient pas compte de l’émergence récente de corpus de suivi (monitor corpora), qui, loin d’être des
ensembles finis, sont approvisionnés en données textuelles « fraîches » à
intervalles réguliers et, partant, évoluent avec leur temps.
[2] A bon entendeur, salut : nous ne
suggérons en aucune manière que la grammaire pédagogique puisse être une simple
adaptation de la grammaire linguistique (voir la conclusion du présent
article).
[3] Ne sont pas prises en compte ici les
combinaisons verbe + adjectif qui peuvent être construites avec une complétive
introduite par la conjonction que.
Grevisse semble d’ailleurs suggérer qu’il y a un libre choix entre la
proposition infinitive et la complétive avec que, ce qui est loin d’être le cas. Pour ne citer qu’un exemple, la
collocation rendre manifeste (cf.
p.ex.: En outre, l’opération de
déplacement rend manifeste que ses constituants sont interprétés comme des
sujets ...) ne peut être suivi de
l’infinif avec de.
[4] On entend par « concordance » une liste
comportant les occurrences d’une unité-pôle (node en anglais) environnée de ses contextes d’emploi.
[5] Des efforts en vue de la construction
d’un lexique-grammaire sont aussi menés en France (cf. p.ex. Laporte 1999),
avec cependant une orientation plutôt théorique.
[6] Là encore, on relève des parallèles avec
l’évolution d’autres sciences. Après une période résolument tournée vers
l’empirisme, les neurosciences et la psychologie, par exemple, tentent de
mettre à profit le savoir introspectif des grands maîtres bouddhistes pour
accéder à une meilleure compréhension des possibilités d’éducation émotionnelle
(cf. p.ex. Goleman 1997). De même que le psychologue tente de relier expérience
intérieure et observation scientifique, de même le linguiste affine ses
intuitions en sollicitant le corpus.
[7] Si l’on peut considérer certaines
structures simples, telles que S-V, comme étant relativement libres du point de
vue lexical, elles obéissent sans doute à des contraintes plus fortes qu’il n’y
paraît à première vue. Comme
le dit John Sinclair : « To illustrate a simple subject-verb clause, something
like ‘Birds sing’ is not good enough. With the Cobuild database it is not
difficult to find examples even of a fairly rare event like this structure.
‘Trains stopped’ is a genuine example, and so is ‘Frey agreed’. » (Sinclair 1990 : xi; c’est nous qui
soulignons)
[8] Bonnard (1976) et Blumenthal (1992) répertorient également
quelques exemples
d’emploi. Gross
(1986, 1989) ne tient pas compte de l’infinitif complément de nom.
[9] Sont laissés en marge de l’analyse les
collocations figées telles que avoir hâte
de, avoir honte de, avoir l’intérêt de, avoir la joie de, avoir
le plaisir de, avoir qualité à/pour,
avoir scrupule à, avoir peine à ou avoir plaisir à. Haas/Tanc (1983: 188-189) mentionnent un petit
nombre de ces locutions verbales dans lesquelles l’infinitif se rattache au
groupe verbal plutôt qu’au nom (cf. Spang-Hanssen 1963: 113). Nous ne prenons
pas non plus en compte les constructions, assez fréquentes, dans lesquelles
l’infinitif se rattache au groupe verbe + objet direct (p.ex. ne pas voir d’inconvénient à).
[10] Seul le Petit Robert cite, p. 1088, la structure négative l’heure n’est pas à qqc, la classant à
tort parmi les locutions.
[11] Les didacticiens s’interrogent depuis
longtemps déjà sur la sélection des faits grammaticaux propres à être intégrés
dans l’enseignement. Qu’il suffise de mentionner les projets menés par le
Conseil de l’Europe sur le Niveau Seuil.
[12] Il faut dire à la décharge des grammaires
universitaires qu’un certain nombre de ces lexies sont mentionnées par
Haas/Tanc (1983) et par Confais (1978).
[13] Nous ne nions nullement l’utilité
d’autres approches. Ainsi, on voit mal comment l’approche lexico-grammaticale
pourrait être appliquée à la description du style indirect libre.