Robert Fournier: Une évolution probable de la communication humaine. Un documentaire. ©2017

Chapitre un
Aux origines de la communication humaine: du gestuel au gestuel

Dans The Clan of the Cave Bear (1980), le premier tome de son imposante saga Earth’s Children, Jean M. Auel suggère que les hommes et femmes des cavernes de la branche des Neandertals communiquaient au moyen de gestes et d’expressions faciales, parfois ponctués par des articulations vocales (s’apparentant plutôt à des grognements, précise-t-elle), qui permettaient de subtiles variations de signifiés. À l’inverse, son héroïne, Ayla, représentante de la branche homo sapiens sapiens du Cro-Magnon, au moment où elle est recueillie par les hommes et les femmes du Clan de l’ours des cavernes, s’exprimait au moyen d’articulateurs vocaux, d’où son incapacité à communiquer avec ses sauveteurs, aussi longtemps qu’elle n’eut pas acquise elle-même ce langage gestuel. Cela se passait il y a environ 35 000 ans à la fin de la dernière période glacière dans l’Europe préhistorique. Dans les deux cas, il est postulé que l’un et l’autre groupe, Neandertals et homo sapiens sapiens, possédaient la faculté de langage, le premier signé non-vocalement, le second signé vocalement.

Fiction? Oui, sans doute! Cependant, on ne pourra reprocher à Jean M. Auel son manque d’imagination, peut-être pas si loin de la réalité historique après tout. Ironiquement, ce genre de fiction se retrouve courammment dans de nombreuses publications académiques sérieuses.

Cette fiction est assez conforme à ce qu’on peut encore observer, disons aujourd’hui, 35 000 ans plus tard. Quoi que cela ne relève plus de l’évolution biologique d’une espèce particulière, mais serait plutôt attribuable à une carence physiologique, une fraction non négligeable de l’espèce humaine, accidentellement et statistiquement distribuée sur la surface du globe, s’exprime naturellement et avec grande aisance et efficacité au moyen d’un langage signé non-vocalement, les principaux articulateurs étant les mains et les expressions faciales, ponctué également d’articulations vocales (il ne saurait s’agir de grognements cette fois cependant), permettant de subtiles variations de signifiés. On aurait tort de penser que les Sourds sont muets! À l’opposé, la très vaste majorité des Humains a recours pour communiquer à des articulateurs vocaux, ce qu’on a pris l’habitude de désigner par la parole, un langage signé vocalement donc. À cette expression vocale viennent se greffer variablement une multitude de mouvements corporels: gesticulation des mains, expressions faciales, qui à leur tour premettent de rendre de subtiles variations de sens. Les Entendants ne sont pas manchots!

Or, ce que l’on observe, c’est qu’il n’existe pas d’articulateurs spécifiques à un mode d’expression ou l’autre. Seulement une question de degré: les Sourds font un grand usage des articulateurs non vocaux, et dans une faible mesure des articulateurs vocaux; les Entendants font un fort usage des articulateurs vocaux, et dans une moindre mesure d’articulateurs non vocaux; et cela, les uns et les autres selon une très grande variabilité. Pour des raisons toutes évidentes, les entendants ont davantge recours aux gestes que les non-entendants à la parole. Les deux espèces[1]communiquent par conséquent au moyen des mêmes articulateurs selon un dosage qui leur est propre, ceci étant l’unique caractère pouvant les distinguer nettement. Cela n’exclut pas que dans certaines circonstances, des entendants n’auront d’autre choix que de n’utiliser que des gestes pour communiquer, quand le silence est imposé, dans une cérémonie religieuse par exemple. Les gestes manuels sont silencieux, alors que la parole est bruyante, c’est son grand désavantage. D’autre part, les langues signées des sourds nous montrent qu’un langage grammatical et articulé peut être conduit entièrement au moyen de gestes et d’expressions faciales, en l’absence de toute émission vocale. Certains locuteurs sont très expressifs gestuellement, d’autres beaucoup moins. Certains signeurs verbalisent beaucoup, d’autres moins ou rarement. Cette variation individuelle montre que les deux modalités sont en tout temps disponibles; y avoir recours permet d’augmenter l’expressivité, ne pas y avoir recours ne constitue pas un handicap. Dans cetains cas, les gestes s’imposent: il peut parfois être ardu d’expliquer la composition mécanique d’une structure par le simple recours à la voix. Dans d’autres cas, la voix s’impose: quand il faut avertir d’urgence d’un danger imminent à un interlocuteur qui nous fait dos.

Un autre caractère rend unique toutes les espèces humaines vivant actuellement sur la Planète, c’est le fait de posséder un cerveau identique rendant possible la faculté de langage au moyen des différents types d’articulateurs mis à disposition, et de dispositifs tels les neurones miroirs, élément moteur de la perception gestuelle, et une théorie de l’esprit, en principe, partagés par tous.

Au plan évolutif, il est difficile, voire impossible, de déterminer ce qui est à l’origine du langage humain, non pas les différents déterminismes qu’on peut facilement imaginer, ne serait-ce qu’un besoin primitif de simplement communiquer au sens large. Mais ce qui est premier: le geste ou la parole? Suivi l’un ou l’autre comme appui ou de concert l’un avec l’autre? On entend fréquemment l’expression «allier le geste à la parole», sous-entendant que le geste est secondaire mais néanmoins essentiel à l’appui du discours; ce pourrait être l’inverse! Cette expression courante ne fait que confirmer la complémentarité des deux modes d’expression, mais ne saurait être prise pour la confirmation d’une hypothèse sur l’origine du langage humain. McNeil (1985[2]; voir aussi McNeil, 2012[3]) a suggéré sur la base de l’existence d’un parallèle temporel, sémantique, pragmatique, pathologique et développemental étroit entre la parole et les gestes référentiels et discursifs, et sur l’observation que les gestes que nous utilisons quand nous parlons sont en fait précisément synchronisés avec la parole, que la parole et les gestes font partie de la même structure psychologique et partagent un même système computationnel. Dans leur réplique à McNeil, Butterworth & Hadar (1989)[4]montrent par ailleurs que les gestes illustratifs précèdent généralement le syntagme auquel ils réfèrent, mais ne le suivent jamais, et que gesticuler facilite la découverte du mot cherché. Il ne fait pas de doute que cette proximité systémique entre les gestes, et la parole vue comme gestuelle spécifique, suggère que la gestualité est plus fermement établie dans le système de la communication, peut-être parce qu’elle remonte plus profondément dans le passé évolutif de l’humanité. Je reviendrai sur cette idée plus loin.

Sur la question des relations exactes entre les gestes et la parole, les spéculations les plus farfelues et les plus fantaisistes ont été avancées. Aucune n’a jamais totalement satisfait le monde scientifique. Aucune, sauf l’observation triviale suivante: il n’existe pas d’organes spécifiques à la parole, tout comme les yeux sont faits pour voir, les oreilles pour entendre, le nez pour sentir, etc. La parole ne fait pas partie des sens. Une contrainte très forte toutefois est imposée sur la sélection des organes dédiés à la communication humaine: ils doivent posséder une très grande flexibilité articulatoire. Les articulateurs vocaux, les articulateurs manuels et les articulateurs faciaux répondent à cette condition.

Les questions liées à l’origine du langage humain sont simples et bien connues: où le langage a-t-il commencé? quand? comment? pourquoi? Il est aujourd’hui évident que les réponses satisfaisantes à ces questions triviales ne pourront être obtenues qu’à partir d’un croisement de travaux provenant de disciplines diverses: généticiens, neurobiologistes, archéologues, linguistes, philosophes, ethnologues et même psychanalystes, doivent allier leurs points de vue. L’approche pluridisciplinaire pourrait situer l’émergence du langage dans un contexte écologique global, ce qui nous devrait nous permettre de mieux comprendre comment les langues ont pu se développer et se propager[5].

Au plan évolutif, encore une fois, s’il n’est pas possible de déterminer ce qui est à l’origine du langage humain, il est néanmoins beaucoup plus facile de spéculer sur son futur, fort de ce que son passé incertain nous permet d’appréhender.

Dans cet essai, il est proposé que l’Humanité se trouve encore à l’Âge de la pierre de la communication, que le langage signé, soit vocalement ou non-vocalement, est extrêmement primitif, que les articulateurs vocaux et non vocaux auxquels L’Humanité a recours pour communiquer depuis au moins 35 000 ans ne sont qu’un faute de mieux, un pis aller, et enfin que ces articulateurs physiologiques devraient bientôt laisser la place à de plus puissants et mieux adaptés au niveau cérébral.

La télépathie, comme on a pris l’habitude d’appeler cette faculté de communiquer à distance sans l’aide d’articulateurs extra-cérébraux, risque bien prochainement de compétitionner avec les autres modes de communication traditionnels tels qu’on on les connaît maintenant, comme ce fut le cas spéculé il y a 35 000 ans au moment où le langage signé vocalement a déclassé le langage signé non-vocalement comme mode le plus productif et le plus répandu. On en voit déjà les premiers signes, même s’il n’est pas possible de prédire si la suprématie du mode télépathique adviendra avant les 35 000 prochaines années. C’est de cela dont il sera question au chapitre cinq et en finale de cet ouvrage.

La communication

Communiquer, c’est en quelque sorte téléporter une information d’un cerveau à un autre. Ce terme veut bien dire ce qu’il signifie: «Transporter (qqn, qqch.) d’un lieu à un autre sans parcours physique (dans les récits de science-fiction)» (Dixel). Dans la communciation humaine ordinaire, cette transmission peut s’opérer de diverses manières et prendre différentes formes: distale/proximale; directe/indirecte; instantanée/différée; sonore/visuelle; etc. Quelle que soit la situation, dans tous les cas, la transmission de l’information, sa téléportation dans l’état actuel des choses, implique un ou plusieurs éléments physiques, communément appelés medium; par exemple, en communication écrite, un support (papier ou écran d’ordinateur); différents objets (crayon, plume, stylo, clavier); et un canal (la poste, le courrier électronique, ou la distribution de main à main). En langage signé, en LSQ ou en ASL[6] par exemple, d’autres modalités sont en jeu: les mains, les postures corporelles, les expressions faciales; dans ce cas, le canal est visuel.

C’est ainsi que le passage d’une information d’un cerveau à un autre, cette habileté que nous avons à nous projeter dans le cerveau d’autrui, implique diverses formes de manipulation, la simple transmissson d’une idée ou d’un concept forgés dans l’esprit d’un individu à sa réception dans le cerveau d’un autre individu nécessitant plusieurs processus d’encodage et de décodage. En communication verbale, en particulier, une idée ou un concept élaboré(e) dans le cerveau d’un locuteur est téléporté(e) sous forme d’ondes sonores par un canal physique, qui peut être l’air (ondes acoustiques) ou un fil (ondes électriques) au moyen de l’appareil phonatoire, qui met en jeu différents articulateurs, certains mobiles (cordes vocales, luette, langue, lèvres), d’autres fixes (voile du palais, dents, etc. ), et qui est chargé de relayer l’information jusqu’à l’oreille du destinataire, qui à son tour réinterprète conceptuellement la trame sonore ainsi transmise. Ce modèle de communication nous est familier depuis plus d’un demi siècle (Weaver & Shannon, 1963)[7] ; il a été adopté sous diverses formes, puis développé et popularisé en linguistique en particulier par Roman Jakobson de l’École de Prague, qui en a élaboré les fonctions[8].

Pinker (1994), dans sa discussion sur la perception auditive[9], conclut: «Il en résulte que la parole est de loin la manière la plus rapide d’envoyer des informations dans la tête par le canal de l’oreille.» Et un peu plus tôt, il affirmait: «Utiliser le canal de la bouche à l’oreille pour la communication comporte des avantages immédiats, et nous ne trouvons aucune communauté d’entendants qui ait opté pour la langue des signes, même si elle est tout aussi expressive que le langage verbal». Certes, il a raison, faute de mieux, dans l’état actuel des systèmes de communication humains. Pour ce qui est des avantages de la communication verbale sur la communication non verbale signée, ils ne sont pas computationnels mais bien situationnels. Les entendants n’ont pas besoin d’un bon éclairage pour communiquer et leurs mains ne sont pas monopolisées. Les non-entendants ne peuvent communiquer en pleine noirceur, bien entendu. Dans un 5@7 cependant, où tous les convives discutent bruyamment 2 à 2, l’avantage revient aux non-entendants qui peuvent signer à grande distance dans la salle sans être gênés par leurs confrères entendants. Je le répète: les non-entendants sont sourds, ils ne sont pas muets, contrairement à ce qu’a longtemps laissé croire l’expression erronnée sourd-muet. Et les entendants ne sont pas des manchots sans visage.

À première vue, la distinction entre une langue parlée et une langue signée réside au niveau de la modalité visuelle-manuelle en tant que canal naturel de réception et de production des symboles[10] . Cette différence, qui n’est pas absolument fondamentale au plan linguistique abstrait, pourrait être qualifiée de quantitative plutôt que qualitative. En effet, les langues signées privilégient le canal visuel-manuel plutôt que le canal audio-vocal. Elles font appel à un plus haut degré aux gestes que les langues parlées et à un plus faible degré aux émissions vocales. Les langues orales privilégient le canal audio-vocal et recourent à un degré très variable à l’expression gestuelle. Ce qui signifie, en fait, que les langues signées ne diffèrent des langues orales que par leur composante phonologique qui a la propriété de ne pas réaliser acoustiquement l’ensemble de ses énoncés. Mais il pourrait s’agir également d’une propriété qui a davantage à voir avec des contraintes physiologiques (la surdité) et expressives de l’être humain dans des conditions particulières de communication plutôt qu’une caractéristique propre des langues signées.

Les langues signées nous enseignent également autre chose: la frontière entre l’expression des émotions, des idées, de l’esprit et de l’être tout entier est mince et à toutes fins pratiques inexistante. L’expression de soi passe par l’expression du corps; le langage appartient au corps et ressort de la totalité de l’individu; la psychanalyse n’a cessé de l’établir (Anzieu, 1977[11]). Le langage appartient au corps biologique, social, historique et culturel; l’oublier, “ce serait oublier des aspects importants du langage, qui débordent la logique, et la théorie du signe” (Meschonnic 1985:20[12]). Enfin, le langage n’est pas, comme la linguistique a longtemps voulu le laisser croire, réduisible à un locataire d’organes situés entre les poumons et le bout des lèvres, branchés d’une quelconque façon au cerveau: “le langage sous ses différentes formes a toujours été un locataire d’instruments non spécifiques” (Cosnier 1982:299[13]). Voilà pourquoi seule une théorie globale et unifiée des comportements humains peut nous fournir la réponse à la question complexe de l’origine, de l’existence, du maintien de la communication et des rapports entre les humains[14].

Les langues créoles nous ont démontré la grande force d’adaptation de l’esprit humain dans des conditions qu’on ne peut qualifier que d’extrêmement sévères (Bickerton 1984[15]). Les langues signées, à leur tour, par un retour noblement ironique des choses, nous font voir la très grande flexibilité et richesse de l’esprit humain et nous obligent à redéfinir ce qu’on croyait déjà connaître. Le deuil des certitudes!

Or, nous pouvons faire l’économie de tous ces processus si nous envisageons la communication de cerveau à cerveau, sans quincaillerie intermédiaire comme décrite précédemment, i.e. téléportée directement. Dans ce cas, il nous faudra envisager d’autres formes d’articulateurs, cérébraux ceux-là, que les études sur le cerveau et l’esprit ne nous ont pas encore permis d’identifier précisément.

L’origine du langage

S’il est un sujet qui fut tabou en linguistique pendant un moment, c’est bien celui de l’origine du langage humain. Ce tabou peut sembler extrêmement paradoxal puisqu’il visait l’apparition même de l’objet d’étude de la linguistique.

Dans un souci d’éviter les luttes stériles et l’élaboration de thèses farfelues sur l’origine du langage comme le Mythe de Babel ou autre mythe grec (Hermès, qui donna le don de parole à Pandore), la Société de linguistique de Paris décrète dans les deux premiers articles de ses statuts de 1866 ce qui suit[16]:

Article premier. – La Société de Linguistique a pour but l’étude des langues, celle des légendes, traditions, coutumes, documents, pouvant éclairer la science ethnographique. Tout autre objet d’études est rigoureusement interdit.

 

ART. 2. – La Société n’admet aucune communication concernant, soit l’origine du langage, soit la création d’une langue universelle.

Cette interdiction, qui ne sera levée qu’à la fin du XXe siècle, n’a pas empêché biologistes, évolutionnistes, généticiens, anthropologues, paléontologues et autres naturalistes de prendre le relais. La question de l’origine du langage pourrait bien être après tout une affaire qui déborde largement le champ de la linguistique historique, dont l’objet premier a d’ailleurs été davantage la classification des langues en familles que la quête de leurs origines. Malgré cela, nul ne pourrait dire avec précision encore aujourd’hui à quand remonte l’usage de la parole chez l’homo; on en aurait conservé aucune trace. Résultat: beaucoup de spéculations approximatives autant sur l’origine que sur la date que sur la forme. Partisans de la monogenèse et partisans de la polygenèse ne s’entendent pas, sauf peut-être sur un point: cela pourrait remonter à environ 80 000 ans. Certains, en particulier Ruhlen Meritt[17],ont émis l’hypothèse d’une proto-langue mère unique commune à toutes les super-familles de langues remontant à environ -50 000 ans, en se fondant sur des recherches en archéologie et en génétique des populations. Une tentative plus récente dans le même sens, fondée sur l’apparition des pidgins et de niches écologiques, mais assez mal formulée dans un style blageur parfois irrévérencieux, est celle de Derek Bickerton (2009) Adam’s Tongue[18].

On peut facilement imaginer que les langues existaient bien avant ces dates et qu’une aptitude au langage se soit inscrite dans le code génétique de l’homo habilis, le fameux gène FOXP2 – il y a plusieurs centaines de milliers d’années – on avance communément 2,2 millions d’années – ce lointain ancêtre manifestant déjà une grande complexité neurologique par son habilité à fabriquer des outils.

Et qu’en est-il de l’origine géographique des quelques 6000 langues parlées actuellement dans le monde, et les quelques centaines d’autres disparues depuis? Ce serait l’Afrique! Parmi le grand nombre de recherches qui appuient cette hypothèse, déjà proposée par Darwin (1871) dans The Descent of Man, and Selection in Relation to Sex[19], et qui rallie le plus largement aujourd’hui la communauté scientifique de paléo-, physio- et bio-anthropologues, archéologues, généticiens des populations, psychologues de l’évolution, et linguistes, il y a celle de Quentin Atkinson et son équipe[20], qui ont étudié 504 langues parlées actuellement dans le monde. Pour chaque langue ils ont établi le nombre de phonèmes utilisés. La première constatation a été de dénombrer plus de phonèmes utilisés dans les langues africaines que dans tous les autres pays au monde. La deuxième montre que plus on s’écarte de l’Afrique, plus le nombre de phonèmes utilisés diminue. De manière générale, l’étude montre que les langues autochtones des régions du globe qui ont été le plus récemment colonisées présentent moins de phonèmes que celles des régions dans lesquelles l’homme moderne est présent depuis des millénaires (en particulier l’Afrique subsaharienne)[21]. Cette remontée dans le temps grâce aux phonèmes, – ces unités minimales non significatives dans les langues – vient confirmer à nouveau les origines africaines de l’humanité.

Sur la forme du premier langage articulé, on n’est guère plus assuré. Si nul ne peut dire précisément à quand remonte l’usage de la parole chez l’hominidé, ce qu’on peut cependant supposer, c’est que le recours aux organes phonatoires a dû attendre le développement des capacités cognitives du cerveau (aire de Broca pour la production, et aire de Wernecke pour la compréhension) et la mise en place appropriée des organes de la parole, le larynx en particulier. Du point de vue anatomique, pour parler il faut un appareil phonatoire formé des poumons, du larynx, du pharynx, des fosses nasales, du voile du palais, de la langue, des dents et des lèvres. C’est le larynx qui est le principal élément de l’appareil phonatoire. Chez l’humain, il est en position haute chez le bébé, commence sa lente descente vers l’âge de 3-4 mois, pour se fixer en position basse vers l’âge de 4 ans, et prendre sa position définitive basse après la puberté. C’est cet organe qui permet la production d’un langage articulé et modulé. Chez les grands singes le larynx reste en position haute même à l’âge adulte : il leur est donc impossible de parler comme leurs cousins humains[22].

 

 

 

Ontogenèse et phylogenèse

On entend encore souvent dans les cours d’introduction à l’anthropologie que le développement de l’enfant reproduit en accéléré le développement de l’humanité. C’est Ernst Haeckel à qui l’on doit la théorie de la récapitulation selon l’heureuse formule «l’ontogenèse récapitule la phylogenèse»[23]. Cette théorie, de plus en plus délaissée aujourd’hui, affirme que l’histoire du développement individuel (ontogenèse) est la récapitulation sur une courte période de l’histoire de l’espèce (phylogenèse). Une théorie controversée certes, mais une formulation excellente pour mettre en parallèle le développement de l’espèce avec celui de l’individu.

Le nouveau-né ne parle pas; au mieux, il vocalise. Il est cependant tout équipé pour apprendre n’importe quelle langue existante; il possède, pour certains, la faculté du langage (Chomsky), pour d’autres l’instint du langage (Pinker), cette propriété étant éventuellement localisée dans les gènes dont le fameux FOXP2[24] , gène présent sous une forme similaire chez un large éventail de mammifères incluant la souris. Certaines études ont conclu que le FOXP2 spécifique de l’homme moderne a acquis sa configuration définitive dans la population humaine très probablement au cours des 200 000 dernières années, ce qui est en accord avec plusieurs estimations archéologiques de la période d’apparition d’un langage oral performant [25].

Tout l’apprentissage du langage du nouveau-né est essentiellement post-natal, même si la mise en place d’une partie de l’équipement pour en faire l’apprentissage a lieu avant la naissance. Cet apprentissage est particulièrement long. Pourquoi tout ce temps? Deux causes: neurologiquement et physiologiquement, il n’est pas prêt! Le cerveau de l’humain est un organe complexe: des milliards[26] de neurones, autant de synapses, une infinité de connexions possible. Tout ce hardware prend un certain temps pour se brancher correctement: plusieurs années de fait. Les interactions sociales permettront l’actualisation de neurones miroirs[27][28], et d’une théorie de l’esprit[29], i.e. cette conscience intuitive qui permet de percevoir ce que d’autres personnes pensent et désirent[30].

Pendant ce temps, parallèlement, le bébé développe physiologiquement son système de production de la parole. Ce qui est crucial ici et ce qui va le distinguer des autres primates tels le chimpanzé, jusqu’à ses plus lointains ancêtres hominidés, c’est son larynx et la position qu’il occupe dans l’appareil phonatoire. Le développement du langage chez l’enfant suivra également son développement stationnaire: d’une position couchée à une position assise, puis du déambulement à quatre pattes à une position debout sur deux pattes. L’accès à la station debout entraîne, parmi d’autres changements, le recul et l’élévation de la tête qui subit un effet de bascule et provoque la flexion de la base du crâne, l’émergence du cou et la descente du larynx. Ce caractère fondamental, l’homo l’a acquis au cours de son évolution; pour l’enfant, le larynx prend une position basse entre 3-5 mois. Cette caractéristique est fondamentale, si l’on considère le développement de nos capacités phonatoires, puisque l’abaissement du larynx permet de libérer une large zone pharyngée nécessaire à la production du langage articulé. Sans cette particularité, c’est un peu comme si on essayait de jouer du saxophone sans le bocal, en n’utilisant que le bec et le corps de l’instrument. Le bipédalisme offre également un autre avantage à l’enfant, celui de libérer ses mains pour les affecter à d’autres tâches, comme tenir son hochet, ou mieux, pointer pour désigner.

C’est ainsi que l’enfant dans les deux premiers mois de sa vie passera de ses premiers cris, grognements, soupirs, clics, bruits secs associés à sa respiration et à son alimentation, auxquels s’ajoutent gazouillis et rires, à un babillage syllabique entre sept et huit mois. Cette expérimentation articulatoire le mènera progressivement vers 5-6 ans à l’acquisition complète du langage adulte qui l’entoure.

Dès les premiers moments de son existence, et au fur et à mesure de son développement physique, l’enfant gesticule beaucoup aussi. Premières tentatives de communication ou manque de contrôle de sa motricité? Peut-être les deux. Dans la mesure où il ne souffre d’aucun déficit cérébral ou physique, à ces premières gesticulations manuelles viendront se greffer ses premières articulations vocales qui faute de mieux prendront le dessus comme mode de transmission privilégié de sa pensée. Les unes et les autres ne se quitteront plus: toute sa vie il alliera le geste à la parole.

Cette observation est-elle suffisante, dans ce cadre, pour postuler la primauté du geste sur la parole dans l’évolution de la communication humaine? Un pas difficile à franchir, mais non impossible! Ce serait également renverser la directionalité de la théorie de la récapitulation en stipulant que l’histoire de l’Humanité peut s’observer dans le développement de l’enfant; proposition beaucoup moins raisonnable que l’originale.

L’idée que le langage vocal humain a une origine gestuelle remonte à au moins (l’abbé Étienne Bonnot de) Condillac (1746), un élève de Locke, dans son Essai sur l’origine des connaissances humaines[31], pour qui les gestes naturels ont d’abord servi pour communiquer des émotions entre individus. Cette idée de Condillac a été abondamment reprise par la suite par un grand nombre de chercheurs[32]. Du point de vue de l’évolution, cette hypothèse paraît très sensée, dans la mesure où les primates non humains avaient peu de contrôle cortical sur leur vocalisation, mais un excellent contrôle sur leurs mains et leurs bras. Si au cours de son évolution l’espèce humaine est passée graduellement d’un mode de communication gestuelle à un mode de communication vocale, la raison en est peut-être toute simple et au fond très pratique: il s’agissait de libérer les mains engagées dans la communication pour les consacrer à d’autres tâches; c’est aussi ce que font les jeunes enfants. Cette évolution a créé une forme de dualité où le gestuel a pu un certain temps doublé en quelque sorte le vocal, pour petit à petit lui laisser la plus grande place.

La primauté du gestuel

Voyons les choses autrement. Personne aujourd’hui ne voudrait soutenir sérieusement que le langage signé des non-entendants n’est pas une langue à part entière. Le langage signé implique des mouvements articulatoires de certaines parties mobiles du corps: les doigts, mains, bras, et certaines parties du visage.

Par ailleurs, nous serons tous d’accord pour dire que le geste est intimement lié à l’idée de mouvement – qu’est-ce qu’un geste, sinon un mouvement produit par un élément corporel entre deux points déterminés? – un mouvement étant défini en communication physique comme un déplacement d’un élément servant à signifier, par exemple extension du bras, rotation de la main, pointer du doigt d’un point à un autre, etc., le tout en combinaison ou en successivité. Ainsi, ces gestes, ces mouvements, sont produits physiquement par un destinateur et sont perçus visuellement par le destinataire à qui ils s’adressent et qui les interprètent.

Dans le langage vocal des entendants, il se produit exactement la même chose: ce sont des mouvements, des gestes donc, mettant à contribution d’autres parties mobiles du corps qui vont permettre de transmettre des éléments d’information, mais à la différence cette fois-ci qu’ils seront perçus en large partie auditivement par le destinataire. Certains gestes, comme le mouvement des lévres, sont en outre perçus visuellement. C’est ainsi par exemple, en simplifiant un peu les choses, que pour produire le mot du [dy], la langue devra bouger en direction des dents pour fermer le passage de l’air dans la production du phonème [d], se rétracter ensuite dans une position haute (fermée) antérieure dans la cavité bucale, alors que les lèvres prendront une forme arrondie, pour la production du phonème [y]; tout au long de ce processus, les cordes vocales seront en mode vibratoire. On voit très bien par cet exemple simple que ce qui est mis en jeu dans la production verbale sonore est un assemblage et une succession de mouvements corporels, de gestes par conséquent, visant à transmettre un signe linguistique.

Que conclure déjà de ce qui précède, sinon que tout langage est fondamentalement gestuel? D’un point de vue évolutif, dans cette optique, que reste-t-il à dire? La communication humaine est passée d’un mode de transmision-réception gestuel-visuel à un mode gestuel-auditif. De son côté, l’enfant gesticule d’abord avec ses mains et ses bras pour progressivement apprendre à gesticuler avec ses organes phonatoires. J’insiste sur ce point: il y a continuité évolutive et continuité dans l’apprentissage entre le gestuel manuel et le gestuel oral: du point de vue médiatique, on passe ainsi progressivment du totalement-visible au partiellement-invisible, certains gestes étant toujours perceptibles, les mouvements de la bouche essentiellement, mais aussi certaines expressions faciales comme l’élévation ou le froncement des sourcils qui accompagnent autant l’expression orale que l’expression signée.

Le langage ordinaire des entendants est par conséquent doublement gestuel.

Il est fascinant d’observer les non-entendants fixer le visage de leurs interlocuteurs plutôt que leurs mains dans leurs échanges communicationnels.

Il est tout aussi fascinant d’observer, dans une conversation soutenue, un entandant fixer le bas du visage de son interlocuteur, la région située entre le nez et la gorge, comme s’il cherchait à voir, pour mieux saisir ce qui est dit, les gestes produits par les articulateurs invisibles de son appareil phonatoire.

Fondements théoriques

Plusieurs développements théoriques et études empiriques permettent de soutenir la position que j’ai présentée précédemment. Les travaux de Corballis (1999[33], 2002[34], 2003[35], 2004[36] , 2006[37], 2009[38], 2010[39]), notamment, sur lesquels je m’appuierai largement ici, fournissent de riches indications sur la genèse de la parole humaine comme étant l’aboutissement d’une évolution à partir de gestes[40] [41].

Traditionnellement, on considérait la parole comme étant composée d’éléments discrets sonores, appelés phonèmes. Or, depuis le remarquable travail de Joos (1948)[42], on sait que les phonèmes n’existent pas en tant qu’unités discrètes dans le signal acoustique, et qu’il n’est pas possible de les discerner discrètement par l’enregistrement mécanique, comme le spectographe. Cela est dû au fait que le signal acoustique correspondant aux phonèmes individuels varie largement, dépendant de l’environnement dans lequel ils se trouvent. Les phonèmes, par conséquent, n’existent que dans l’esprit des locuteurs, et le signal acoustique doit subir une transformation cérébrale complexe afin que le phonème individuel puisse être perçu comme tel. Par ailleurs, nous percevons la parole à un niveau remarquablement élevé, jusqu’à au moins 10-15 phonèmes à la seconde, ce qui semble contredire l’idée que certaines transformations complexes dépendant du contexte sont nécessaires. Ces problèmes ont conduit à une approche alternative, la phonologie articulatoire (Browman & Goldstein, 1995)[43], pour laquelle la parole est le résultat de gestes produits par six organes articulatoires: les lèvres, le voile, le larynx, la partie plate, le corps et la racine de la langue. Chacun de ces organes est contrôlé séparément, de sorte que les unités de parole individuelles résultent de différentes combinaisons de mouvements. La distribution de l’action sur ces articulateurs signifie que les éléments se superposent dans le temps, ce qui rend possible le taux élevé de production et de perception. Contrairement aux phonèmes, les gestes de la parole peuvent ête discernés par des moyens mécaniques, comme les rayons-X, l’imagerie par résonance magnétique, et la palatographie.

Il semble vraisemblable, selon Corballis, que l’aire de Broca a joué un rôle décisif dans le passage du geste manuel au geste vocal. Certains des neurones dans la région F5 chez le singe répondent quand l’animal fait un mouvement pour atteindre et saisir un objet, mais aussi quand il observe un autre individu faire le même mouvement. Ces neurones sont maintenant considérés comme faisant partie d’un système plus général de neurones appelés neurones miroir dans le cerveau du singe (Rizzolatti, Fogassi & Gallese, 2001)[44]. Le seul fait d’observer les mouvements de la parole, et même des images d’une bouche prononçant un son, active le système miroir, incluant l’aire de Broca (Calvert & Campbell, 2003)[45]. Ceci est conforme avec l’idée que la parole a pu évoluer à partir d’éléments visuels incluant les mouvements de la face. Il est vraisemblable, ajoute Corballis, que la vocalisation a été incorporée dans le système miroir des humains, et probablement seulement des humains, de nos ancêtres hominidés (Ploog, 2002)[46], fournissant ainsi le mécanisme de la théorie motrice de la perception de la parole («motor theory of speech perception»). Cela a pu se produire tardivement dans l’évolution de l’hominidé, au cours des 100 000 dernières années.

La théorie motrice de la perception de la parole, de laquelle est dérivée la phonologie articulatoire, implique également que la perception des sons de la parole s’accomplit en projetant la perception de la parole sur sa production. En d’autres mots, la parole fait partie du système miroir. Historiquement, par conséquent, le langage a pu se construire à partir de gestes manuels et faciaux, et graduellemneet incorporer des éléments vocaux. Du point de vue ontogénétique par ailleurs, il est devenu de plus en plus évident que les gestes jouent un rôle décisif dans le développement de la parole chez les enfants (Iverson & Golden-Meadow, 2005)[47].

Un scénario possible évolutionniste, soutient Corballis, est que la face est devenue plus importante dans la communication, les mains étant engagées davantage dans d’autres activités, comme la fabrication d’outils ou le transport des objets. Comme la langue, les lèvres et le conduit vocal font partie de la face, ces éléments ont pu graduellement assumer le fardeau de la communication, et comme la langue, le voile du palais, et le larynx sont en grande partie invisibles, une pression s’est exercée pour ajouter des sons. Essentiellement donc, la vocalisation rend les gestes internes de la bouche plus accessibles. Cela a pu aussi favoriser la distinction entre sons voisés et sons non voisés, augmentant ainsi le répertoire des sons. Dans cette optique, on conçoit la parole comme étant façonnée à partir de gestes faciaux, à moitié engloutis (i.e. cachés). Il existe suffisamment d’informations dans les gestes faciaux pour rendre possible la lecture sur les lèvres pour les non-entendants. Les zones du cerveau impliquées dans la production de la parole sont activées à la lecture des mouvements des lèvres (Calvet & Campbell, 2003[48]; Watkins, Strafella & Paus, 2003[49]). Les mains et la bouche sont également liés par le fait que, chez la plupart des individus, l’hémisphère gauche du cerveau est dominant autant pour les actions manuelles que pour la vocalisation, un couplage souvent considéré unique aux humains (Corballis, 1991[50]; Crow, 2002[51]), même si l’asymétrie cérébrale elle-même ne l’est pas (Rogers & Andrew, 2002[52]).

D’autres pressions ont pu jouer sur la parole comme telle. Bien que le langage manuel et le langage vocal peuvent être considérés linguistiquement équivalents, il existe d’autres avantages plus pratiques à la vocalisation. Une évolution vers la vocalisation autonome aurait libéré les mains de leur rôle nécessaire dans la communication, autorisant leur usage élargi pour la fabrication et la manipulation des outils. En effet, le langage vocal permet aux individus de parler et d’utiliser les outils en même temps, ou de parler de quelque chose tout en pointant autre chose dans l’environnement. La parole demande moins d’attention que le langage signé; on peut parler les yeux fermés, ou en regardant autre chose. La parole permet la communication sur une plus longue distance, aussi bien que la communication la nuit ou lorsque le destinateur n’est pas visible du destinataire.

La parole ainsi devenue autonome a pu avoir un impact considérable sur l’évolution de l’humanité. L’une des possibilités, suggère Corballis (2010)[53] , est que cette autonomie de la parole soit apparue en Afrique il y a peut-être 100 000 ans, après l’émergence de l’homo sapiens mais avant la migration hors de l’Afrique. La conversion finale à l’autonomie de la parole a pu être une invention (Corballis, 2002)[54], ou le résultat de la mutation biologique du gène FOXP2 (Corballis, 2004b)[55]. Des développements plus récents dans la communication, incluant l’écriture, le téléphone, la radio, la télévision et Internet, ont profondément influencé notre façon de penser, d’agir et de construire nos vies. Quoi que le passage du langage manuel au langage vocal a pu être graduel, l’atteinte ultime de l’autonomie de la parole a pu avoir un impact semblable sur notre existence, conclut Corballis (2010).

Dans la fiction de Jean M. Auel, Ayla apprendra à son fils, Durc, le langage signé du Clan, ce qui contredit partiellement, à tout le moins fictivement, la conclusion de Pinker (1994:160) évoquée plus haut: « nous ne trouvons aucune communauté d’entendants qui ait opté pour la langue des signes». Durc apprendra cependant à communiquer avec sa mère vocalement. Et comme tous les enfants après lui, il a d’abord gesticulé avec les mains pour ensuite gesticuler avec ses organes phonatoires. Est-ce encore de la science-fiction?

Il y a fort à parier que ce scénario de croisement génétique a eu lieu. En 2010, une équipe internationale de généticiens et de paléontologues dirigée par le généticien suédois Svante Pääbo de l’Institut Max-Planck d’anthropologie évolutive de Leipzig a mis en évidence qu’entre 1 et 4% de l’ADN des non-Africains est identique à celui de l’homme de Néandertal.[56] Et une autre équipe internationale de chercheurs, dirigée par Damian Labuda du Département de Pédiatrie de l’Université de Montréal et du Centre de recherche de l’hopital Sainte-Justine, a decelé la présence notable de 9% de séquences chromosomiques X dérivées du Néandertal parmi toutes les populations humaines contemporaines en-dehors de l’Afrique[57].

Mais assez parlé du passé; passons maintenant au présent…

 

[1] Espèce entendu au sens très large ici évidemment, ni les Sourds ni les Entendants ne constituent une espèce au sens évolutif.

[2] McNeil, D.  1985.  So you think gestures are nonverbal? Psychological review 92,3:350-71.

[3] McNeil, D.  2012.  How Language began: Gesture and Speech in Human Evolution. Cambridge University Press.

[4] Butterworth, B. & U. Hadar.  1989. Gesture, speech, and computational stages. A reply to Mcneil, Psychological Review 96,1:168-74.

[5] Pour un bilan de cette approche, voir: Hombert, Jean-Marie, dir.  2005.  Aux origines des langues et du langage. Paris: Fayard.

[6] Respectivement Langue des signes québécoise et American Sign Language.

[7] Weaver, Warren & Claude Elwood Shannon.  1963.  The Mathematical Theory of Communication. Univ. of Illinois Press. Les travaux de Shannon, auquel s’est associé Weaver, ont été publiés la première fois en 1948, sous le titre A Mathematical Theory of Communication, dans le Bell System Technical Journal 27:379-423; 623-656 (July/October). Le livre de 1963 est une réimpression de l’article de Shannon, 1948, que Weaver a vulgarisé pour le non-spécialiste.

[8]Jakobson, R.  1960.  Closing statements: Linguistics and Poetics, in T.A. Sebeok, Style in Language. Cambridge: MIT Press, pp. 350–377. Trad. fr. par Nicolas Ruwet, 1963.  Essais de linguistique générale 1, Les fondations du langage, Chapitre Linguistique et poétique. Paris: Minuit, pp. 213-222.

[9] Pinker, S.  1994.  L’Instinct du langage, Chapitre 6, Les sons du silence, 160sq. Paris: Odile Jacob.

[10] Wilbur, Ronnie B.  1979.  American Sign Language and sign systems. Baltimore, MD: University Park Press.

[11] Anzieu, Didier (dir.).  1977.  Psychanalyse et langage: du corps à la parole. Paris: Dunod

[12] Meschonnic, Henri.  1985.  Les états de la poétique. Paris: PUF.

[13] Cosnier, Jacques.  1982.  Communications et langages gestuels. Dans J. Cosnier, A. Berrendonner, J. Coulon & C. Orecchioni, Les voies du langage. Communications verbales gestuelles et animales, 255-304. Paris: Dunod.

[14] Voir à ce propos: Fournier, R.  1991.  À propos du non-manuel.  Revue québécoise de linguistique théorique et appliquée 10,1:157-214.

[15] Bickerton, Derek. 1984. The language bioprogram hypothesis. Behavioral and Brain Sciences 7,2:173-188, 212-221.

[16] http://www.slp-paris.com/102.html

[17] 1994.  The Origin of Language. New York: John Wiley. Traduction: 1997.  L’origine des langues. Paris: Belin.

[18] Adam’s Tongue: How Humans Made Language, How Language Made Humans. New York: Hill and Wang.

[19] 1ère édition: London: John Murray.

[20] Atkinson, Quentin.  2011.  Phonemic Diversity Supports a Serial Founder Effect Model of Language Expansion from Africa. Science  332, 6027:346-349.

[21] http://www.hominides.com/html/actualites/langage-origine-africaine-0432.php

[22] http://www.hominides.com/html/dossiers/langage.php

[23] Haeckel, Ernst.  1866.  Generelle Morphologie der Organismen. Berlin: Reimer.

[24] Marcus, G.F., & S. E. Fisher.  2003.  FOXP2 in focus : what can genes tell us about speech and language ? Trends in Cognitive Science7,6: 257-62.

[25] Boyd, R., & J.B. Silk.  2000.  How Humans Evolved, New York: W.W. Norton.  Klein, R.G. & B. Edgar.  2002.  The Dawn of Human Culture, New York: Wiley.

[26] De 86 à 100 milliards, et peut-être davantage, selon diverses estimations: Williams, R. W. & K. Herrup.  1988.  The Control of Neuron Number, The Annual Review of Neuroscience 11:423–453. Dernière révision, sept. 2001: http://www.nervenet.org/papers/NUMBER_REV_1988.html

[27] Heyes, C.  2010.  Where do mirror neurons come from? Neuroscience & Biobehavioral Reviews 34: 575–583.

[28] Rizzolatti, G. & L. Craighero.  2004.  The mirror-neuron system. Annual Review of Neuroscience 27: 169–192.

[29] Keysers, C. & V. Gazzola.  2007.  Integrating simulation and theory of mind: from self to social cognition. Trends in Cognitive Sciences, 11,5:194-196.

[30] Leslie, A. M.  1987.  Pretense and Representation: The Origins of “Theory of Mind”. Psychological Review, 94,4:412-426.

[31] Réimpression 1973: Essai sur l’origine des connaissances humaines. Paris: Galilée. [1971]: An essay on the origin of human knowledge. Gainesville, FL : Scholars Facsimiles and Reprints.

[32] Pour un aperçu, voir: Hewes, G. W.  1973.  Primate Communication and the Gestural Origin of Language. Current Anthropology 14, 1/2:5-24; et Corballis, M. C.  2006.  Evolution of Language as a Gestural System. Marges Linguistiques, 11:218-228.

[33] Corballis, M. C.  1999.  The gestural origins of language. American Scientist 87:138–45.

[34] Corballis, M. C.  2002.  From hand to mouth: The origins of languagePrinceton University Press.

[35]Corballis, M. C.  2003.  From mouth to hand: Gesture, speech, and the evolution of right-handedness. Behavioral and Brain Sciences, 26:199-260.

[36] Corballis, M. C.  2004.  FOXP2 and the mirror system. Trends in Cognitive Sciences, 8,3:95-96.

[37] op. cit.

[38] Corballis, M. C.  2009.  Language as gesture. Human Movement Science 28:556–565.

[39] Corballis, M. C.  2010.  Did language evolve before speech? in Larson, R. K., V. Déprez & H. Yamakido (eds.). Approaches in the Evolution of Human Language, 115-123. Cambridge University Press.

[40] Corballis (2002:65) attribue la paternalité de la théorie gestuelle de la parole sous sa forme moderne à Gordon W. Hewes (1973), op. cit.

[41] Les remises en question et les propositions nuancées plus récentes de Kendon (2017) méritent aussi d’être prises en considération: Kendon, A.  2017.  Reflections on the “gesture-first” hypothesis of language origins. Psychonomic Bulletin & Review, 24,1:163-170.

[42] Joos, M. G.  1948.  Acoustic Phonetics, Language (1948) 24,2.

[43] Browman, C. P. & L. Goldstein.  1995.  Dynamics and Articulatory Phonology. In R. F. Port & T. Van Gelder (Eds.), Mind as Motion: Explorations in the dynamics of cognition, 175-193. Cambridge, MA: The MIT Press.

[44] Rizzolatti G., L. Fogassi & V. Gallese.  2001.  Neurophysiological mechanisms underlying the understanding and imitation of action.  Nature Reviews Neuroscience 2:661-670.

[45] Calvert, G.-A. & R. Campbell.  2003.  Reading speech from still and moving faces: The neural substrates of visible speech. Journal of Cognitive Neuroscience15,1:57-70.

[46] Ploog, D.  2002.  Is the neural basis of vocalisation different in non-human primates and Homo sapiens ? ds: Crow, T.-J. (ed.). The speciation of modern homo sapiens, 121-135. Oxford, UK : Oxford University Press.

[47] Iverson, J.M., & S. Goldin-Meadow.  2005.  Gesture paves the way for language development. Psychological Science, 16, 367-371.

[48] op. cit.

[49] Watkins, K. E., A. P. Strafella & T. Paus.  2003.  Seeing and hearing speech excites the motor system involved in speech production. Neuropsychologia 41,8: 989–994.

[50] Corballis, M.  1991.  The lopsided apeNew York : Oxford University Press.

[51] Crow, T.-J.  2002.  Sexual selection, timing, and an X-Y homologous gene : Did Homo sapiens speciate on the Y chromosome? in : Crow, T.-J. The speciation of modern HomoSapiens195-216. Oxford, UK : OUP.

[52] Rogers, L.-J. & R.-J. Andrew (eds.).  2002.  Comparative vertebrate lateralizationNew York : CUP.

[53] (2010). Did language evolve before speech? in Larson, R. K., V. Déprez & H. Yamakido (eds.). Approaches in the Evolution of Human Language, 115-123. Cambridge University Press.

[54] Corballis, M. C.  2002.  From hand to mouth: The origins of languagePrinceton University Press.

[55] Corballis, M. C.  2004b.  The origins of modernity: Was autonomous speech the critical factor? Psychological Review, 111543-522.

[56]Green, R. E. et al.  2010.  A Draft Sequence of the Neandertal Genome. Science 328,5979:710-722 (May 07).

[57] Yotova, V. et al.  2011.  An X-Linked Haplotype of Neandertal Origin Is Present Among All Non-African Populations. Molecular Biology and Evolution, 28,7:1957–1962.