Le nombre de langues actuellement parlées sur notre planète est difficile à déterminer précisément, mais on estime généralement qu’il y en a entre 6000 et 7000. Par conséquent, la plupart des gens n’a jamais entendu parler de la grande majorité d’entre elles.
Je vais vous présenter dix langues dont vous ne connaissiez sans doute pas l’existence. Je les ai choisies parce qu’elles sont remarquables par leur histoire, leur prononciation, leur grammaire, la culture qui y est associée ou d’autres caractéristiques et elle vous permettront, je l’espère, d’entrevoir l’immense diversité du monde des langues dont beaucoup de gens ne se doutent même pas.
Cela dit, si vous vous intéressez aux langues ou à la linguistique, il est très probable que vous ayez déjà entendu parler de certaines d’entre elles.
Bourouchaski
Quand une langue n’a aucun lien prouvé avec une famille de langues, on dit que c’est un isolat. Les exemples les plus connus sont le coréen et le basque. Le bourouchaski est un isolat moins connu. Parlé dans le nord du Pakistan, on a essayé de le lier aux langues indo-européennes ou caucasiennes, mais aucune hypothèse n’a convaincu la majorité des linguistes. Jusqu’à preuve du contraire, il forme donc une famille à lui tout seul.
Le bourouchaski est surtout parlé, mais quand il est écrit, on utilise généralement l’alphabet ourdou (dérivé de l’alphabet arabe), le plus utilisé au Pakistan. Il a quatre genres (humain masculin, humain féminin, animaux et objets dénombrables, concepts abstraits et objets indénombrables), son système numéral est en base 20 et son système verbal est particulièrement compliqué et comporte beaucoup de préfixes et suffixes.
Oubykh
Le Caucase est une région particulièrement riche en langues. On y trouve des langues indo-européennes (russe arménien et langues iraniennes), des langues turques et des langues caucasienne (appellation qui regroupe en fait trois familles distinctes).
Inutile de chercher l’oubykh dans la carte ci-dessus : la dernière personne à savoir le parler est morte en 1992. L’oubykh était autrefois parlé autour de Sotchi, jusque à ce que ses locuteurs s’exilent en Turquie dans les années 1860.
Les langues caucasiennes sont remarquables pour leur quantité impressionnante de consonnes. Le géorgien (dont j’ai déjà parlé) est un petit joueur comparé à des langues comme l’abkhaze, mais l’oubykh les bat tous les deux : cette langue est célèbre parmi les linguistes parce qu’elle comptait pas moins de 84 consonnes, le plus grand nombre connu, en tout cas parmi les langues qui n’utilisent pas de clics. J’ai mal à la gorge rien qu’en pensant à sa phonologie. Par contre, il n’avait, selon certaines analyses, que deux voyelles.
(Petite précision : quand je parle de consonnes et de voyelles, je parle de prononciation. Ça n’a rien à voir avec les lettres de l’alphabet. Allez jeter un coup d’œil à la vidéo « 13 voyelles en français ».)
Russenorsk
Quand des personnes de langues différentes ont besoin de communiquer mais n’ont pas de langue commune, ou ont seulement en commun une langue mal maîtrisée, un pidgin peut naître – une langue simplifiée avec du vocabulaire issu de plusieurs langues, parfois limité à quelques domaines. Quand un pidgin devient la langue maternelle d’une population, celui-ci s’étoffe pour devenir une langue à part entière appelée créole.
Les pidgins et créoles sont souvent apparus à cause de la colonisation, les colonisés (qui pouvaient avoir des langues maternelles différentes) ayant besoin de communiquer entre eux et avec leurs colonisateurs. Des langues se constituaient alors avec des mots de la langue des colonisateurs et des structures calquées sur les langues locales. C’est pour cela que beaucoup des créoles parlés aujourd’hui sont issus de l’anglais (tok pisin de Papouasie-Nouvelle-Guinée), du français (créoles haïtien ou réunionnais), du portugais ou de l’espagnol.
Une autre situation propice à la formation de pidgins, c’est le commerce, parfois entre des peuples inattendus. C’est ainsi qu’entre le XVIIIe et le XIXe siècles, il a existé un pidgin mi-russe, mi-norvégien, utilisé par des marins, des commerçants et des pêcheurs dans l’Arctique, au nord de la Norvège.
Wikipédia nous offre quelques phrases en russenorsk qui ont été notées par des linguistes de l’époque, par exemple Kak sprek? Moja njet forsto. En connaissant un peu les langues d’origine, on comprend assez facilement la phrase :
- kak – как : « comment »
- sprek – språk : « langue »
- moja – моя : « ma »
- njet – нет : « non »
- forsto – forstå : « comprendre »
C’est-à-dire : « Qu’est-ce que tu dis ? Je ne comprends pas. »
Rotokas
La Papouasie-Nouvelle-Guinée est le pays avec le plus grand nombre de langues : environ 800. L’une d’elle, appelée rotokas, est parlée par quelques milliers de personnes sur l’île de Bougainville. Elle est connue pour être le contraire de l’oubykh : seulement 6 consonnes et 5 voyelles (ou peut-être 10 si on compte les voyelles longues). Son alphabet est donc le plus petit au monde : A E G I K O P R S T U V, soit 12 lettres pour 11 phonèmes (apparemment, T devient S devant I).
Un enregistrement en rotokas (je ne pensais même pas que j’en trouverais un, mais pour beaucoup de langues minoritaires on trouve des enregistrements de la Bible).
Sentinelle
Au large de la Birmanie, il existe un archipel, les îles Andaman. Celui-ci est rattaché à l’Inde. Les Andamanais, les peuples qui y vivaient à l’origine, ont été plutôt mal traités par les colons et sont aujourd’hui assez mal en point. Leurs langues sont menacées, voire éteintes – sauf sur l’île de North Sentinel. Ses habitants, appelés les Sentinelles, sont très hostiles aux étrangers et les rares tentatives de contact ont généralement été accueillies par des flèches. Du coup, on en sait très peu sur ce peuple qui est sans doute le plus isolé au monde.
Leur langue est plus remarquable par la situation de ceux qui la parlent que par ses caractéristiques linguistiques qui sont totalement inconnues. Tout au plus, on peut supposer (sans en être sûr) qu’elle est apparentée aux langues des îles voisines. Bref, c’est la langue la plus difficile au monde : il n’y a pas de cours, de manuel, de dictionnaire, même pas de description linguistique ou une pauvre liste de mots, et si vous voulez la pratiquer, vous devez risquer votre vie.
Mwotlap
Le Vanuatu, un archipel au large de l’Australie, est un pays linguistiquement étonnant : il a moins de 300 000 habitants, et pourtant on y parle plus de 130 langues indigènes, toutes de la famille des langues océaniennes. L’une d’elles, appelée mwotlap, est parlée par environ 2 000 personnes sur la petite île de Mota Lava, au nord du pays. Pourquoi je vous parle de cette langue en particulier ? Parce que c’est la seule pour laquelle on peut trouver une thèse de mille pages en français. Elle a tellement de choses intéressantes que je pourrais en faire un article entier, mais voici les principales originalités.
Le mwotlap distingue deux types de « nous » : inclusif (moi + toi + éventuellement d’autres personnes) et exclusif (moi + quelqu’un d’autre, mais pas toi). Rien de vraiment extraordinaire, c’est quelque chose d’assez courant, même si aucune langue d’Europe ne fait la distinction. Mais en plus, là où le français distingue le singulier et le pluriel, le mwotlap – en tout cas pour les humains – distingue en plus le duel (2 personnes) et le triel (3 personnes). Le duel, ce n’est pas trop inhabituel (ça existe par exemple en slovène et en arabe), mais le triel est quelque chose de très rare. Bref, au total, alors qu’en français on a seulement « nous », en mwotlap on trouve six pronoms différents : dō ou dōyō (moi + toi), kamyō (moi + une autre personne), ēntēl ou dētēl (moi + toi + une autre personne), kamtēl (moi + deux autres personnes), gēn (moi + toi + deux autres personnes ou plus), kem ou kemem (moi + trois autres personnes ou plus).
L’expression de la possession en mwotlap est complexe : on distingue les noms aliénables et inaliénables. Les noms inaliénables désignent des choses qui ont nécessairement un propriétaire et qui peuvent difficilement en changer : des parties du corps et des choses comme « nom », « ombre » ou « voix ». Pour ainsi dire, cette langue n’a pas de mot pour « tête », mais un mot qui signifie plutôt « tête de » qui ne peut pas être utilisé sans possesseur.
Pour les noms aliénables, c’est-à-dire tout le reste, on ne peut pas simplement utiliser un mot comme « de » en français : il faut préciser de quel type de possession il s’agit. Il y a quatre types possibles : possession temporaire, possession destinée à être mangée, possession destinée à être bue et une catégorie pour tout le reste. Si en français on peut dire « ma pomme », en mwotlap on est obligé de dire « ma pomme (que je porte) », « ma pomme (que je vais manger) » ou « ma pomme (autre, par exemple que j’ai chez moi) ».
Mais la chose la plus extraordinaire pour moi, c’est la manière dont les gens là-bas se repèrent : ils n’utilisent pas les concepts de droite et gauche, mais s’orientent par rapport à la géographie de leur île. Au lieu de « décale-toi vers la droite », on dira par exemple « décale-toi vers le haut », où « le haut » désigne en fait l’est. Les mots « dedans » et « dehors » ont un deuxième sens : « dedans » désigne la direction vers l’intérieur de l’île, « dehors » la direction vers la mer. « En haut » et « en bas » désignent des directions sur un axe perpendiculaire à l’axe « dedans-dehors », « en haut » était la direction la plus proche du sud-est (une histoire de vents dominants).
Je vous conseille de faire un tour sur le site de l’auteur de la thèse susmentionnée, vous y trouverez des enregistrements et des informations intéressantes.
Damin
Les langues aborigènes d’Australie sont malheureusement toutes en danger, quand elles ne sont pas déjà éteintes. L’une d’elle est appelée lardil et est parlée par seulement quelques dizaines de personnes sur l’île Mornington, dans le Queensland. Jusqu’aux années 50, les Lardils pratiquaient des cérémonies d’initiations pour les hommes qui comprenaient des circoncisions et des subincisions (si vous ne savez pas ce que c’est, ne cherchez pas, surtout si vous êtes un homme) et dans lesquelles on enseignait un langage spécial appelé damin. Ce n’était pas tout à fait une langue secrète : seuls les initiés l’apprenaient (et les linguistes qui l’ont décrit, apparemment), mais ils pouvaient l’utiliser en public et on n’empêchait personne de l’entendre.
Cette langue emploie la même grammaire que le lardil, mais en diffère par son vocabulaire et sa prononciation. Son vocabulaire est plus limité : un mot en damin correspond à plusieurs mots en lardil. Elle n’a que deux pronoms personnels : « moi » et « pas moi ». Et sa prononciation est remarquable : elle a plein de consonnes bizarres, dont des clics, ce qui en fait la seule langue hors d’Afrique australe avec des clics.
Pirahã
Ah, le pirahã. Cette langue parlée par quelques centaines de personnes au milieu de la forêt brésilienne est célèbre chez les linguistes pour ses caractéristiques aussi extraordinaires que controversées. La plupart des connaissances sur cette langue viennent du linguiste américain Daniel Everett. Celui-ci travaillait à l’origine pour SIL International, une organisation chrétienne qui a pour but de documenter des langues minoritaires afin de traduire la Bible dans ces langues et de convertir les gens qui les parlent. Quelques décennies plus tard, après avoir passé pas mal de temps chez les Pirahãs, Everett est athée.
Malgré le petit nombre de Pirahãs, leur langue n’est pas menacée : la plupart sont monolingues et ils considèrent qu’ils n’ont rien à apprendre des étrangers.
La phonologie du pirahã est assez simple : trois voyelles, peut-être sept ou huit consonnes (apparemment, les femmes utilisent une consonne de moins) et deux tons. Fait extraordinaire, la langue peut être aussi fredonnée ou sifflée et rester compréhensible.
Les Pirahãs n’ont pas de mots pour les nombres (c’est rare, mais ça se retrouve aussi dans certaines langues d’Australie). Ils ont juste deux mots qui semblent vouloir dire « un peu » et « un peu plus ». Des Pirahãs ont demandé à Everett de leur enseigner les nombres pour qu’ils puissent savoir s’ils se faisaient arnaquer par les commerçants brésiliens. Au bout de huit mois, aucun n’était capable de compter jusqu’à 10 en portugais ou de faire des additions simples. Leur langue n’a même pas de nombre grammatical (singulier et pluriel), même dans les pronoms.
Leur système de parenté est simple et ils ne s’intéressent pas à ce qui s’est passé il y a plus de deux générations. Ils n’ont pas de mots pour les couleurs à part « clair » et « sombre ». Et le pirahã est incapable d’exprimer la récursion, ce qui remet en question des théories sur la grammaire universelle.
Tout cela peut sembler trop surprenant pour être vrai, d’où les controverses concernant le pirahã : d’autres linguistes estiment, sur la base de travaux d’autres linguistes ou même d’Everett lui-même, que si, le pirahã peut exprimer la récursion, il a des mots pour les couleurs et des pronoms personnels au pluriel, beaucoup des bizarreries supposées du pirahã se retrouvent dans d’autres langues, et les Pirahãs ne sont pas si monolingues que ça et beaucoup comprennent le portugais.
Wilamowicien
Quittons ces pays exotiques pour revenir un peu plus près de chez nous : en Pologne, dans la petite ville de Wilamowice dans le sud du pays. Parmi ses 3 000 habitants, moins d’une centaine parle encore wilamowicien, une langue germanique isolée aux milieu de pays de langue slave. Sa prononciation a l’air d’être pas mal influencée par le polonais et ses mots sont difficilement reconnaissables quand on connaît une langue germanique.
Javanais
Pour finir, une langue moins obscure que les autres. Le javanais, la langue d’une bonne partie de l’île de Java en Indonésie, est en effet parlée par environ 100 millions de personnes. Mais seul l’indonésien est officiel en Indonésie, ce qui fait du javanais la plus grande langue sans statut officiel.
Le javanais a trois registres – trois niveaux de politesse, chacun avec ses spécificités de vocabulaire et de grammaire, et avec des mots polis et honorifiques qu’on ne peut normalement pas utiliser en parlant de soi et dont l’emploi dépend du statut de celui qui parle et de son interlocuteur. Comme en japonais, parler correctement en employant le bon niveau de politesse est compliqué et nécessite de bien connaître la culture.