7 septembre 2022 : le foyer originel des langues indo-européennes aurait encore changé de place. Une étude de paléogénétique de Harvard publiée le 26 août 2022 faisant travailler ensemble linguistes, généticiens et archéologues se propose de redéfinir le lieu de naissance et le mode de diffusion de ces langues parlées aujourd’hui à travers toute l’Eurasie et l’Amérique.
Les langues indo-européennes sont une famille linguistique rassemblant la plupart des langues parlées en Europe ainsi que dans le sous-continent indien. Divisées précocement en divers rameaux (langues germaniques, balto-slaves, celtes, indo-iraniennes, ainsi que le grec notamment) dont certains sont aujourd’hui éteints (les langues tokhariennes parlées dans le Xinjiang jusqu’au Moyen Âge, les langues anatoliennes comme le hittite et le louvite parlées dans l’Anatolie antique), elles se seraient répandues dans toute l’Eurasie jusqu’aux confins occidentaux de la Chine à partir de l’âge du Bronze, mais leur mode de diffusion ainsi que leur lieu d’origine et la culture archéologique associée restent à définir avec certitude.
Placé par les linguistes tantôt dans la steppe pontique, le Caucase ou en Anatolie, l’emplacement du proto-indo-européen commun reconstruit par les linguistes depuis le milieu du XIXe siècle a même été un enjeu politique. La Russie impériale voyait dans le Turkestan qu’elle souhaitait coloniser le « foyer aryen » originel, tandis que l’Allemagne nazie l’imaginait dans le Nord, en accord avec certaines théories raciales, afin de placer la « race germanique » comme principale héritière d’un prestigieux héritage « indo-germanique » dont Rome et Athènes descendraient directement, plutôt que d’en être de lointains parents.
Afin de reconstituer ce puzzle commencé au XVIIe siècle lorsque la parenté du latin, du grec et de l’iranien a été attestée, suivie au XVIIIe siècle par celle du sanskrit, langue sacrée de l’Inde, il était logique que les paléogénéticiens et les archéologues se mettent au travail pour donner une réponse définitive et incontestable débarrassée de toute politisation.
La présente équipe, menée par le célèbre David Reich - auteur de l’ouvrage de vulgarisation en 2018 Who We Are and How We Got Here - et Iosif Lazaridis, n’en est pas à son coup d’essai.
En 2015 déjà, l’étude de Wolfgang Haak et Iosif Lazaridis épaulée par le laboratoire de David Reich à Harvard avait établi qu’une migration massive venant de la steppe pontique, entre mer Noire et Caucase, était la source de la diffusion des langues indo-européennes en Europe, confirmant la « l’hypothèse kourgane » de l’archéologue Marija Gimbutas.
Incomplète mais jamais démentie, cette étude était un premier jalon, affinée depuis 2015 par de nombreuses études complémentaires de paléogénétique européenne, discipline en plein essor. Cette nouvelle étude se fonde sur la base de données la plus complète jamais utilisée : 727 squelettes d’Anatolie, du sud de l’Europe et du Caucase, allant du Chalcolithique à l’âge du Bronze.
L’Arménie, berceau des Indo-Européens
Que nous dit la nouvelle étude ? Deux choses essentielles : premièrement, la steppe pontique ne serait qu’un foyer secondaire, le premier foyer hypothétique serait situé dans le Caucase, probablement dans les plateaux arméniens. Deuxièmement, l’étude se positionne sur l’architecture des rameaux linguistiques et élude certaines théories linguistiques pour privilégier l’idée que les langues anatoliennes (hittite, louvite en premier lieu) seraient un rameau à part entière, et que les langues indo-européennes seraient un deuxième super rameau, qui se serait chronologiquement subdivisé ultérieurement depuis la steppe pontique.
Le foyer initial du proto-indo-anatolien serait donc théoriquement l’Arménie actuelle, d’où seraient parties tôt vers l’ouest les langues anatoliennes. Le reste des proto-indo-européens auraient franchi le Caucase plus tard, avant la grande expansion eurasienne de l’âge du Bronze. Le schéma produit par l’étude ci-dessous récapitule leur modèle :
La preuve par les gènes
Cette étude se fonde sur l’ADN autosomal, c’est-à-dire l’ADN contenu sur les 22 paires de chromosomes non sexuels. Cela n’inclut pas ce que l’on appelle l’ADN mitochondrial (un ADN contenu dans les mitochondries et transmis uniquement par la mère) et les marqueurs du chromosome Y, transmis uniquement de manière patrilinéaire.
L’argument majeur pour postuler un foyer primordial en Arménie de notre famille linguistique tient sur les différentes composantes de l’ADN autosomal. En effet, les « yamnayas », population ayant vécu dans la steppe pontique au nord de la mer Noire (Ukraine actuelle) il y a environ 5000 ans seraient composites : presque à moitié descendants de chasseurs cueilleurs du Caucase et à moitié des chasseurs cueilleurs d’Europe de l’Est, avec une faible composante levantine et de l’Anatolie du néolithique, comme nous pouvons le voir sur le schéma ci-dessus, extrait de l’étude de Harvard.
Or, d’après l’étude, aucune composante « chasseurs cueilleurs d’Europe de l’Est » n’est trouvable dans l’Anatolie de l’âge du Bronze tandis qu’une migration de chasseurs cueilleurs du Caucase vers l’ouest en Anatolie serait bien visible il y a 6500 ans. La signature génétique associée aux premiers temps de notre famille linguistique serait donc à chercher chez les chasseurs cueilleurs du Caucase et pas ceux des plaines d’Europe orientale auxquels nous pensions auparavant.
Le reste de l’étude confirme l’expansion des langues indo-européennes dans un second temps à partir du sud de l’actuelle Ukraine vers l’ouest en Europe et vers l’Asie centrale à l’est.
Une étude malgré tout lacunaire
Toutefois, nous pouvons nous permettre de nuancer les résultats de l’étude, et d’apporter quelques interrogations. Celle-ci se fonde exclusivement sur l’ADN autosomal, et omet l’étude des haplogroupes du chromosome Y. Les haplogroupes sont des groupes d’haplotypes transmis ensemble à la descendance.
En génétique des populations, les plus fréquemment étudiés pour comprendre l’origine des populations et les migrations sont ceux du chromosome Y (transmis par le père) et de l’ADN mitochondrial (transmis par la mère). Or, l’étude des lignées paternelles directes montre un tableau bien plus complexe. Premièrement, les Yamnayas sont mis en valeur comme le foyer du proto-indo-européen alors qu’ils ne sont génétiquement qu’une des branches des Indo-Européens.
Comme l’auteur de l’étude Yosif Lazaridis l’admet lui-même sur Twitter en réponse à des critiques, une grande partie des populations locutrices de langues indo-européennes actuelles et de l’Antiquité ne descendent pas directement des Yamnayas. Leurs descendants directs se trouvent parmi les Arméniens, Grecs, Albanais actuels, ainsi que dans les locuteurs des langues tokhariennes (aujourd’hui éteintes) du Xinjiang chinois, descendants probables de la culture d’Afanasievo de l’âge du Bronze. En effet, le marqueur Z2103 caractéristique de la très grande majorité des chromosomes Y des squelettes de la culture Yamna ne trouve des descendants que dans ces populations actuelles.
La population qui fut l’ancêtre des rameaux celtique, germanique et italique portait le marqueur L51, marqueur frère du Z2103 trouvé dans des squelettes de la culture de la céramique cordée, située plus au nord et à l’ouest de la culture des tombes en fosse, le nom archéologique des Yamnayas. L’ancêtre patrilinéaire direct commun est le marqueur L23, antérieur. Il faut au moins en remonter à la culture archéologique de Sredny Stog entre 4500 et 3500 av. J.C., située sur le même emplacement que les futurs Yamnayas.
Or, cette antériorité n’arrange pas les chercheurs de Harvard : ils parient sur la migration de chasseurs-cueilleurs, 4500 ans av. J.C., depuis le sud du Caucase vers l’Anatolie, pour être les vecteurs des langues anatoliennes que sont notamment le hittite, le palaïte, le louvite. Ils ont donc eu besoin d’un foyer proto-indo-européen plus proche de notre époque pour que cela fonctionne sur le plan chronologique.
Un marqueur génétique proche du L23 mentionné ci-dessus a fait l’affaire : le PF7562. Il s'est séparé du reste des Indo-Européens environ 200 ans avant l’apparition du L23 (c’est-à-dire vers 4400 ans av J. C.) et n’existe plus aujourd’hui qu’en Turquie, Arménie et Albanie.
Un autre problème de taille se pose : dans la steppe du nord de la mer Noire cohabitaient déjà au moment de Sredny Stog deux grands groupes de population qui sont aujourd’hui les ancêtres directs des locuteurs de langues indo-européennes : ceux du pourtour de la mer Noire portant le marqueur L23 et ceux plus au nord portant le marqueur M417, porté par la grande majorité des squelettes de la culture de la céramique cordée. De ces derniers descendent les locuteurs des langues balto-slaves et indo-aryennes.
Ces deux groupes originels ne se sont jamais mélangés avant la grande expansion tout en partageant des aires de peuplement limitrophes et n'ont un ancêtre paternel direct commun qu’il y a près de 20000 ans. Un de ces deux rameaux cousins a-t-il apporté le proto-indo-européen à l’autre ? Ou celui-ci résulte-t-il d’une synthèse féconde ? On n’en sait encore rien.
Enfin, le foyer caucasien identifié par les généticiens de Harvard est mis en doute par des linguistes, notamment Guus Kroonen de l’Université de Leiden aux Pays-Bas, pionnière dans l’étude des langues indo-européennes. Elle rappelle qu’à cette époque, l’agriculture était largement pratiquée au Caucase ; or, le proto-indo-européen manque cruellement de termes liés à l’agriculture et devrait être une langue initialement de chasseurs cueilleurs. Il faudra plus de squelettes analysés pour une réponse définitive, si celle-ci est possible.
Vos réactions à cet article
Recommander cet article
Lebrun (09-09-2022 02:47:42)
Je suis un peu étonné que le nom de G Dumezil ne soit pas cité, sur les correspondances entre les peuples indo-européens. Bon, enfin ça date un peu, j'en conviens ... toutefois, l'article postule un apriori (non évoqué comme hypothèse préalable) qu'il puisse y avoir un centre initial à la culture/société indo-européenne dont tout est parti (le premier homme !). Il y a une verticalité de filiation (forcément génétique) dont se gardait bien Dumezil en son temps. Il y a sans aucun doute, un intérêt à utiliser les éléments extraits de la génétique (la techno !), mais de là à tout expliquer au-travers de ce prisme, Hummm on retombe dans les mêmes travers des fous-furieux de l'origine aryenne des occidentaux d'aujourd'hui. En fait, si on relit Dumezil, on comprend que les mythes et épopées que connaissaient encore les très petites communautés isolées des grands courants migratoires, vestiges linguistiques et de mythes plus anciens ont été progressivement acculturés et les locuteurs/porteurs ont tous disparu au milieu du 20eme. On peut toujours tracer les courants migratoires par la génétique, cela ne dit que très peu des ruptures et des innovations culturelles qui ont eu un effet majeur et s'ils avaient une origine géographique unique ou inter-dépendante ou hybridée par des allers-retours. Le risque, c'est de chercher les clés perdues sous le réverbère, parce que c'est le seul endroit ou il y a de la lumière ! 😊
Vincent (08-09-2022 21:55:32)
"Un de ces deux rameaux cousins a-t-il apporté le proto-indo-européen à l’autre ? Ou celui-ci résulte-t-il d’une synthèse féconde ? On n’en sait encore rien."
À la fin de cet article, fondé exclusivement sur des considérations génétiques, M. Solans nous montre, peut-être sans s'en rendre compte, toutes les limites de ce genre d'étude, sorte de retour pseudo-scientifique vers des considérations raciales éculées.
En effet, c'est un peu une vue de l'esprit que de considérer une population qui parle la même langue et vit au même endroit comme constituée de parents. Ce n'est pas valable aujourd'hui, et ça ne l'était pas plus hier. On sait que le peuple des Francs est la réunion de quatre peuples originellement distincts, et que même dans une île comme la Crète, des populations différentes coexistaient à l'époque minoenne.
La question de la langue à des époques très anciennes est bien plus liée à la proximité géographique, aux migrations et -plus tard- à la constitution d'États. J'en veux pour indice le fait qu'il y a beaucoup plus de parentés entre les langues sémitiques et les langues indo-européennes, parlées par des peuples qui partagent le même espace géographique, et qui commercent ensemble, qu'entre les langues indo-européennes et les langues sino-tibétaines, sans qu'on puisse, à ma connaissance rapprocher génétiquement les peuples de ces deux groupes. Ainsi, si le substantif dans les langues sémitiques ne connaît pas de déclinaison, contrairement aux langues indo-européennes (à part la différence entre l'état construit et l'état absolu), ces premières ont une flexion du verbe, comme dans les langues indo-européennes et contrairement aux langues sino-tibétaines.
GHILS (08-09-2022 08:32:43)
Etonnant que cette personne s réfère à la religion, ce doit être une obsession. S'il fallait situer le lieu de naissance de tel ou tel dieu ou tel ou tel écrit, nous aurions des milliers de lieux à explorer. Bonne chance!
Matt (07-09-2022 12:20:39)
Étonnant que ça correspondent à l'endroit où la Bible situe l'échouage de l'arche de Noé.