ancienne version de Portalingua

Poids des langues

Traduction : langue source

Nous utilisons ici les données de l’Index translationum que l’on trouve sur le site de l’UNESCO.

Dans certains cas l’Index translationum indique une langue qui aurait « disparu ». C’est le cas du serbo-croate, code iso [hbs] qui indique qu’avant 1992 ce que parlaient les Croates, les Bosniaques et les Serbes était considéré comme une seule et même langue. Après 1992, translationum compile les traductions à partir du croate [hrv], du bosniaque [bos] et du serbe [srp]. Pour tenir compte des traductions antérieures à 1992, nous les répartissons entre les trois langues « nouvelles » au prorata du nombre de traductions à partir de ces trois langues après 1992. Cette méthode n’est bien sûr pas parfaite, mais nous avons pensé que l’affectation des traductions antérieures à 1992 au seul serbe favoriserait celui-ci par rapport au croate et au bosniaque. L’affectation du nombre total de traductions antérieures à 1992 aux trois langues favoriserait celles-ci par rapport aux autres langues. Un cas analogue de langue hypothétique se présente avec le « chinois ». Translationum reporte des données pour le chinois [zho], le chinois ancien [och] et le chinois yué [yue]. Dans ce cas, nous affectons les données relatives au « chinois » [zho] au seul mandarin et les données relatives au yué à celui-ci. Les données relatives au chinois ancien [och] ne sont pas prises en compte, tout comme celles relatives au grec ancien et au latin.

Une troisième situation est celle de l’arabe, il existe un arabe « standard » [ara] et plus de 25 arabes dialectaux. Tous les arabes dialectaux sont évidemment des langues vivantes et l’arabe standard ou littéraire est une langue « commune » qui ne possède aucun locuteur en langue maternelle. Cependant, l’Index translationum reporte des données pour l’arabe standard [ara] et l’arabe marocain [ary] mais rien pour les arabes égyptien et algérien qui sont les plus parlés avec le marocain ni pour aucune des autres variétés dialectales. Dans ce cas contrairement au serbo-croate et au chinois les données relatives à l’arabe standard sont affectées à lui et à lui seul. La raison de ce choix réside pour une part dans notre volonté de respecter les décisions des peuples. Les Croates, Bosniaques et Serbes souhaitent qu’il existe trois langues différentes correspondant à leurs trois pays. Dans le cas des arabes, la communauté arabo-musulmane souhaite qu’il existe une langue commune supposée comprise de tous au travers du Coran. Le cas du chinois est plus difficile à rationaliser. Il existe évidemment plusieurs chinois parlés, non intercompréhensibles, mais « un seul » chinois écrit commun à toutes les variétés dialectales. L’information compilée sous le code [zho] chinois ne permet pas d’affecter la traduction à l’une ou l’autre des variétés. Nous aurions pu choisir d’affecter les valeurs au prorata du nombre de locuteurs de celles-ci. Nous avons fait l’hypothèse que la grande majorité des traductions venaient du chinois mandarin et donc affecté toutes les données du chinois [zho] au chinois mandarin [cmn]. Certains lecteurs mieux informés pourront être en désaccord avec notre choix, il fallait en faire un et nous assumons celui-ci.

Le cas du tchèque [ces] et du slovaque [slk] est encore différent. L’Index translationum ne reporte pas de langue commune antérieure à la séparation des deux pays. Nous respectons ici les affectations de l’index. Nous aurions pu rechercher les traductions antérieures à la séparation des deux pays et les affecter à chacune des deux langues au prorata des traductions postérieures à la séparation. Nous avons ici choisi de respecter le choix de l’index, il n’existait pas de langue tchécoslovaque, mais bien un tchèque et un slovaque.

Ces considérations s’appliquent au cas des langues sources que des langues cibles.

1anglais1 032 456
2français189 064
3allemand172 940
4russe94 714
5italien56 368
6espagnol43 883
7suédois31 358
8danois16 694
9néerlandais16 350
10japonais15 145
11tchèque14 778
12polonais12 408
13hongrois10 565
14arabe10 087
15portugais9 752
16hébreu8 258
17mandarin7 658
18finnois6 704
19catalan6 628
20roumain5 061
21serbe5 059
22croate4 484
23grec3 964
24slovaque3 747
25bulgare3 504
26ukrainien2 716
27coréen2 385
28farsi2 382
29bengali2 044
30turc2 002
31hindi1 399
32albanais1 319
33belarus1 318
34arménien1 042
35ourdou959
36kazakh926
37ouzbèque du nord856
38vietnamien544
39azéri du sud504
40tamoul462
41tatar445
42turkmène429
43marathi394
44pandjabi de l'est341
45kannada308
46malayalam307
47indonésien295
48télougou273
49gujarati267
50azéri du nord248
51oriya240
52mongol217
53thai191
54soundanais191
55malais186
56kurde108
57assamais90
58filipino64
59ouighour60
60amharique53
61birman52
62sotho du sud50
63sinhala50
64sindhi45
65khmer central43
66népalais41
67quechua34
68malgache29
69pashtoun du nord27
70kashmiri27
71rajasthani27
72pashtoun central22
73somali21
74allemand suisse20
75javanais20
76kikuyu16
77yoruba15
78zoulou15
79maithili15
80napolitain14
81créole haitien11
82haoussa10
83igbo8
84seraiki7
85flamand6
86hmong6
87peul5
88mooré4
89shona4
90ilocano3
91cebuano3
92kinyarwanda3
93kikongo2
94hiligaynon2
95oromo2
96akan2
97santali2
98konkani2
99lombard1
100vénitien1
101luba-kasai1
102xhosa1
103bhojpuri1
104awadhi1
105min nan0
106dari0
107baloutch0
108nyanja0
109cantonais0
110hakka0
111tigrinia0
112min dong0
113wu0
114sukuma0
115zhuang0
116panjabi de l'ouest0
117jinyu0
118xiang0
119gan0
120min bei0
121thai du nord-est0
122thai du nord0
123madurais0
124minangbakau0
125sylheti0
126rangpuri0
127marwari0
128chhattisgarhi0
129haryanvi0
130magahi0
131deccan0
132kanauji0
133bagheli0
134varhadi-nagpuri0
135lambadi0
136mewati0
137chittagonien0

Lorsque l’on s’interroge sur l’importance relative des langues, le critère du nombre de locuteurs est toujours le premier à apparaître : quelle est la langue la plus parlée au monde ? Combien de gens parlent cette langue ? etc. Mais cette approche pose un double problème.

D'une part, le décompte des locuteurs n’est pas une science exacte et les différentes sources disponibles donnent des chiffres différents et ne parviennent pas toujours aux mêmes classements.

Par ailleurs, d’autres facteurs jouent un rôle dans la détermination du « poids » des langues. Ce baromètre repose sur dix facteurs pour le moment et il est amené à évoluer par l’incorporation de nouveaux facteurs

Union latine

Fondée en 1954, l’Union latine est une organisation internationale regroupant 37 États membres qui œuvre pour la diversité culturelle et le multilinguisme.

DTIL

Direction terminologie et industries de la langue

Tél. (33 1) 45 49 60 62

portalingua@unilat.org

Mentions légales

Lettre d'information

Inscrivez-vous pour être tenu informé de nos activités :

avec le soutien du ministère de la Culture et de la Communication (Délégation générale à la langue française et aux langues de France - DGLFLF).