ancienne version de Portalingua

Poids des langues

Entropie

L’entropie est une fonction qui permet de quantifier le « désordre ». Elle a été utilisée à l’origine en thermodynamique, puis a trouvé des applications en théorie de l’information et plus récemment en linguistique. Nous l’utilisons ici pour différencier une langue parlée dans un seul pays d’une langue parlée dans plusieurs pays, pi sera donc la proportion des locuteurs d’une langue donnée vivant dans les pays concernés.

Classiquement l’expression mathématique de l’entropie est la suivante :

Entropie = -Σ(pi x Log(pi))

dans laquelle pi est la probabilité pour un système de se trouver dans un état donné et Log(pi) le logarithme naturel de cette probabilité, le symbole Σ indique que l’on fait la somme de tous les états pi possibles. Dans notre cas nous utilisons évidemment pi ainsi que défini plus haut. La valeur minimale de cette fonction est zéro et il n’existe pas de valeur maximale définie.

Considérons une langue parlée très majoritairement (98%) dans un pays et dont quelques locuteurs vivent dans un second, l’entropie sera :

(0,98 x Log0,98 +0,02 x Log0,02) = 0,098

Une langue dont les locuteurs sont répartis de manière égale sur trois pays aura une entropie de :

(0,33 x Log0,33 + 0,33 x Log0,33 + 0,34 x Log0,34) = 1,099

Voyons à présent quelques exemples réels, ceux du marathi, de l’amharique, de l’espagnol et de l’arabe :

  • Marathi : 0,003
  • Amharique:0,019
  • Espagnol : 2,509
  • Arabe : 2,279

L’entropie n’a donc rien à voir avec le nombre global de locuteurs d’une langue, mais bien avec la façon dont ces locuteurs sont répartis dans l’aire ou les aires dans lesquelles cette langue est parlée. Elle est calculée à partir des données de population décrites plus haut.

1espagnol2,52
2arabe2,3929
3arménien1,8408
4peul1,8407
5kurde1,577
6albanais1,276
7serbe1,2593
8turkmène1,252
9quechua1,2108
10min nan1,1912
11anglais1,184
12kazakh1,1746
13somali1,0737
14croate1,0344
15malais0,963
16kikongo0,9503
17coréen0,9412
18hongrois0,9171
19grec0,9021
20belarus0,892
21français0,8746
22russe0,8742
23allemand0,7704
24baloutch0,7614
25dari0,7587
26azéri du nord0,7548
27ukrainien0,738
28tatar0,7271
29sylheti0,7248
30tigrinia0,7225
31haoussa0,7194
32néerlandais0,7082
33bengali0,6957
34mongol0,691
35vénitien0,6906
36nyanja0,685
37ourdou0,6536
38rangpuri0,6365
39sotho du sud0,6226
40allemand suisse0,6133
41roumain0,5995
42italien0,591
43hakka0,5889
44bulgare0,5691
45népalais0,5685
46ouzbèque du nord0,5541
47turc0,5023
48azéri du sud0,4782
49hmong0,4772
50kinyarwanda0,4726
51farsi0,4707
52polonais0,4633
53créole haitien0,4261
54sindhi0,4161
55slovaque0,4135
56portugais0,4051
57hébreu0,3912
58tamoul0,3763
59khmer central0,3744
60cantonais0,3602
61finnois0,3446
62maithili0,2805
63filipino0,2483
64suédois0,233
65bhojpuri0,2312
66vietnamien0,2236
67pandjabi de l'est0,2192
68ouighour0,2181
69kashmiri0,1934
70zoulou0,1867
71min dong0,1735
72santali0,1733
73tchèque0,1667
74catalan0,1634
75panjabi de l'ouest0,1533
76danois0,1515
77gujarati0,1457
78lombard0,1456
79pashtoun du nord0,1262
80flamand0,1219
81yoruba0,1184
82rajasthani0,1182
83zhuang0,1112
84indonésien0,0969
85malayalam0,0911
86oromo0,0851
87awadhi0,0765
88hindi0,0702
89japonais0,0638
90ilocano0,0603
91marwari0,0597
92birman0,0578
93thai0,0526
94amharique0,0494
95mooré0,0482
96assamais0,0442
97mandarin0,0439
98shona0,0397
99sinhala0,0348
100xhosa0,0255
101javanais0,0246
102télougou0,0191
103thai du nord0,0117
104seraiki0,0109
105konkani0,0093
106marathi0,0082
107oriya0,0081
108kannada0,0067
109xiang0,0056
110malgache0,0051
111cebuano0,004
112min bei0,0034
113madurais0,0007
114wu0,0003
115napolitain0
116hiligaynon0
117sukuma0
118igbo0
119kikuyu0
120jinyu0
121gan0
122thai du nord-est0
123luba-kasai0
124pashtoun central0
125soundanais0
126minangbakau0
127akan0
128chhattisgarhi0
129haryanvi0
130magahi0
131deccan0
132kanauji0
133bagheli0
134varhadi-nagpuri0
135lambadi0
136mewati0
137chittagonien0

Lorsque l’on s’interroge sur l’importance relative des langues, le critère du nombre de locuteurs est toujours le premier à apparaître : quelle est la langue la plus parlée au monde ? Combien de gens parlent cette langue ? etc. Mais cette approche pose un double problème.

D'une part, le décompte des locuteurs n’est pas une science exacte et les différentes sources disponibles donnent des chiffres différents et ne parviennent pas toujours aux mêmes classements.

Par ailleurs, d’autres facteurs jouent un rôle dans la détermination du « poids » des langues. Ce baromètre repose sur dix facteurs pour le moment et il est amené à évoluer par l’incorporation de nouveaux facteurs

Union latine

Fondée en 1954, l’Union latine est une organisation internationale regroupant 37 États membres qui œuvre pour la diversité culturelle et le multilinguisme.

DTIL

Direction terminologie et industries de la langue

Tél. (33 1) 45 49 60 62

portalingua@unilat.org

Mentions légales

Lettre d'information

Inscrivez-vous pour être tenu informé de nos activités :

avec le soutien du ministère de la Culture et de la Communication (Délégation générale à la langue française et aux langues de France - DGLFLF).