L’entropie est une fonction qui permet de quantifier le « désordre ». Elle a été utilisée à l’origine en thermodynamique, puis a trouvé des applications en théorie de l’information et plus récemment en linguistique. Nous l’utilisons ici pour différencier une langue parlée dans un seul pays d’une langue parlée dans plusieurs pays, pi sera donc la proportion des locuteurs d’une langue donnée vivant dans les pays concernés.
Classiquement l’expression mathématique de l’entropie est la suivante :
Entropie = -Σ(pi x Log(pi))
dans laquelle pi est la probabilité pour un système de se trouver dans un état donné et Log(pi) le logarithme naturel de cette probabilité, le symbole Σ indique que l’on fait la somme de tous les états pi possibles. Dans notre cas nous utilisons évidemment pi ainsi que défini plus haut. La valeur minimale de cette fonction est zéro et il n’existe pas de valeur maximale définie.
Considérons une langue parlée très majoritairement (98%) dans un pays et dont quelques locuteurs vivent dans un second, l’entropie sera :
(0,98 x Log0,98 +0,02 x Log0,02) = 0,098
Une langue dont les locuteurs sont répartis de manière égale sur trois pays aura une entropie de :
(0,33 x Log0,33 + 0,33 x Log0,33 + 0,34 x Log0,34) = 1,099
Voyons à présent quelques exemples réels, ceux du marathi, de l’amharique, de l’espagnol et de l’arabe :
L’entropie n’a donc rien à voir avec le nombre global de locuteurs d’une langue, mais bien avec la façon dont ces locuteurs sont répartis dans l’aire ou les aires dans lesquelles cette langue est parlée. Elle est calculée à partir des données de population décrites plus haut.
| 1 | espagnol | 2,52 |
| 2 | arabe | 2,3929 |
| 3 | arménien | 1,8408 |
| 4 | peul | 1,8407 |
| 5 | kurde | 1,577 |
| 6 | albanais | 1,276 |
| 7 | serbe | 1,2593 |
| 8 | turkmène | 1,252 |
| 9 | quechua | 1,2108 |
| 10 | min nan | 1,1912 |
| 11 | anglais | 1,184 |
| 12 | kazakh | 1,1746 |
| 13 | somali | 1,0737 |
| 14 | croate | 1,0344 |
| 15 | malais | 0,963 |
| 16 | kikongo | 0,9503 |
| 17 | coréen | 0,9412 |
| 18 | hongrois | 0,9171 |
| 19 | grec | 0,9021 |
| 20 | belarus | 0,892 |
| 21 | français | 0,8746 |
| 22 | russe | 0,8742 |
| 23 | allemand | 0,7704 |
| 24 | baloutch | 0,7614 |
| 25 | dari | 0,7587 |
| 26 | azéri du nord | 0,7548 |
| 27 | ukrainien | 0,738 |
| 28 | tatar | 0,7271 |
| 29 | sylheti | 0,7248 |
| 30 | tigrinia | 0,7225 |
| 31 | haoussa | 0,7194 |
| 32 | néerlandais | 0,7082 |
| 33 | bengali | 0,6957 |
| 34 | mongol | 0,691 |
| 35 | vénitien | 0,6906 |
| 36 | nyanja | 0,685 |
| 37 | ourdou | 0,6536 |
| 38 | rangpuri | 0,6365 |
| 39 | sotho du sud | 0,6226 |
| 40 | allemand suisse | 0,6133 |
| 41 | roumain | 0,5995 |
| 42 | italien | 0,591 |
| 43 | hakka | 0,5889 |
| 44 | bulgare | 0,5691 |
| 45 | népalais | 0,5685 |
| 46 | ouzbèque du nord | 0,5541 |
| 47 | turc | 0,5023 |
| 48 | azéri du sud | 0,4782 |
| 49 | hmong | 0,4772 |
| 50 | kinyarwanda | 0,4726 |
| 51 | farsi | 0,4707 |
| 52 | polonais | 0,4633 |
| 53 | créole haitien | 0,4261 |
| 54 | sindhi | 0,4161 |
| 55 | slovaque | 0,4135 |
| 56 | portugais | 0,4051 |
| 57 | hébreu | 0,3912 |
| 58 | tamoul | 0,3763 |
| 59 | khmer central | 0,3744 |
| 60 | cantonais | 0,3602 |
| 61 | finnois | 0,3446 |
| 62 | maithili | 0,2805 |
| 63 | filipino | 0,2483 |
| 64 | suédois | 0,233 |
| 65 | bhojpuri | 0,2312 |
| 66 | vietnamien | 0,2236 |
| 67 | pandjabi de l'est | 0,2192 |
| 68 | ouighour | 0,2181 |
| 69 | kashmiri | 0,1934 |
| 70 | zoulou | 0,1867 |
| 71 | min dong | 0,1735 |
| 72 | santali | 0,1733 |
| 73 | tchèque | 0,1667 |
| 74 | catalan | 0,1634 |
| 75 | panjabi de l'ouest | 0,1533 |
| 76 | danois | 0,1515 |
| 77 | gujarati | 0,1457 |
| 78 | lombard | 0,1456 |
| 79 | pashtoun du nord | 0,1262 |
| 80 | flamand | 0,1219 |
| 81 | yoruba | 0,1184 |
| 82 | rajasthani | 0,1182 |
| 83 | zhuang | 0,1112 |
| 84 | indonésien | 0,0969 |
| 85 | malayalam | 0,0911 |
| 86 | oromo | 0,0851 |
| 87 | awadhi | 0,0765 |
| 88 | hindi | 0,0702 |
| 89 | japonais | 0,0638 |
| 90 | ilocano | 0,0603 |
| 91 | marwari | 0,0597 |
| 92 | birman | 0,0578 |
| 93 | thai | 0,0526 |
| 94 | amharique | 0,0494 |
| 95 | mooré | 0,0482 |
| 96 | assamais | 0,0442 |
| 97 | mandarin | 0,0439 |
| 98 | shona | 0,0397 |
| 99 | sinhala | 0,0348 |
| 100 | xhosa | 0,0255 |
| 101 | javanais | 0,0246 |
| 102 | télougou | 0,0191 |
| 103 | thai du nord | 0,0117 |
| 104 | seraiki | 0,0109 |
| 105 | konkani | 0,0093 |
| 106 | marathi | 0,0082 |
| 107 | oriya | 0,0081 |
| 108 | kannada | 0,0067 |
| 109 | xiang | 0,0056 |
| 110 | malgache | 0,0051 |
| 111 | cebuano | 0,004 |
| 112 | min bei | 0,0034 |
| 113 | madurais | 0,0007 |
| 114 | wu | 0,0003 |
| 115 | napolitain | 0 |
| 116 | hiligaynon | 0 |
| 117 | sukuma | 0 |
| 118 | igbo | 0 |
| 119 | kikuyu | 0 |
| 120 | jinyu | 0 |
| 121 | gan | 0 |
| 122 | thai du nord-est | 0 |
| 123 | luba-kasai | 0 |
| 124 | pashtoun central | 0 |
| 125 | soundanais | 0 |
| 126 | minangbakau | 0 |
| 127 | akan | 0 |
| 128 | chhattisgarhi | 0 |
| 129 | haryanvi | 0 |
| 130 | magahi | 0 |
| 131 | deccan | 0 |
| 132 | kanauji | 0 |
| 133 | bagheli | 0 |
| 134 | varhadi-nagpuri | 0 |
| 135 | lambadi | 0 |
| 136 | mewati | 0 |
| 137 | chittagonien | 0 |
Lorsque l’on s’interroge sur l’importance relative des langues, le critère du nombre de locuteurs est toujours le premier à apparaître : quelle est la langue la plus parlée au monde ? Combien de gens parlent cette langue ? etc. Mais cette approche pose un double problème.
D'une part, le décompte des locuteurs n’est pas une science exacte et les différentes sources disponibles donnent des chiffres différents et ne parviennent pas toujours aux mêmes classements.
Par ailleurs, d’autres facteurs jouent un rôle dans la détermination du « poids » des langues. Ce baromètre repose sur dix facteurs pour le moment et il est amené à évoluer par l’incorporation de nouveaux facteurs…

Fondée en 1954, l’Union latine est une organisation internationale regroupant 37 États membres qui œuvre pour la diversité culturelle et le multilinguisme.
Inscrivez-vous pour être tenu informé de nos activités :
avec le soutien du ministère de la Culture et de la Communication (Délégation générale à la langue française et aux langues de France - DGLFLF).