[Décryptages - Mot à mot]
Le linguiste américain George Kingsley Zipf (1902-1950) s’est penché sur la fréquence des mots dans la littérature.
En compilant de grands textes classiques, notamment Ulysse de Joyce, il a montré que la fréquence du nième mot le plus fréquent (rang n) est n fois plus faible que celle du mot le plus fréquent (rang 1).
Exemple : si le mot le plus fréquent présente une occurrence de 1000, le dixième mot le plus fréquent apparaît 100 fois.
Cette loi, à laquelle a été donné
le nom de Zipf, se révèle valable pour tous les textes et dans toutes les langues. A l’écrit comme à l’oral.
Zipf a également montré que la fréquence d’un mot est inversement proportionnelle à sa longueur.
Les conjonctions, prépositions, articles… sont plus fréquents que les verbes et les noms. Réciproquement, quand un mot savant long devient populaire et fréquent, on a tendance – pour qu’il tienne son rang – à l’abréger par apocope : auto, pour automobile, stylo pour stylographe, dactylo pour dactylographe, etc.