ジップの法則

余談ですが、

「n番目に多く現れる単語は、1番多く現れる単語のn分の1の確率で現れる」

ことが知られています。これは「ジップ(Zipf)の法則」というもので、1949年に発見されました。これはあらゆる言語について成立する経験則だそうです。

例えば、英語でよく出る単語は順に

THE OF AND TO ….

のようになりますが、ジップの法則によれば

THEの1/2の確率でOFが、また1/3の確率でANDが文章中に出てくる

ということが分かります。普段、無意識に言葉を話したり書いたりしているつもりでも、このようなきちんとした法則が成り立つのは、とても不思議ですね。

ちなみに、世の中には変わった人がいるもので、英語で最も多く現れるEを一つも使わないで書かれた小説が知られています。それは、アーネスト・ヴィンセント・ライトという人の書いた「Gadsby(ギャズビー)」という小説です。これがどれほどスゴイことかは、

THE   HE  SHE  WE  ME  ----ED(動詞の過去形)

などはすべて使えないことから容易に想像がつくでしょう。