by Nick Hubbard

長さの異なる符号を組み合わせて文字や数字を表すモールス信号は、最も使用頻度の高い文字が最も短いコードで表されるようにデザインされています。従って、使用頻度の低い文字ほど長さが長くなるはず、ということで、数学者のJohn D. Cookさんが文字の頻度と信号の長さから、モールス信号の効率性はどの程度のものなのか?ということについて問いかけています。

How efficiently does Morse code encode letters?

https://www.johndcook.com/blog/2017/02/08/how-efficient-is-morse-code/

アルファベットをモールス信号で表した時の信号の長さと頻度の関係は以下の通り。「Length(長さ)」の部分は「・」が1拍、「-」が3拍としてカウントされており、が確かに最も頻度の高い「E」の信号の長さが「1」となっており、最も短いことがわかります。以下の表で使用した文字の使用頻度はGoogleが行った研究を元にしているとのことです。



なお、モールス信号は総務省無線局運用規則によると「ツー(長符)はトン(短符)の3倍の長さ」「符号と符号の間は短符1個分の間隔を空ける」「文字と文字の間は、短符3個分の間隔を空ける」「語と語の間は、短符7個分の間隔を空ける」という規則で運用されているとのことですが、Cookさんが調べたところでは長府と短符の間の間隔はカウントしないという資料とカウントするという資料があり、Cookさんはカウントしないものとして記しています。

こうして各語を確認してみると、Eが最も短い信号に設定されているというのは妥当ですが、「O」は使用頻度が高いにも関わらず、信号が長いことがわかります。これは明らかに改良の余地があるとのこと。

コードの長さに頻度をかけたところ、平均の値は4万5268になります。しかし、Cookさんによると、コードを並び替えることによって値を4万1257にまで下げることができるとのこと。つまり、長さを基準にするとモールス信号の効率は少なくともあと9%は上げることが可能になります。

Cookさんによると、モールス信号のコードと頻度の関係は、以下の表の下に行けば行くほど小さくなるとのこと。これは使用頻度が少ないために長さを考慮する必要があまりなかったためかと思われますが、一方で使用頻度が高いものについても長さとの関係に不可解な点があるものも。これはコードが作られた過程において効率以外の要素が影響したものではないかとCookさんは見ています。



by wittco.gmbh

なお、Cookさんの疑問に関しては、記事のコメント欄でその答えの一部が書かれています。元海軍軍人などの書き込みよると、「実際には日常会話の内容がそのままモールス信号で使用されるのではなく、CQといった略符号のほか、暗号化された内容がモールス信号として表されるので、日常における文字の使用頻度がそのままモールス信号の文字の使用頻度になるわけではない」「アメリカのモールス信号と国際基準のモールス信号は少し違うので、その点を考慮する必要がある」とのことです。