フィンランド語学習記 vol.47 − 文字の頻度分析
英語のアルファベットは26文字ありますが、その中にはよく使う文字とあまり使わない文字があります。
例えば母音[a, e, i, o, u]はよく使いますし、子音の[j, q, x, z]などはあまり使いません。
スクラブル(Scrabble)というゲームをやったことがある方は、きっとこのあたりの感覚がよくわかることと思います。
このようにある言語における文字の出現頻度を調べることを「頻度分析」と呼びます。
頻度分析(ひんどぶんせき)とは、文章や会話中における各々の文字の頻出傾向の度合を分析することである。頻度解析とも。各々の言語の特性を知る上でも重要な分析である。初歩的なサイファー・単一換字式暗号などの解読にも用いられる。
Wikipedia「頻度分析」より
英語の頻度分析には様々な調査がありますが、フィンランド語の場合はどうでしょうか?
『フィンランド語のしくみ』にフィンランド語でよく使われる文字の上位5位が紹介されていました。ここでは英語の調査例と並べて紹介してみます。
順位 | フィン | 英語 |
---|---|---|
1位 | a | e |
2位 | i | t |
3位 | t | a |
4位 | n | o |
5位 | e | i |
1位の[a]は、たしかによく使われている印象があります。フィンランド語では[aa]と並べる形も多いので、自然と頻度も上がってくるのかもしれません。
aalto(波)
aamu(朝)
2位の[i]は、フィンランド語に多い外来語の末尾に使われるため、頻度も上がるのでしょうか。
[参考][i]で終わる単語はどこから来るのか − フィンランド語と英語の場合 | Fragments
elefantti(象)
Japani(日本)
4位の[n]は、人名や形容詞に使われる[-nen]の[n]でしょうか。[-nen]の中には2つの[n]があるので頻度も上がりそうですね。
valkoinen(白い)
Virtanen(ヴィルタネン)*人名
初心者の感覚だと[ä]もずいぶんよく出てくる印象があるのですが、点々を打つのがめんどうだなあと思っているからそのように感じるだけで、実際にはそれほどではないのかもしれません。
なお前述の『フィンランド語のしくみ』によりますと、[q, w, x, z, å]の5文字はスウェーデン語や外国語の人名・地名以外では、普通使われることはないそうです。
英語の疑問詞に使われる[w]以外は、英語の傾向と似ていますね。
それでは、Näkemiin!(←2、4、5位が入っている)