フォルマントとは?
音声関連の記事でたまーに出てくるフォルマントという言葉。
Wikipediaによると、
フォルマントまたはホルマント(英: formant)とは、言葉を発している人の音声のスペクトルを観察すると分かる、時間的に移動している複数のピークのこと。
うーん、よくわかりませんね。笑
今回は、
- フォルマントとは何か
- どうやって観察するのか
- フォルマントが見られると何がうれしいのか
についてお話していきます。
今回はかなりオタクよりの内容となっていますので、お気をつけください。笑
予備知識:振幅・周波数・倍音とは
フォルマントの説明に入る前に、音の物理的な性質について説明しておきます。
そもそも音とは空気の振動で、波です。
波の中でも縦波(疎密波)です。
音源が振動することで、音源の近くにある空気の分子が押され、別の分子がその分子に押され、…という感じで、
下の動画の前半のように、振動がつたわっていきます。
ところで、波には振幅という、波の振動の幅の大きさを表す概念もあります。
音においてはこれが大きくなるほど、音は大きくなります。
そして、波には周期という、一定時間に何回振動するかを表す概念があり、
1秒間あたりの振動数は、100Hz、200Hz というように Hz(ヘルツ)という単位をつけて表されます。
これは音の分野においては周波数と呼ばれるものです。
周波数が高いほど、音は高くなります。
特定の音に対して、2倍、3倍、…の周波数を持つ音を2倍音、3倍音、…と呼びます。
このとき、基準となる音を基音と呼びます。
言ってしまえば、1倍音ですね。
それでは、ここからフォルマントの説明に入っていきます。
フォルマントとは
フォルマントとは、音のエネルギーが集中している周波数帯域のことです。
多くの音声は音叉のように単一の周波数のみから成り立っているわけではなく、複数の倍音の組み合わせでできています。
横軸に音の周波数(高さ)、縦軸に音の振幅(音量)をとってグラフを描くと、各倍音の位置では山ができます。
このすべての山に接する曲線(グラフの包絡線)の山の部分の周波数をフォルマントといい、
周波数の低いほうから第1フォルマント(F1)、第2フォルマント(F2)…といいます。
基本周波数を第0フォルマント(F0)として、2倍音から第1フォルマントを数え始める場合もあり、この記事ではそのように表記します。
とはいえ、「横軸に音の周波数、縦軸に音の振幅をとったグラフ」とか「山」とかって、
どんなものなのか想像がつきにくいですね…?
フォルマントの観察方法
スペクトラムアナライザというソフトを使えば、
今出ている音のどれぐらいの周波数成分がどれぐらいの強さで出ているのかを調べることができます。
スマホアプリも出ており、無料で入手できますよ。
ほら、山が見えました!
このすべての山に接する曲線(包絡線)の山の部分がフォルマントです。
包絡線は緑色の曲線のようになるので、
312Hz と書いてあるのが F0、2200Hz あたりが F1、2800Hz あたりが F2 です。
フォルマントは母音によっても変わります。
上の図は「あ」の音ですが、下の図は「い」の音です。
フォルマントや倍音の一般的な特徴として、
- 第〇フォルマントの、〇の数字が大きくなるほど、山(エネルギー)は小さくなる
- 倍音の山が多いと地声的に聞こえ、倍音の山が少ないと裏声的に聞こえる
- 声帯からの息漏れが多いと倍音の山が分散する
などがあります。
フォルマントが見られると何がうれしいの?
フォルマントは、母音や音色の差異の原因になります。
「か」と「さ」を区別できるのも、「あ」と「い」を区別できるのも、我々がフォルマントを聞き取っているからであり、
子どもと大人の声、女性と男性の声を聞き分けられるのもそのためです。
ということは、自分が出したい声のフォルマントを分析し、その波形に自分の声を近づけることで、同じような声を出すことができるわけですね。
(実際のところは、フォルマントは声道の形状という物理的な特徴とも関係するので、完璧にまねすることはできませんが。)
例えば、地声と裏声をスムーズに切り替えたいときに、スペクトラムアナライザを見ながら、
波形が急激に変化しないように気を付けながら発声する、みたいな使い方ができると思います。
耳で聞くだけだと主観的になってしまって、わかりづらいですからね。
ただし、生で聞こえる音と録音された機械から聞こえる音のフォルマントは異なってきますので、注意してください。
あ、普通に今出てる音の高さ(F0)をさくっと確認したいときにも使えます。笑
参考になれば幸いです。
では~