第14回 音声(7月14日)


中間レポート2(昨日締め切り)について


授業評価アンケートのお願い

QRコード 


音声の特徴


 音声は言語情報を伝える役割があり、様々な言語がある。他の音とは異なるように捉えられがちであるが、音声も音であり、基本はこれまでの音の議論と同じである。音を特徴づけるものは、音の大きさ音の高さ音色であったが、音声でも同様に声の大きさ声の高さ音韻が音声を特徴づける。ただし、音声においては、その組み合わせが言語的な意味を持つ点が特徴的である。


音声器官


 音声を作り出すのは、主に、声帯声道である。声帯は左右に開閉する弁になっていて肺から吐き出された呼気によって周期的に振動する。ここが音源である。その後、この音源を音声に変えるのが口腔や鼻腔などの空洞部分であり声道と呼ばれる。空洞部分で共鳴した音が音声となって口や鼻から出される。口を上下したり舌を前後に動かすことで声道の形を変え、様々な音声を出すことができる。また、声道の長さは、音の高低に関わってくる(声道が長いと低い声が出る)ので、体の大きさと声の大きさはある程度相関がある。




エンベロープ(包絡線)


 音色を決定付けるのに、エンベロープが需要であったように音声においてもエンベロープは重要である。まずは、音声の波形を見てみよう。ここでは母音「アイウエオ」の波形を観察する。日本語での母音は正確に5つであるが、その他の言語では、それ以上あることが多く、数が定まっていないこともある。スペイン語は日本語と同様に母音は5つであるため、日本人はスペイン語は発音しやすい言語である。一方で、我々にとっても「アとオの間の音」や「イとエの間の音」なども発音することができる。それらの微妙な音も一緒に観察してみよう。

実験1 何人かの音声を録音して波形を観察しよう。

音声の波形は、人によってどのような差があるだろうか。何が同じであるから同じ音声だと認識されるのだろうか。


<録音>「ア・イ・ウ・エ・オ・イとエの間・アとオの間」


音と対数

 

 音律を作るときに学んだように、周波数は倍になるとオクターブ上の同じ音となる。例えば「ラ」のオクターブ違いで周波数を並べると、

55 Hz   110 Hz   220 Hz    440 Hz   880 Hz   1760 Hz 

となる。ここで周波数の感覚に注目してみると、440-220=220 Hzであるが、880-440=440 Hz のように一定ではない。周波数の差は一定でないのに、音としては同じ音に聞こえるのである。実は人間の感覚はこのようなことが多くあり、その場合、対数をとると差が一定に成る。例えば、

200 Hz 400 Hz 800 Hz 1600 Hz

という周波数があった場合その差は一定ではない。しかし、対数をとった場合、

 

 

 

 

となり、その差は一定( )となる。このように、音は対数をとることでその特徴をより明確にすることができる。よく使われる音の大きさの(デシ)ベルは、音圧の対数をとったものである。



ケプストラム分析


 音声は、声帯による振動と声道による共鳴の2つに分けることができる。音声の複雑な波をこの2つの情報に分けることをケプストラム分析という。ケプストラム分析では、フーリエ変換したパワースペクトルの対数をとって、さらにそのフーリエ変換を行うことで、低周波成分(声道情報)高周波数(声帯振動)に分けることができる。





ケプストラム分析の手順


① データからフーリエ変換をかけるデータを取得

② 窓関数をかける

③ 離散フーリエ変換を行う

④ パワースペクトル(絶対値)の対数をとる

⑤ 逆フーリエ変換を行う(横軸:周波数→時間)

⑥ 低周波数成分(横軸が小さい値の部分)と高周波数成分(それ以外)に分ける。

⑦ フーリエ変換を行う(横軸:時間→周波数)


フォルマント


 ケプストラム分析を行うと、声道情報(低周波数成分)には、ピークが見られる。このピークをフォルマントと呼び、1つ目のピークを第1フォルマント(F1)、2つ目のピークを第2フォルマント(F2)という。この2つのフォルマンドが主に音声を認識するポイントになる。つまり「ア・イ・ウ・エ・オ」のどの音声であるかはフォルマントの情報からある程度知ることができる。また、自分の声か他人の声かという情報も、フォルマントが大きく影響することがわかっている。

ピーク検出

FindPeaks[data, 3]

(3はガウスぼかしの半径) 



フォルマントと音声

 左図は、日本語の5つの母音のフォルマント周波数(単位はHz)の平均値(25人分)である(書籍「フーリエの冒険」より引用)。これらにどのような秩序が見られるだろうか。




課題1 フォルマントと音声の秩序の法則を探せ。(ヒント:対数)


最終レポート課題予告(pdfファイル部分)*来週レポート出題

音とは
フーリエ級数
フーリエ変換(または離散フーリエ変換または高速フーリエ変換) • 音階と数学
 音色
 音ファイルの圧縮(mp3など)
 音声