●用語集

●用語集

383 フォルマント

求めたスペクトル包絡に現れる種は数のピーク。フォルマント(Formant)とは、言葉を発してできる複数の周波数のピークのことをいいます。周波数の低いピークから「第1フォルマント」(F1)、「第2フォルマント」(F2)‥と呼ばれ、この「F1」...
●用語集

382 メル周波数ケプストラム係数(MFCC)

スペクトル包絡を求めるためのデファクトスタンダード。「音色」に関する特徴量となる。対数ケプストラムの低次成分は、音声のスペクトル包絡(声道成分に由来した周波数特性)を表現できていることがわかりました。この対数ケプストラムの低次成分に対して、...
●用語集

381 スペクトル包絡

音声スペクトル上の穏やかな変動。「音色」の違いに起因する。
●用語集

380 高速フーリエ変換(FFT)

Fast Fourie Transform:音声信号を周波数スペクトルに変換できる。FFT(Fast Fourier Transformation)高速フーリエ変換は、音響・振動測定分野において重要な解析手法です。FFTを使うことにより、あ...
●用語集

379 パルス符号変調器(PCM)

Pulse Code Modulation。音声をデジタルデータに変換する方法。連続的な音波を一定時間ごとに観測する標本化、観測された波の強さを予め決められた値に近似する量子化、量子化された値をビット列で表現する符号化の3つのステップを経て...
●用語集

378 A-D変換

音声はアナログデータでありコンピュータで扱うには離散的データに変換する必要がありこの変換処理のこと。
●用語集

377 Attention

「時間の重み」をネットワークに組み込む。過去の各時刻での隠れ層の状態を保持しておき、それぞれの重みを求め、出力を計算する際に隠れ層の状態の重み付き和を利用することで、時間の重みを考慮したモデル。「出力から見た時の各入力の貢献度(重み)を表し...
●用語集

376 BPTT

BackPropagation Through Time:RNNは展開すると長いNNとみなすことができるので、通常通りbackpropagationが適用できるはず、というのが基本的な考え方である。誤差は最後の時刻であるTから最初の0に向か...
●用語集

375 RNN Encoder-Decoder

入力も出力も時系列ならば、それぞれにRNNを対応させる。エンコーダが入力を処理して符号化し、符号化された入力入力情報を使ってデコーダが複合化する。RNN Encoder-Decoderとは、その名の通り、エンコーダとデコーダの2つのLSTM...
●用語集

374 双方向 RNN

Bidirectional RNN:RNNを2つ組み合わせることで、未来から過去方向も含めて学習できるモデル。RNN では、ある状態の中間層の出力値を次の状態に順伝播するネットワークである。これに対して、Bidirectional RNN ...