●用語集 383 フォルマント 求めたスペクトル包絡に現れる種は数のピーク。フォルマント(Formant)とは、言葉を発してできる複数の周波数のピークのことをいいます。周波数の低いピークから「第1フォルマント」(F1)、「第2フォルマント」(F2)‥と呼ばれ、この「F1」... ●用語集
●用語集 382 メル周波数ケプストラム係数(MFCC) スペクトル包絡を求めるためのデファクトスタンダード。「音色」に関する特徴量となる。対数ケプストラムの低次成分は、音声のスペクトル包絡(声道成分に由来した周波数特性)を表現できていることがわかりました。この対数ケプストラムの低次成分に対して、... ●用語集
●用語集 380 高速フーリエ変換(FFT) Fast Fourie Transform:音声信号を周波数スペクトルに変換できる。FFT(Fast Fourier Transformation)高速フーリエ変換は、音響・振動測定分野において重要な解析手法です。FFTを使うことにより、あ... ●用語集
●用語集 379 パルス符号変調器(PCM) Pulse Code Modulation。音声をデジタルデータに変換する方法。連続的な音波を一定時間ごとに観測する標本化、観測された波の強さを予め決められた値に近似する量子化、量子化された値をビット列で表現する符号化の3つのステップを経て... ●用語集
●用語集 377 Attention 「時間の重み」をネットワークに組み込む。過去の各時刻での隠れ層の状態を保持しておき、それぞれの重みを求め、出力を計算する際に隠れ層の状態の重み付き和を利用することで、時間の重みを考慮したモデル。「出力から見た時の各入力の貢献度(重み)を表し... ●用語集
●用語集 376 BPTT BackPropagation Through Time:RNNは展開すると長いNNとみなすことができるので、通常通りbackpropagationが適用できるはず、というのが基本的な考え方である。誤差は最後の時刻であるTから最初の0に向か... ●用語集
●用語集 375 RNN Encoder-Decoder 入力も出力も時系列ならば、それぞれにRNNを対応させる。エンコーダが入力を処理して符号化し、符号化された入力入力情報を使ってデコーダが複合化する。RNN Encoder-Decoderとは、その名の通り、エンコーダとデコーダの2つのLSTM... ●用語集
●用語集 374 双方向 RNN Bidirectional RNN:RNNを2つ組み合わせることで、未来から過去方向も含めて学習できるモデル。RNN では、ある状態の中間層の出力値を次の状態に順伝播するネットワークである。これに対して、Bidirectional RNN ... ●用語集