リアルタイム音声処理

提供:ペチラボ書庫
2024年5月11日 (土) 16:06時点におけるPtt (トーク | 投稿記録)による版 (ページの作成:「タイトルの通り、リアルタイムで音声処理を行うことを考える。 現在より後の時刻の信号は利用できないこと、低遅延で処理を行う必要があることといった制約がある。 == 何に使えるの? == * ボイスチェンジャー(リアルタイム声質変換) * 音声対話システム(リアルタイム音声認識/音声合成) * 音に反応するジェネラティブアート == RTF(Real T…」)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
ナビゲーションに移動 検索に移動

タイトルの通り、リアルタイムで音声処理を行うことを考える。

現在より後の時刻の信号は利用できないこと、低遅延で処理を行う必要があることといった制約がある。

何に使えるの?

  • ボイスチェンジャー(リアルタイム声質変換)
  • 音声対話システム(リアルタイム音声認識/音声合成)
  • 音に反応するジェネラティブアート

RTF(Real Time Factor)

音声の長さに対する処理時間の割合。

RTFが1以下であれば途切れずに処理できるといえるため、リアルタイム性の評価指標として用いられる。

ただし、これは遅延がないことを意味しない。(常に一定時間の信号を溜めてから遅れて処理する場合でも、処理対象の音声の長さに対して処理時間が短ければリアルタイムと言われる)