音の研究

提供:ペチラボ書庫
2024年5月2日 (木) 21:27時点におけるPtt (トーク | 投稿記録)による版
ナビゲーションに移動 検索に移動

音に関係する研究を概観する

graph LR subgraph legend target([対象]) task[タスク] end

graph LR subgraph 音声 Speech([音声]) Speaker([話者]) Text([テキスト]) Prosody([韻律]) Accent([アクセント]) Morpheme([形態素]) SpeakerRecognition[話者認識] Speech --> SpeakerRecognition --> Speaker Speech --> VC[声質変換] Speaker --> VC VC --> Speech Speech --> ASR[音声認識] --> Text Text --> MorphologicalAnalysis[形態素解析] --> Morpheme TTS[テキスト音声合成] Text --> TTS Morpheme --> TTS Prosody --> TTS Accent --> TTS TTS --> Speech end Sound([音]) Source([音源]) Noise([雑音]) Music([音楽]) Lyric([歌詞]) Score([楽譜]) Vocal([歌声]) Instrument([楽器音]) subgraph 音楽 Vocaloid[歌声合成] Score --> Vocaloid Lyric --> Vocaloid Vocaloid --> Vocal Music --> MusicTranscription[自動採譜] --> Score click Vocaloid href "https://wiki.ptt-lab.com/index.php?title=歌声合成" end Sound --> SourceSeparation[音源分離] --> Source Denoising[雑音除去] Sound --> Denoising Noise --> Denoising