ep49 (ICASSP): Looking Enhances Listening: Recovering Missing Speech Using Images

Leading NLP Ninja - A podcast by jojonki

Categories:

ICASSP 2020より,ビジュアル情報を利用し,マスクされた音声信号を復元できるマルチモーダルASRを解説しました. 今回紹介した記事はこちらのissueで解説しています. https://github.com/jojonki/arXivNotes/issues/384 サポーターも募集中です. https://www.patreon.com/jojonki --- Support this podcast: https://podcasters.spotify.com/pod/show/lnlp-ninja/support