Visual Speech Enhancement

Interspeech 2018

Supplementary video

The following video contains a few examples of enhanced speech using our model.

Demos

Dataset: Weekly addresses

Speaker: Obama

Noise: Trump's voice

[Noisy]

[Enhanced]

Dataset: Weekly addresses

Speaker: Obama

Noise: Obama's own voice

[Noisy]

[Enhanced]

Dataset: Weekly addresses

Speaker: Obama

Noise: Loud music

[Noisy]

[Enhanced]

Dataset: GRID

Speaker: S15 (female)

Noise: S4 (female)

[Noisy]

[Enhanced]

Dataset: GRID

Speaker: S2 (male)

Noise: S3 (male)

[Noisy]

[Enhanced]

Dataset: TCD-TIMIT

Speaker: lipspkr2 (female)

Noise: Multiple speakers

[Noisy]

[Enhanced]

Dataset: Mandarin

Speaker: Mandarin speaker

Noise: Multiple speakers and car engine

[Noisy]

[Hou et al.]

[Ours]

BibTeX

@inproceedings{gabbay2018visual,
  author    = {Aviv Gabbay and
	       Asaph Shamir and
	       Shmuel Peleg},
  title     = {Visual Speech Enhancement},
  booktitle = {Interspeech},
  pages     = {1170--1174},
  publisher = {{ISCA}},
  year      = {2018}
}

Visual Speech Enhancement

Abstract

Interspeech 2018

Supplementary video

Demos

BibTeX

Related papers