[advanced] speech & audio signal processing

[Advanced] Speech & Audio Signal Processing ES 157/257: Speech and Audio Processing Prof. Patrick Wolfe, Harvard DEAS 02 February 2006

Upload: axelle

Post on 21-Jan-2016

108 views

Category:

Documents

7 download

Report

Download

Embed Size (px):

DESCRIPTION

[Advanced] Speech & Audio Signal Processing. ES 157/257: Speech and Audio Processing Prof. Patrick Wolfe, Harvard DEAS 02 February 2006. State of the Art in Speech/Audio. Speech and audio processing may be divided into “low-level” and “high-level” inference - PowerPoint PPT Presentation

TRANSCRIPT

[Advanced] Speech & Audio Signal Processing

ES 157/257: Speech and Audio ProcessingProf. Patrick Wolfe, Harvard DEAS

02 February 2006

Page 2: [Advanced] Speech & Audio Signal Processing

State of the Art in Speech/Audio

Speech and audio processing may be divided into “low-level” and “high-level” inference Speech enhancement, compression, and

coding are all widely used technologies This low-level work is the most mature

High-level tasks will drive future advances Speech/music database information retrieval Automatic speaker and speech recognition

But low-level issues also remain…

Page 3: [Advanced] Speech & Audio Signal Processing

Fundamental Questions

How to obtain highly structured representations of speech and audio signals? Time frequency “atoms”

as building blocks How can statistical inference

enable advances in speech signal processing? A means to obtain an

“atomic decomposition” Statistical modeling of time-

frequency coefficients provides a principled solution

Page 4: [Advanced] Speech & Audio Signal Processing

Representative Applications

Missing data in the context of VOIP: Original Missing Restored

Source / Speaker Separation Source 1 Source 2

Mixture 1 Mixture 2

Recovery 1 Recovery 2

Page 5: [Advanced] Speech & Audio Signal Processing

Digital Speech/Audio Processing

Page 6: [Advanced] Speech & Audio Signal Processing

Speech Production

Page 7: [Advanced] Speech & Audio Signal Processing

Time-Scale Modification

Page 8: [Advanced] Speech & Audio Signal Processing

Time-Scale Modification

Male & Female Speaker Original Fast Faster Slower

Trumpet Original Fast Slow

Speech and Quasi-Periodic Audio Sinewave-based Modification Voicing-dependent Rate Factor

Page 9: [Advanced] Speech & Audio Signal Processing

More Time-Scale Modification

Falling Can, Bongo Drums, Loon Original Slow

Complex Non-Speech Signals Phase-Vocoder-based Modification Event-Dependent Phase Coherence

Page 10: [Advanced] Speech & Audio Signal Processing

Pitch and Vocal Tract Change

Male & Female Speaker Original Low pitch/Long vocal

tract High pitch/Short vocal

tract

Male Speaker Original and Monotone

Sinewave-based Modification

Page 11: [Advanced] Speech & Audio Signal Processing

Speech Coding

Female Speaker Original CELP 8000 bps Sine 4800 bps Sine 2400 bps

Sinewave-based Code-Excited Linear Prediction

Male Speaker Original CELP 8000 bps Sine 4800 bps Sine 2400 bps

Page 12: [Advanced] Speech & Audio Signal Processing

Noise Reduction

Cell Phone Noise, Cocktail Party, Automobile Noise Original Enhanced

Adaptive Wiener Filter Adaptation Based on Spectral Change

Page 13: [Advanced] Speech & Audio Signal Processing

Compression

Low-noise case Original 1.5 dB Reduction 3.0 dB Reduction

Reduction of Peak-to-RMS amplitude ratio Based on Sinewave Analysis/Synthesis

High-noise case Original 1.5 dB Reduction 3.0 dB Reduction

Voice Activity Detection (VAD) Problem: Determine if voice is present in a particular audio signal. Issues: loud noise classified as speech and soft speech

Audio Signal Processing - IIT Bombay · Audio Signal Processing ... would be very useful in applications such as speech recognition in noise, au- ... synthesis of audio eﬁects and

SP2004F Lecture07-01 Digital Signal Processingberlin.csie.ntnu.edu.tw/PastCourses/2004-TCFST-Audio and... · 2004. 9. 4. · 2004 Speech - Berlin Chen 2 Analog Signal to Digital Signal

Experiment 3 MULTIMEDIA SIGNAL COMPRESSION: SPEECH AND …eeweb.poly.edu/~yao/EE3414/MML_exp3_speech_compression.pdf · 1 Experiment 3 MULTIMEDIA SIGNAL COMPRESSION: SPEECH AND AUDIO

Introduction to Speech Signals - Voice and Audio …spl.telhai.ac.il/speech/project_summary/project_book/... · Web viewIntroduction 7 3.1 Speech Signal Analysis 7 Voiced/Unvoiced/Silence

Digital signal processing IC for speech and audio applications · Digital signal processing IC for speech and audio applications Features • 24-bit, fixed point, 120 MIPS DSP core

Improved Speech Reconstruction from Silent Videopeleg/papers/arXiv1708... · speech audio signal of a silent video of a person speaking, and signiﬁcantly improve both intelligibility

Audio Signal Recognition for Speech, Music, and Environmental Soundsdpwe/talks/ASA-austin-2003-11.pdf · Music signal modeling • Use “machine listener” to navigate large music

Speech and Audio Processing Recognition and Audio Effects ... · Digital Signal Processing and System Theory| Recognition and Audio Effects | Beamforming Slide 2 Contents Beamforming

Speech & Audio Processing - Part–Idspuser/dasp/... · Digital Audio Signal Processing: Introduction Version 2013-2014 Lecture-1: Introduction p. 2 Speech & Audio Processing •

ELEC9344:Speech & Audio Processing Australiaeemedia.ee.unsw.edu.au/contents/elec9344/LectureNotes/Chapter 4.pdf · speech signal for digital storage or transmission ... • Hybrid

1 Speech and Audio Processing and Coding (cont.) Dr Wenwu Wang Centre for Vision Speech and Signal Processing Department of Electronic Engineering [email protected]

Digital Signal Processing:Digital Signal Processingfeihu.eng.ua.edu/NSF_TUES/w7_1.pdf · Digital Signal Processing:Digital Signal Processing: ... – Speech & Audio processing –

Speech & Audio Processing

Audio signal classification - TUT · Audio signal classification Klapuri ... – most important for general audio classification – basis for speech and speaker recognition. Classification

Audio Two types of audio signal - Speech signal as used in a variety of interpersonal applications including telephony and video telephony - Music-quality

1 Speech and Audio Processing and Recognition Dr Wenwu Wang Centre for Vision Speech and Signal Processing Department of Electronic Engineering Email:

Speech & Audio Processing - Part–II Digital Audio Signal Processing Marc Moonen Dept. E.E./ESAT-STADIUS, KU Leuven [email protected] homes.esat.kuleuven.be/~moonen

Digital Audio and Speech Processing Speech Processing

Information for Speech Recognition Joint Processing of ... Speech Recognition ... speech onset cues with audio-based speech energy Audio-Visual Speech synthesis ... speech recognition

1: Audio and Acoustic Signal Processing · ... Audio and Acoustic Signal Processing ... Speech Recognition 5.4.5*: Speech Synthesis ... Speech, and Audio 5.5.2*: Image and Video Applications

Speech Signal Processing

Applied research and services in the Advance Integrated ... · Acoustic signal enhancement - noise reduction - echo/feedback control - room equalization Audio signal analysis - speech

Digital Audio Signal Processing DASPhomes.esat.kuleuven.be/~dspuser/dasp/material/Slides_2017_2018... · 1 Speech & Audio Processing / Part-I Digital Audio Signal Processing DASP

Digital signal processing IC for speech and audio · PDF fileDigital signal processing IC for speech and audio applications ... Order code Package Packing ... 8 Package information

System on Chip Technology in Audio Applications - SPSC · System on Chip Technology in Audio Applications _____ Conducted at the Signal Processing and Speech Communications Laboratory

Audio Signal Processing Course Summaryzduan/teaching/ece472/lectures/Conclusions… · –Distortion, chorus, 3D audio, vocal removal •To make new sound –Keyboard, speech synthesis,

Design and Implementation of Noise Free Audio Speech Signal Using Fast Block Least Mean Square Algorithm

Speech Signal Analysis

ELEC9344: Speech and Audio Processingeemedia.ee.unsw.edu.au/contents/elec9344/LectureNotes/Chapter 8.pdf · ELEC9344: Speech and Audio Processing ... including Speech and Audio processing,

Systemics, Cybernetics and Informaticsweb.eecs.utk.edu/~bouldin/MUGSTUFF/HTML/ICSCI_2012_brochure.pdf · Systemics, Cybernetics and Informatics ... Speech / Audio Signal Processing,

Speech Recognition Frameworks Front End (Digital Signal Processing) – Resample to match the speech database sample rate – Break audio signal into overlapping

Speech & Audio Processing Speech & Audio Coding Examples

A Speech Classification System detection: the incoming audio signal is classified according to speech/non-speech. The result is a time labelling for each speech signal. Non-speech

Speech Signal Processing - Phil Garner · Speech Signal Processing Milos Cernak Introduction Speech synthesis signal processing Analysis Speech parameter generation Re-synthesis Synthesis