Procesamiento Digital de Señales de Voz



Documentos relacionados
Análisis Estadístico de Datos Climáticos

Un forward sobre commodities como el oro sufre una pequeña variación ya que se incluye la tasa de interés del oro (lease rate) con la variable l

4.1 Procedimientos de inferencia para la distribución exponencial

Fisicoquímica II-Módulo de Estructura y Propiedades Moleculares.

TEMA 2 MODELO DE REGRESIÓN LINEAL SIMPLE

ANEXO A. Bipuerto libre de. i 1. i 2 V 2 ruido. Figura A.1 Bipuerto libre de ruido con dos fuentes equivalentes de corriente de ruido, configuración π

Tomando como nivel de energía cero el nivel fundamental. Dada la diferencia de energía entre los niveles en la mayoría de los casos

CAPÍTULO 2. Ecuación paraxial de Helmholtz.

Automá ca. Capítulo4.RespuestadeRégimenTransitorio

EXAMEN DE TÉCNICAS CUANTITATIVAS III.

Análisis del caso promedio El plan:

SERIES NUMÉRICAS INFINITAS 6.2. SERIES DE TÉRMINOS POSITIVOS 6.3. SERIES ALTERNANTES 6.4. SERIES DE POTENCIAS

al siguiente límite si existe: . Se suele representar por ( x )

UNIDAD 9: INTRODUCCIÓN A LAS DERIVADAS

8 Límites de sucesiones y de funciones

Para que exista límite de una f(x) en un punto han de coincidir los límites laterales en dicho punto.

SEÑALES Y SISTEMAS. PROBLEMAS RESUELTOS. CAPITULO V PROBLEMA 1: Problema Nº 5.34 Oppenheim

Administración de inventarios. Ejercicio práctico.

Tema IV: Ruidos e Interferencias: Técnicas de reducción.

2. Utilizando el método adimensional basado en el factor de calidad Q, determine:

Tema 4: Regresiones lineales y no lineales TEMA 4. REGRESIONES LINEALES LINEALES Y NO Introducción 4. Nomenclatura

División 2. Mecánica de Tornillos Tornillos de transmisión Tornillo de ajuste y sujeción

CURSOS DE FORMACIÓN 2016

TEMA 3: ESTIMACIÓN PUNTUAL.

Capítulo 1 CAPÍTULO 1-INTRODUCCIÓN-

INFERENCIA ESTADISTICA

Multicupón no garantizado 07/09 1

Señales y Sistemas. Análisis de Fourier.

METODOLOGÍA DE CÁLCULO DE LAS TASAS DE INTERÉS PROMEDIO

ANÁLISIS DE LOS REGISTROS DE OBSERVACIÓN. 1. MOAL. I. ESCUELA GRANDE.

TEMA 5: LÍMITE DE FUNCIONES. CONTINUIDAD.ASÍNTOTAS

Análisis Espectral 1: Transformada Corta de Fourier y Ventanas

22.1. t, ms. Y la frecuencia mínima de muestreo será: f smín = 1/T máx = 1/0,1µs = 10MHz.

PRÁCTICA 9: PROPIEDADES DESEABLES DE LOS ESTIMADORES

EL AMPLIFICADOR OPERACIONAL

Capítulo 12. Introducción a la Termodinámica Estadística.

REPRESENTACION GRAFICA.

ANÁLISIS DE SISTEMAS ELECTRÓNICOS REALIMENTADOS

Sistemas y Circuitos

ANÁLISIS DEL AMPLIFICADOR EN EMISOR COMÚN

MÉTODOS ESTADÍSTICOS PARA EL CONTROL DE CALIDAD

Universidad de Costa Rica. Instituto Tecnológico de Costa Rica. Determinar si las integrales impropias convergen o divergen.

Cambio de la Frecuencia de Muestreo

Potencial periódico Término de corrección Término sin de segundo orden perturbación Término de corrección de primer orden

IN4703 Gestión de Operaciones I Auxiliar 6: Inventarios

Conceptos Básicos Previos

COMPLEJO TECNOLOGICO PARA LA GESTION AGROEMPRESARIAL SENA BAJO CAUCA CONTABILIDAD Y FINANZAS LA APARTADA Pág. 2 de 6

Aproximación de funciones derivables mediante polinomios: Fórmulas de Taylor y Mac-Laurin

Tema 3: Adaptadores de Señal

Problemas Resueltos. el radio de la órbita circular, y la energía tiene el valor GMm 2 = a GM. 0. Es decir, 2 T 4π. GMm

Intervalo para la media (caso general)

a a lim i) L< 1 absoluta convergencia absoluta convergencia convergencia condicional divergencia > r.

Teoría de Sistemas y Señales

NÚMEROS NATURALES Y NÚMEROS ENTEROS

ADSL. Haga clic para modificar el estilo de subtítulo del patrón

Gráfica 5.2 Acetato de cobalto 0.01M de 190 a 800nm con una absorbancia de y λ nm

CÁLCULO DE LÍMITES. Por otro lado es importante distinguir en el cálculo de límites, los casos indeterminados de los determinados: = ; = ; =

TEMA 6 DISTRIBUCIONES DE PROBABLIDAD DISCRETAS

El número de arriba de la fracción, el numerador, nos dice cuántas de las partes iguales están coloreadas.

1. Aplicación de la conmutación de circuitos y la conmutación de paquetes. 1.1 Sistema de señalización número 7 (SS7).

MICRÓFONOS. Conceptos básicos

CAPÍTULO 1. PROPAGACIÓN DE LAS ONDAS PLANAS UNIFORMES

MATEMÁTICAS Y CULTURA B O L E T Í N No. 273 COORDINACIÓN DE MATEMÁTICAS APLICACIONES DEL DETERMINANTE DE VANDERMONDE

Matemáticas 1 1 EJERCICIOS RESUELTOS: Números Complejos. Elena Álvarez Sáiz. Dpto. Matemática Aplicada y C. Computación. Universidad de Cantabria

. Cómo es la gráfica de z[n]?

Análisis de Señales Capítulo III: Transformada de Fourier discreta. Profesor: Néstor Becerra Yoma

VARIACIÓN DE IMPEDANCIAS CON LA FRECUENCIA EN CIRCUITOS DE CORRIENTE ALTERNA

Aplicaciones de la distribución weibull en ingeniería

Herramientas para juegos matemáticos en DEDOS

RADIO CRÍTICO DE AISLACIÓN

Procesamiento digital de voz

1. Hallar a qué velocidad hay que realizar un tiro parabólico para que llegue a una altura máxima de 100 m si el ángulo de tiro es de 30 o.

INTEGRAL INDEFINIDA. Derivación. Integración

INTRODUCCIÓN AL MONITOREO ATMOSFÉRICO 214

TEMA 1: CALCULO DIRECTO DE LÍMITES

Componentes del frontal de un receptor GPS

EAE120A Introducción a la Macroeconomía Inversión

CAPÍTULO 14: LAS EXPECTATIVAS: LOS INSTRUMENTOS BÁSICOS

CONCEPTOS PARA LA LIQUIDACIÓN DE INTERESES Y PAGOS PARA TARJETA DE CRÉDITO: CASO DE CUMPLIMIENTO

TEMA 11 OPERACIONES DE AMORTIZACION O PRESTAMO (II)

Teoría de Sistemas y Señales

MACROECONOMÍA II Licenciatura en Administración y Dirección de Empresas Marzo 2004

Controladores de Potencia Controlador DC DC

10 REGRESIÓN LINEAL SIMPLE

Tema 5. Contraste de hipótesis (II)

-n 1 (1 + i) C = R (35) i

ESCUELA POLITÉCNICA NACIONAL

Respuesta A.C. del FET 1/14

(tema 13 del libro) 1. PARÁMETROS DE CENTRALIZACIÓN

Reporte Nº: 05 Fecha: JULIO ANÁLISIS DE SITUACIÓN MIGRATORIA DE EXTRANJEROS DE NACIONALIDAD HAITIANA 1. DESCRIPCIÓN DEL REPORTE

Figura 1.12 Señalización analógica y digital de datos analógicos y digitales.

EVALUACIÓN DE COSTO ANUAL EQUIVALENTE (CAUE) ECONOMIA PARA INGENIEROS DENNICE OBREGÓN RENTERIA CÓDIGO:

UNIVERSIDAD DE PAMPLONA FACULTAD DE CIENCIAS BÁSICAS DEPARTAMENTO DE FÍSICA LABORATORIO DE MECÁNICA PÉNDULO BALÍSTICO

TRANSMISIÓN DIGITAL PRÁCTICA 1

Unidad Orientativa (Electrónica) Amplificadores Operacionales

D. REALIZACIÓN DE LA PRÁCTICA Y PRESENTACIÓN DE RESULTADOS

REGLA DE RUFFINI. FACTORIZACIÓN DE POLINOMIOS

Transcripción:

Procsamto Dgtal d Sñals d Voz Trasparcas: Procsamto d Sñals y Métodos d Aálss para rcoocmto d Voz Autor: Dr. Jua Carlos Gómz Basado : Rabr, L. ad Juag, B-H.. Fudamtals of Spch Rcogto, Prtc Hall,.J., 993. Itroduccó Como ya vmos, los Sstmas d Rcoocmto d Voz comprd dfrts dscplas : Rcoocmto d patros Estadístcos Toría d las Comucacos Procsamto d Sñals Matmátca Combatora Lgüístca El domador comú d todo sstma d rcoocmto d voz s la tapa cal (frot-d) d procsamto d sñals, qu covrt la sñal d voz algua rprstacó paramétrca para su postror aálss y procsamto. 2

Exst ua ampla gama d posbldads para la rprstacó paramétrca d sñals: Ergía tmpo corto (short-tm rgy) Tasa d cruc por cro (zro-crossg rat) Tasa d cruc por vl (lvl-crossg rat) Evolvt dl spctro tmpo corto (short-tm spctral vlop) Está últma forma d rprstacó s la más mportat por su dfuddo uso; y los métodos d aálss spctral so cosdrados como l úclo dl procsamto d sñals 3 Modlos d Aálss Espctral Rcordado l foqu d rcoocmto d patros y l acústco-foétco: Sñal d Voz Modlos o Tmplats Palabra rcoocda Mdcó d parámtros Comparacó d patros Lógca d Dcsó S rprsta los vtos acústcos rlvats d la sñal d voz a partr d alguos parámtros Mdcó d parámtros Dtctor Caractríst.. Dtctor Caractríst.. Q Lógca d Dcsó dl Combador Caract. Dccoaro Tsto Hpotss 4

U bu tdmto d la forma la cuál s utlza las téccas d procsamto d sñals para mplmtar la fas d cálculo d parámtros s fudamtal para tdr los dfrts foqus para l rcoocmto d voz. Las 2 téccas para l procsamto d sñals más comúmt usadas para rcoocmto d voz so: Modlo d Baco d Fltros Modlo LPC 5 Modlo d Baco d Fltros Sñal d Voz x() Fltro Pasabada.... Fltro Pasabada Q ω ω2 ω3.... jω X ( jω ) X ( Q ) ω Q ωi ωs ω3i ω3s ω 2 I ω2s ω QI 6 ω QS

Modlo LPC M Sñal d Voz x() Dvdr Frams Aálss Espctral LPC a Covrsó d Parámtros LPC c 7 s() Etapa Ical (Frot( Frot-Ed) ) d Procsamto dl Baco d Fltros Fltro PBd.... s () v () t () u () x () olaldad.... Fltro PBajo.... Rduccó Tasa d Mustro.... Comprsó d Ampltud.... Fltro PBd Q s Q () olaldad v Q () Fltro PBajo t Q () Rduccó Tasa d Mustro Comprsó d Ampltud u Q () x Q () s M ( ) s( ) h ( ) h ( ) s( ) Q 0 8

s () s pasa lugo por u rctfcador d oda complta (o d /2 oda). Esto dsdobla l spctro d la sñal pasabada a u spctro la bada d baja frcuca y otra la bada d alta frcuca, qu lugo s lma mdat u fltro pasabajos, obtédos u () qu rprsta ua stmacó d la rgía d la sñal d voz cada ua d la Q badas d frcuca. Supodo qu la salda d -ésmo fltro s ua sñal dl tpo sodal pura: s () α.s(ω.) El acho d bada dl fltro s lo sufctmt agosto para djar pasar u úco armóco. Así: v () s ().w() V (ω) S (ω) W(ω) 9 Formas d odas y spctros típcos para l aálss d ua sñal sodal pura 0

A psar d qu l aálss atror s strctamt corrcto para sñals sodals puras, s u modlo razoablmt váldo para sodos toals cuaspródcos smpr qu l fltro pasabada o dj pasar 2 o más armócos d la sñal. La aturalza d varacó l tmpo d las sñals d voz (cuas-prodcdad) hac qu l spctro d la sñal ubcado la bada d baja frcuca o sa u mpulso puro, so qu la formacó st cotda ua bada. A cotuacó s mustra ua sccó d 20msg d voz toal procsada por u caal agosto ctrado 500Hz (y co ua F s 0KHz). Formas d odas y spctros d sñal d voz co modlo d aálss baco d fltros 500 Hz 2

jω V ( ) El spctro d la sñal rsultat mustra la dsada coctracó d rgía baja frcuca, así como pcos o dsados 000 Hz, 2000 Hz, tc. La fucó dl fltro Pasa Bajo s lmar sos pcos dsados. El acho d bada d la ( ) sñal v stá rlacoado co la vlocdad más rápda d movmto d los harmócos d la sñal y stá l ord d 20-30 Hz. Los últmos dos bloqus l modlo d baco d fltros so: u bloqu d rduccó d la tasa d mustro d las sñals fltradas co l fltro Pasa-Bajo, t ( ), qu so r-mustradas co ua frcuca dl ord d 40-60 Hz (para obtr ua rprstacó más coómca), y u bloqu d comprsó dl rago dámco d la sñal usado algú squma d comprsó como sr codfcacó logarítmca, o codfcacó co ly µ. 3 Ejmplo: Cosdrmos u baco d fltros co Q6 caals, para ua sñal d voz d bada acha co máxma frcuca d trés d 8 KHz. S asum ua frcuca d mustro d F s 20 KHz, para vtar alasg. La tasa d formacó d la sñal s procsar s mustras bts 20000 2 sg mustra Kbts 240 sg A la salda dl aalzador, s s usa ua frcuca d mustro d 50 Hz y ua comprsó d ampltud logarítmca d 7 bts, s t ua tasa d formacó d mustras bts 6 caals 50 7 sg. caal mustra bts 5600 sg lo qu rprsta ua rduccó d 40- d la tasa d bts. 4

Tpos d Bacos d Fltros A) Uform: Es l más comú, la frcuca ctral f dl -ésmo fltro pasabada s df como: FS f Q dod F S s la frcuca d mustro y s l úmro d fltros uformmt quspacados para cubrr l rago d frcucas d voz. El úmro d fltros Q satsfac la rlacó: Q / 2 El acho d bada b dl -ésmo fltro satsfac: FS b la codcó d gualdad s vrfca s o hay solapamto 5 Rspusta dal y ral d u baco d fltros co Q caals Rago d frcucas: F S / (Q + /2) F S / 6

B) o Uform: S dsña sgú algú crtro partcular d spacamto frcuca. U crtro comú s dstrbur las frcucas forma logarítmca. Así, para Q fltros pasabada, la frcuca ctral f y l acho d bada b dl -ésmo fltro s df como: b b f C α. b f + j b 2 ( b b ) dod C y f s df arbtraramt. Los valors d α usados más frcutmt so α2 qu dtrma u spacamto d ua octava y α4/3 qu dtrma u spacamto d /3 d octava. j + 2 Q j 7 Espcfcacos dals d bacos d fltros l rago tlfóco (200-3200 Hz) 4 caals octava f 300 Hz, C200 Hz 2 caals 3 octavas f 225 Hz C50 Hz 7 caals Escala crítca 8

La scala crítca stá basada studos d prcpcó dl oído humao. La scala s práctcamt lal hasta frcucas d aproxmadamt 000 Hz, y para frcucas suprors s logarítmca (s dcr l acho d bada d los fltros s xpocal fucó d la frcuca). Acho d Bada Crítco f 0 000 Hz 9 Implmtacó d los Bacos d Fltros Los métodos d dsño d fltros dgtals pud dvdrs 2 class sgú l tpo d rspusta al mpulso: ) Fltros IIR (o fltros rcursvos): La mplmtacó más fct s ralzar cada fltro pasabada dvdual mdat ua structura cascada o parallo. 2) Fltros FIR: La mplmtacó más smpl s la structura drcta, para la cuál s h () s la FIR dl - ésmo fltro co L mustras, la salda dl fltro s: L ( ) ( ) ( ) ( ) ( ) Q x s h h s 0 Esta cuacó s b s smpl rqur u alto vl d rqurmto d cálculos (mmora). 20

2) Fltros FIR: Ua altratva d mplmtacó mos costosa s da l caso qu cada rspusta al mpulso d los fltros pasabada pud rprstars como ua vtaa fja pasabajos, w(), modulada por jω, así: x L h ( ) w( ) dod S (ω) s la trasformada d Fourr a corto plazo (Short-Tm Fourr Trasform) d s() j ω j ω ( ) w( ) s( ) s( ) w( ) 0 j ω L 0 s L 0 j ω j ω ( ) w( ) S ( ω) j ω ( ) 2 Itrprtacó l domo frcucal d la Trasformada d Fourr a Corto Plazo La Trasformada d Fourr a Corto Plazo (STFT) d la sñal s() s df como: S Para u fjo 0 L ( ω) s( ) w( ) 0 L ( ) ( ) ( ) j ω S ω s w 0 0 0 obtmos la FT covcoal d la sñal trucada, s()w( 0 -), valuada la frcuca ωω. A cotuacó s mustra las sñals s(m) y w( 0 -m) para 0 50, 00 y 200 j ω 22

Dado qu w() s u fltro FIR, sdo L l úmro d mustras, podmos stablcr qu:. S L s grad, comparado co la prodcdad d la sñal (ptch), tocs S (ω) t bua rsolucó frcuca (podmos vsualzar ptchs armócos dvduals) pro sólo s v a grads rasgos la volvt dl spctro total la sccó d voz cubrta por la vtaa. 2. S L s chco, comparado co la prodcdad d la sñal, S (ω) t ua rsolucó frcuca pobr, pro prov ua bua stma d la volvt dl spctro total. 23 STFT (d 500 y 50 mustras) d ua Sñal Toal usado Vtaa d Hammg formats 24

STFT (d 500 y 50 mustras) d ua Sñal o Toal usado Vtaa d Hammg 25 Itrprtacó d Fltrado Lal d la Trasformada d Fourr a Corto Plazo La Trasformada d Fourr a Corto Plazo (STFT) para valors fjos d ω quda xprsada como: j ω S( ω ) s( ) w() sdo sta covolucó d tpo crcular. Así, podríamos trprtar la fórmula atror a partr dl sgut gráfco: s( ) ~ s( ) S ( ω ) X w() j ω ~ Como S ω S ω + ω S ω S ω + ω ( ) ( ) ( ) ( ) W ( ω). Para ua ω fja la STFT da ua rprstacó dl spctro d la sñal ua bada alrddor d ω. 26

27 Implmtacó co FFT dl Baco d Implmtacó co FFT dl Baco d Fltros Uform basado la STFT Fltros Uform basado la STFT Cosdrado u baco d fltros uformmt quspacados: Lugo: Dvddo la sumatora ua dobl sumatora d r y la cuál: y llamado: s (m)s(m).w(-m) Q F f S ( ) ( ) ( ) m m j j m w m s x 2π 2π + r r m 0 28 Obtédos tocs: Dod pud vrs qu x () s ua vrsó modulada d la DFT d la scuca u () ( ) ( ) ( ) ( ) + + + j j j r j r r j j u r s r s x π π π π π π 2 0 2 2 0 2 2 0 2 ) ( u ()

Así, los pasos báscos l cálculo dl baco d fltros uform a partr d la FFT so:. Obtr la sñal trucada s (m)s(m).w(-m) co m-l+,..., dod w() s causal y t FIR d L mustras 2. Formar u () Σ s ( r + ) co 0 -. Es dcr, spara la sñal s (m) porcos d mustras y sumar stas para obtr ua sñal d mustras 3. Calcular la DFT d putos d u () 4. Modular la DFT usado la scuca j 2π / Est paso pud vtars dsplazado forma crcular la scuca u () la catdad + mustras para obtr u ((-)), co 0 - ats d calcular la DFT 29 Pasos báscos l cálculo dl baco d fltros uform a partr d la FFT. Obtr la sñal trucada s (m)s(m).w(-m) 2. Sparar la sñal s (m) porcos d mustras y sumar stas para obtr ua sñal d mustras 3. Calcular la DFT d putos d u () 30

La catdad d cálculos para la mplmtacó dl baco d fltros s: C ~ 2 log FBFFT multplcacos y sumas S cosdramos a R como la tasa tr las catdads d cálculos para la mplmtacó drcta dl baco d fltros y la mplmtacó mdat FFT: CDFFIR L Q R CFBFFT 2 log Asumdo 32 (u baco d fltro d 6 caals) co L28 (s dcr ua FIR d 2,8 msg a ua tasa d mustro d 0KHz) y Q6 caals, tmos tocs: 28.6 R 6,4 2. 32. 5 La mplmtacó va FFT s 6,4 vcs más fct. 3 Implmtacó dl Baco d Fltros o uform co FIR E su forma más gral, u baco d fltros o uform cada fltro pasabada s mplmta vía covolucó drcta, dado qu o pud usars ua structura FFT. Para l caso qu cada fltro pasabada s dsña vía l método d vtaa, usado la msma vtaa pasabajos, podmos dmostrar qu la rspusta frcuca combada dl baco d fltros co Q caals, s dpdt dl úmro y la dstrbucó d los fltros dvduals. 32

Para dmostrar sto scrbmos la rspusta al mpulso dl -ésmo fltro pasabada como: ~ h ( ) w( ). h ( ) ~ dod h ( ) s la rspusta al mpulso dal dl fltro pasabada qu s stá dsñado. La rspusta frcuca pud tocs scrbrs como: H ( ) ( ) H ~ ω W ω ( ω) La rspusta frcuca total dl baco d fltros s tocs: Q Q H ω H ω W ω H ~ Q ω W ω H ~ ω ( ) ( ) ( ) ( ) ( ) ( ) La últma sumatora s la suma d rspustas frcucals dals, dod vmos qu s dpdt dl úmro y dstrbucó d los fltros dvduals y sta sumatora s l rago d frcucas dl baco d fltros. 33 Baco d Fltros o Uform basado FFT Ua forma d aprovchar la structura d la FFT para crar u baco d fltros o uforms s mdat la combacó d 2 o 3 caals uforms. Está técca quval a aplcar ua vtaa modfcada a la scuca ats d aplcarl la FFT. Para vr sto cosdrmos la DFT d putos d la scuca x() drvada d la sñal d voz s() mdat vtaado co w() X 0 x 2π j ( ) 0 S sumamos dos DFT d salda tmos: X + X + 0 0 x ( ) ( 2π j π + 2π j ( + ) j [ x( ) 2 cos( π / ) ] ) 2π j 34

La fórmula atror podría vrs como la salda d u caal quvalt dod la scuca x() stá podrada l tmpo por la scuca complja. π j 2 cos( π / ) S s comba 2 o más caals s pud obtr ua scuca dfrt qu podr a la sñal. Así combado caals FFT s pud obtr rápdamt fltros pasabada más achos. Está técca costtuy u método smpl y fctvo para ralzar crtos structuras d bacos d fltros o uforms. 35 Ejmplos Práctcos d Bacos d Fltros para Rcoocmto d Voz 36

Baco d Fltros uform d 5 caals El fltro básco pasabajos fu dsñado mdat la técca d vtaa usado ua d Kasr d 0 putos. E a) s v la IR dl fltro dal pasabajos multplcado por la vtaa d Kasr. E b) s v la IR d los fltros dvduals la bada d fltrado. E c) s v la rspusta frcuca total. 37 Baco d Fltros uform d 5 caals El fltro pasabajos fu dsñado mdat la técca d vtaa usado ua vtaa d Kasr como fltro pasabajos (fgura a) ) E b) y c) vmos la rspusta frcuca d los fltros dvduals (más agostos) y dl baco total. Claramt st baco o s acptabl para rcoocmto d voz. 38

Baco d Fltros o Uform d 4 caals El fltro d ua octava cubr l rago d 200 a 3200Hz y fu dsñado usado fltros d fas lal co FIR. Cada fltro dvdual t 0 mustras 39