Procsamto Dgtal d Sñals d Voz Trasparcas: Procsamto d Sñals y Métodos d Aálss para rcoocmto d Voz Autor: Dr. Jua Carlos Gómz Basado : Rabr, L. ad Juag, B-H.. Fudamtals of Spch Rcogto, Prtc Hall,.J., 993. Itroduccó Como ya vmos, los Sstmas d Rcoocmto d Voz comprd dfrts dscplas : Rcoocmto d patros Estadístcos Toría d las Comucacos Procsamto d Sñals Matmátca Combatora Lgüístca El domador comú d todo sstma d rcoocmto d voz s la tapa cal (frot-d) d procsamto d sñals, qu covrt la sñal d voz algua rprstacó paramétrca para su postror aálss y procsamto. 2
Exst ua ampla gama d posbldads para la rprstacó paramétrca d sñals: Ergía tmpo corto (short-tm rgy) Tasa d cruc por cro (zro-crossg rat) Tasa d cruc por vl (lvl-crossg rat) Evolvt dl spctro tmpo corto (short-tm spctral vlop) Está últma forma d rprstacó s la más mportat por su dfuddo uso; y los métodos d aálss spctral so cosdrados como l úclo dl procsamto d sñals 3 Modlos d Aálss Espctral Rcordado l foqu d rcoocmto d patros y l acústco-foétco: Sñal d Voz Modlos o Tmplats Palabra rcoocda Mdcó d parámtros Comparacó d patros Lógca d Dcsó S rprsta los vtos acústcos rlvats d la sñal d voz a partr d alguos parámtros Mdcó d parámtros Dtctor Caractríst.. Dtctor Caractríst.. Q Lógca d Dcsó dl Combador Caract. Dccoaro Tsto Hpotss 4
U bu tdmto d la forma la cuál s utlza las téccas d procsamto d sñals para mplmtar la fas d cálculo d parámtros s fudamtal para tdr los dfrts foqus para l rcoocmto d voz. Las 2 téccas para l procsamto d sñals más comúmt usadas para rcoocmto d voz so: Modlo d Baco d Fltros Modlo LPC 5 Modlo d Baco d Fltros Sñal d Voz x() Fltro Pasabada.... Fltro Pasabada Q ω ω2 ω3.... jω X ( jω ) X ( Q ) ω Q ωi ωs ω3i ω3s ω 2 I ω2s ω QI 6 ω QS
Modlo LPC M Sñal d Voz x() Dvdr Frams Aálss Espctral LPC a Covrsó d Parámtros LPC c 7 s() Etapa Ical (Frot( Frot-Ed) ) d Procsamto dl Baco d Fltros Fltro PBd.... s () v () t () u () x () olaldad.... Fltro PBajo.... Rduccó Tasa d Mustro.... Comprsó d Ampltud.... Fltro PBd Q s Q () olaldad v Q () Fltro PBajo t Q () Rduccó Tasa d Mustro Comprsó d Ampltud u Q () x Q () s M ( ) s( ) h ( ) h ( ) s( ) Q 0 8
s () s pasa lugo por u rctfcador d oda complta (o d /2 oda). Esto dsdobla l spctro d la sñal pasabada a u spctro la bada d baja frcuca y otra la bada d alta frcuca, qu lugo s lma mdat u fltro pasabajos, obtédos u () qu rprsta ua stmacó d la rgía d la sñal d voz cada ua d la Q badas d frcuca. Supodo qu la salda d -ésmo fltro s ua sñal dl tpo sodal pura: s () α.s(ω.) El acho d bada dl fltro s lo sufctmt agosto para djar pasar u úco armóco. Así: v () s ().w() V (ω) S (ω) W(ω) 9 Formas d odas y spctros típcos para l aálss d ua sñal sodal pura 0
A psar d qu l aálss atror s strctamt corrcto para sñals sodals puras, s u modlo razoablmt váldo para sodos toals cuaspródcos smpr qu l fltro pasabada o dj pasar 2 o más armócos d la sñal. La aturalza d varacó l tmpo d las sñals d voz (cuas-prodcdad) hac qu l spctro d la sñal ubcado la bada d baja frcuca o sa u mpulso puro, so qu la formacó st cotda ua bada. A cotuacó s mustra ua sccó d 20msg d voz toal procsada por u caal agosto ctrado 500Hz (y co ua F s 0KHz). Formas d odas y spctros d sñal d voz co modlo d aálss baco d fltros 500 Hz 2
jω V ( ) El spctro d la sñal rsultat mustra la dsada coctracó d rgía baja frcuca, así como pcos o dsados 000 Hz, 2000 Hz, tc. La fucó dl fltro Pasa Bajo s lmar sos pcos dsados. El acho d bada d la ( ) sñal v stá rlacoado co la vlocdad más rápda d movmto d los harmócos d la sñal y stá l ord d 20-30 Hz. Los últmos dos bloqus l modlo d baco d fltros so: u bloqu d rduccó d la tasa d mustro d las sñals fltradas co l fltro Pasa-Bajo, t ( ), qu so r-mustradas co ua frcuca dl ord d 40-60 Hz (para obtr ua rprstacó más coómca), y u bloqu d comprsó dl rago dámco d la sñal usado algú squma d comprsó como sr codfcacó logarítmca, o codfcacó co ly µ. 3 Ejmplo: Cosdrmos u baco d fltros co Q6 caals, para ua sñal d voz d bada acha co máxma frcuca d trés d 8 KHz. S asum ua frcuca d mustro d F s 20 KHz, para vtar alasg. La tasa d formacó d la sñal s procsar s mustras bts 20000 2 sg mustra Kbts 240 sg A la salda dl aalzador, s s usa ua frcuca d mustro d 50 Hz y ua comprsó d ampltud logarítmca d 7 bts, s t ua tasa d formacó d mustras bts 6 caals 50 7 sg. caal mustra bts 5600 sg lo qu rprsta ua rduccó d 40- d la tasa d bts. 4
Tpos d Bacos d Fltros A) Uform: Es l más comú, la frcuca ctral f dl -ésmo fltro pasabada s df como: FS f Q dod F S s la frcuca d mustro y s l úmro d fltros uformmt quspacados para cubrr l rago d frcucas d voz. El úmro d fltros Q satsfac la rlacó: Q / 2 El acho d bada b dl -ésmo fltro satsfac: FS b la codcó d gualdad s vrfca s o hay solapamto 5 Rspusta dal y ral d u baco d fltros co Q caals Rago d frcucas: F S / (Q + /2) F S / 6
B) o Uform: S dsña sgú algú crtro partcular d spacamto frcuca. U crtro comú s dstrbur las frcucas forma logarítmca. Así, para Q fltros pasabada, la frcuca ctral f y l acho d bada b dl -ésmo fltro s df como: b b f C α. b f + j b 2 ( b b ) dod C y f s df arbtraramt. Los valors d α usados más frcutmt so α2 qu dtrma u spacamto d ua octava y α4/3 qu dtrma u spacamto d /3 d octava. j + 2 Q j 7 Espcfcacos dals d bacos d fltros l rago tlfóco (200-3200 Hz) 4 caals octava f 300 Hz, C200 Hz 2 caals 3 octavas f 225 Hz C50 Hz 7 caals Escala crítca 8
La scala crítca stá basada studos d prcpcó dl oído humao. La scala s práctcamt lal hasta frcucas d aproxmadamt 000 Hz, y para frcucas suprors s logarítmca (s dcr l acho d bada d los fltros s xpocal fucó d la frcuca). Acho d Bada Crítco f 0 000 Hz 9 Implmtacó d los Bacos d Fltros Los métodos d dsño d fltros dgtals pud dvdrs 2 class sgú l tpo d rspusta al mpulso: ) Fltros IIR (o fltros rcursvos): La mplmtacó más fct s ralzar cada fltro pasabada dvdual mdat ua structura cascada o parallo. 2) Fltros FIR: La mplmtacó más smpl s la structura drcta, para la cuál s h () s la FIR dl - ésmo fltro co L mustras, la salda dl fltro s: L ( ) ( ) ( ) ( ) ( ) Q x s h h s 0 Esta cuacó s b s smpl rqur u alto vl d rqurmto d cálculos (mmora). 20
2) Fltros FIR: Ua altratva d mplmtacó mos costosa s da l caso qu cada rspusta al mpulso d los fltros pasabada pud rprstars como ua vtaa fja pasabajos, w(), modulada por jω, así: x L h ( ) w( ) dod S (ω) s la trasformada d Fourr a corto plazo (Short-Tm Fourr Trasform) d s() j ω j ω ( ) w( ) s( ) s( ) w( ) 0 j ω L 0 s L 0 j ω j ω ( ) w( ) S ( ω) j ω ( ) 2 Itrprtacó l domo frcucal d la Trasformada d Fourr a Corto Plazo La Trasformada d Fourr a Corto Plazo (STFT) d la sñal s() s df como: S Para u fjo 0 L ( ω) s( ) w( ) 0 L ( ) ( ) ( ) j ω S ω s w 0 0 0 obtmos la FT covcoal d la sñal trucada, s()w( 0 -), valuada la frcuca ωω. A cotuacó s mustra las sñals s(m) y w( 0 -m) para 0 50, 00 y 200 j ω 22
Dado qu w() s u fltro FIR, sdo L l úmro d mustras, podmos stablcr qu:. S L s grad, comparado co la prodcdad d la sñal (ptch), tocs S (ω) t bua rsolucó frcuca (podmos vsualzar ptchs armócos dvduals) pro sólo s v a grads rasgos la volvt dl spctro total la sccó d voz cubrta por la vtaa. 2. S L s chco, comparado co la prodcdad d la sñal, S (ω) t ua rsolucó frcuca pobr, pro prov ua bua stma d la volvt dl spctro total. 23 STFT (d 500 y 50 mustras) d ua Sñal Toal usado Vtaa d Hammg formats 24
STFT (d 500 y 50 mustras) d ua Sñal o Toal usado Vtaa d Hammg 25 Itrprtacó d Fltrado Lal d la Trasformada d Fourr a Corto Plazo La Trasformada d Fourr a Corto Plazo (STFT) para valors fjos d ω quda xprsada como: j ω S( ω ) s( ) w() sdo sta covolucó d tpo crcular. Así, podríamos trprtar la fórmula atror a partr dl sgut gráfco: s( ) ~ s( ) S ( ω ) X w() j ω ~ Como S ω S ω + ω S ω S ω + ω ( ) ( ) ( ) ( ) W ( ω). Para ua ω fja la STFT da ua rprstacó dl spctro d la sñal ua bada alrddor d ω. 26
27 Implmtacó co FFT dl Baco d Implmtacó co FFT dl Baco d Fltros Uform basado la STFT Fltros Uform basado la STFT Cosdrado u baco d fltros uformmt quspacados: Lugo: Dvddo la sumatora ua dobl sumatora d r y la cuál: y llamado: s (m)s(m).w(-m) Q F f S ( ) ( ) ( ) m m j j m w m s x 2π 2π + r r m 0 28 Obtédos tocs: Dod pud vrs qu x () s ua vrsó modulada d la DFT d la scuca u () ( ) ( ) ( ) ( ) + + + j j j r j r r j j u r s r s x π π π π π π 2 0 2 2 0 2 2 0 2 ) ( u ()
Así, los pasos báscos l cálculo dl baco d fltros uform a partr d la FFT so:. Obtr la sñal trucada s (m)s(m).w(-m) co m-l+,..., dod w() s causal y t FIR d L mustras 2. Formar u () Σ s ( r + ) co 0 -. Es dcr, spara la sñal s (m) porcos d mustras y sumar stas para obtr ua sñal d mustras 3. Calcular la DFT d putos d u () 4. Modular la DFT usado la scuca j 2π / Est paso pud vtars dsplazado forma crcular la scuca u () la catdad + mustras para obtr u ((-)), co 0 - ats d calcular la DFT 29 Pasos báscos l cálculo dl baco d fltros uform a partr d la FFT. Obtr la sñal trucada s (m)s(m).w(-m) 2. Sparar la sñal s (m) porcos d mustras y sumar stas para obtr ua sñal d mustras 3. Calcular la DFT d putos d u () 30
La catdad d cálculos para la mplmtacó dl baco d fltros s: C ~ 2 log FBFFT multplcacos y sumas S cosdramos a R como la tasa tr las catdads d cálculos para la mplmtacó drcta dl baco d fltros y la mplmtacó mdat FFT: CDFFIR L Q R CFBFFT 2 log Asumdo 32 (u baco d fltro d 6 caals) co L28 (s dcr ua FIR d 2,8 msg a ua tasa d mustro d 0KHz) y Q6 caals, tmos tocs: 28.6 R 6,4 2. 32. 5 La mplmtacó va FFT s 6,4 vcs más fct. 3 Implmtacó dl Baco d Fltros o uform co FIR E su forma más gral, u baco d fltros o uform cada fltro pasabada s mplmta vía covolucó drcta, dado qu o pud usars ua structura FFT. Para l caso qu cada fltro pasabada s dsña vía l método d vtaa, usado la msma vtaa pasabajos, podmos dmostrar qu la rspusta frcuca combada dl baco d fltros co Q caals, s dpdt dl úmro y la dstrbucó d los fltros dvduals. 32
Para dmostrar sto scrbmos la rspusta al mpulso dl -ésmo fltro pasabada como: ~ h ( ) w( ). h ( ) ~ dod h ( ) s la rspusta al mpulso dal dl fltro pasabada qu s stá dsñado. La rspusta frcuca pud tocs scrbrs como: H ( ) ( ) H ~ ω W ω ( ω) La rspusta frcuca total dl baco d fltros s tocs: Q Q H ω H ω W ω H ~ Q ω W ω H ~ ω ( ) ( ) ( ) ( ) ( ) ( ) La últma sumatora s la suma d rspustas frcucals dals, dod vmos qu s dpdt dl úmro y dstrbucó d los fltros dvduals y sta sumatora s l rago d frcucas dl baco d fltros. 33 Baco d Fltros o Uform basado FFT Ua forma d aprovchar la structura d la FFT para crar u baco d fltros o uforms s mdat la combacó d 2 o 3 caals uforms. Está técca quval a aplcar ua vtaa modfcada a la scuca ats d aplcarl la FFT. Para vr sto cosdrmos la DFT d putos d la scuca x() drvada d la sñal d voz s() mdat vtaado co w() X 0 x 2π j ( ) 0 S sumamos dos DFT d salda tmos: X + X + 0 0 x ( ) ( 2π j π + 2π j ( + ) j [ x( ) 2 cos( π / ) ] ) 2π j 34
La fórmula atror podría vrs como la salda d u caal quvalt dod la scuca x() stá podrada l tmpo por la scuca complja. π j 2 cos( π / ) S s comba 2 o más caals s pud obtr ua scuca dfrt qu podr a la sñal. Así combado caals FFT s pud obtr rápdamt fltros pasabada más achos. Está técca costtuy u método smpl y fctvo para ralzar crtos structuras d bacos d fltros o uforms. 35 Ejmplos Práctcos d Bacos d Fltros para Rcoocmto d Voz 36
Baco d Fltros uform d 5 caals El fltro básco pasabajos fu dsñado mdat la técca d vtaa usado ua d Kasr d 0 putos. E a) s v la IR dl fltro dal pasabajos multplcado por la vtaa d Kasr. E b) s v la IR d los fltros dvduals la bada d fltrado. E c) s v la rspusta frcuca total. 37 Baco d Fltros uform d 5 caals El fltro pasabajos fu dsñado mdat la técca d vtaa usado ua vtaa d Kasr como fltro pasabajos (fgura a) ) E b) y c) vmos la rspusta frcuca d los fltros dvduals (más agostos) y dl baco total. Claramt st baco o s acptabl para rcoocmto d voz. 38
Baco d Fltros o Uform d 4 caals El fltro d ua octava cubr l rago d 200 a 3200Hz y fu dsñado usado fltros d fas lal co FIR. Cada fltro dvdual t 0 mustras 39