1.1 Autokorelacijska metoda

Jedan od pristupa za određivanje granica sumacije pogreške predikcije (engl. short time average prediction error) polazi od pretpostavke da je segment signala sn(m) jednak nuli izvan intervala £ m £ N‑1. To se na prikladan način može zapisati kao

(9.41)

gdje je w(m) vremenski otvor konačne dužine (npr. Hammingov vremenski otvor) jednak nuli izvan intervala £ m £ N‑1.

Slika

9.41

Signal beskonačnog trajanja

Slika

9.42

Signal beskonačnog trajanja s pomakom

Slika

9.43

Pravokutni vremenski otvor dužine N uzoraka

Slika

9.44

Segment signala izdvojen pomoću vremenskog otvora

Slikama 9.4‑1 do 9.4‑4 ilustrirano je izdvajanje segmenta signala, pri čemu je radi jednostavnosti korišten pravokutni vremenski otvor. Budući da sn(m) različit od nule samo na intervalu £ m £ N‑1, odgovarajuća pogreška predikcije en(m) (engl. prediction error) za prediktor p-tog reda biti će različita od nule samo na intervalu £ m £ N‑1+p (... vidi izraz (9.3‑5)). Srednja kvadratna pogreška predikcije En se dakle u ovom slučaju može odrediti izrazom (9.4‑2).

(9.42)

Alternativno se može reći da treba sumirati sve vrijednosti različite od nule na intervalu od  do .

Pogreška predikcije je u pravilu velikog iznosa na početku intervala (preciznije, za £ m £ p‑1 ), zato što se pokušava provesti predikcija signala na temelju uzoraka koji su na silu postavljeni na nulu. Pogreška predikcije također je velika na kraju intervala (preciznije, za £ m £ N+p‑1), jer se pokušava provesti predikcija uzoraka jednakih nuli na temelju uzoraka koji su različiti od nule. Jedan od načina kojim je moguće riješiti ovaj problem je primjena vremenskog otvora w(m) koji prigušuje signal prema rubovima segmenta sn(m), kao što je npr. Hamming-ov vremenski otvor.

Granice sumacije u izrazu (9.4‑2) za srednju kvadratnu predikcijsku pogrešku su identične su onima u izrazu (9.4‑3) za fn(i,k) koji definira elemente matrice i slobodnog stupca linearnog sustava jednadžbi iz prošlog poglavlja.

,      za £ i £ p,  £ k £ p.

(9.43)

Ovaj izraz je moguće modificirati tako da se provede supstitucija varijable m sa m* prema izrazu: , čime se dobiva:

(9.44)

Budući da je sn(m*) jednak nuli izvan intervala £ m* £ N‑1, jednostavno se može pokazati da se granice sumacije u izrazu (9.4‑4) sužuju s obzirom da vrijedi:

Ø      za donju granicu ;

Ø      analogno za gornju .

Na osnovu toga novi raspon indeksa je : , odnosno :

(9.45)

Nadalje, može se uočiti da je oblik izraza (9.4‑5) za fn(i,k) identičan vremenski kratkotrajnoj autokorelacijskoj funkciji (engl. short-time autocorrelation function) izračunatoj za pomak (i-k), tj. vrijedi:

 ,

(9.46)

pri čemu je:

.

(9.47)

S obzirom da je Rn(j) parna funkcija po pomaku j, vrijedi izraz (9.4‑8),

(9.48)

Zamjenom izraza  s autokorelacijskom funkcijom Rn(|i-k|) prema izrazu (9.4‑8), linearni sustav jednadžbi koje definiraju optimalni prediktor poprima oblik:

,

(9.49)

gdje su koeficijenti ak traženi koeficijenti optimalnog prediktora kojeg želimo odrediti. Analogno tome, minimalna vrijednost srednje kvadratne pogreške predikcije prediktora reda p koja se postiže primjenom optimalnih koeficijenta ak koji zadovoljavaju sustav (9.4‑9) može se odrediti na slijedeći način:

.

(9.410)

Jednadžbe dane izrazom (9.4‑9) mogu se zapisati i u matričnoj formi:

.

(9.411)

Matrica autokorelacijskih vrijednosti, dana izrazom (9.4‑11), je Toeplitz-ove forme (simetrična po obje glavne dijagonale) dimenzija . U ovom slučaju, su čak i vrijednosti elemenata duž svake pojedine desno položene dijagonale jednake. Zbog ovih svojstava, gornji sustav se može riješiti po koeficijentima ak mnogo učinkovitije nego kod klasičnih postupaka (npr. množenje inverznom matricom), što će biti pokazano u slijedećim poglavljima.

U nastavku ovog poglavlja bit će prikazan primjer određivanja koeficijenata prediktora klasičnom metodom, te pripadne prijenosne funkcije za prediktor reda p=6.

Na slici 9.4‑5 prikazan je odsječak govornog signala i Hammingov vremenski otvor koji će poslužiti za izdvajanje segmenta signala. Izdvojeni signal prikazan je slikom 9.4‑6.

Slika

9.45

Signal i Hammingov vremenski otvor

Slika

9.46

Segment signala izdvojen vremenskim otvorom (N=200)

Autokorelacija signala pomnoženog vremenskim otvorom prikazana je na slici 9.4‑7. Treba uočiti simetričnost oko nule (parnost). Izraženi šiljci predstavljaju mjesta dobrog poklapanja signala i njegove pomaknute verzije. Naime, šiljci se pojavljuju na iznosima pomaka (engl. autocorrelation lag) koji odgovaraju osnovnom periodu pobudnog signala vokalnog trakta i njegovim višekratnicima.

Slika

9.47

Autokorelacija signala pomnoženog vremenskim otvorom

Autokorelacija signala pomnoženog s vremenskim otvorom (za pomake od  do ) prikazana je na slici 9.4‑8, a neposredno iza slike slijedi tablica 9.4‑1 sa numeričkim vrijednostima autokorelacijskih koeficijenata.

Slika

9.48

Autokorelacija signala pomnoženog vremenskim otvorom (pomaci od  do )

 

 

Tablica

9.41

Autokorelacija za pomake od  do

 

0

1

2

3

4

5

6

14.61

13.10

9.16

3.88

-1.80

-6.61

-9.39

 

Tih sedam brojeva popisanih u tablici jednoznačno određuju prediktor reda p kojim je modeliran vokalni trakt. Moguće je sada formirati sustav jednadžbi prema relaciji (9.4‑10) i riješiti ga po nepoznanicama ak. U tablici 9.4‑2 popisane su vrijednosti koeficijenata ak dobivenih rješavanjem linearnog sustava jednadžbi.

 

Tablica

9.42

Koeficijenti linearnog prediktora

 

a1

a2

a3

a4

a5

a6

2.06

-1.96

1.72

-1.52

0.58

0.03

 

Na slici 9.4‑9 prikazan je signal pomnožen vremenskim otvorom (crtkanom linijom) i pogreška predikcije (punom linijom).

Slika

9.49

Izdvojeni segment signala (crtkano) i pogreška predikcije (punom linijom)

 

Sumarna kvadratna pogreška predikcije iznosi En=0.27. Odgovarajuća prijenosna funkcija H(z) modela govornog sustava za izračunate koeficijente ak ima šest polova: dva realna i dva para konjugirano kompleksnih polova. Njihov položaj u z‑ravnini prikazan je slikom 9.4‑10. Sustav je stabilan jer se svi polovi nalaze unutar jedinične kružnice. Autokorelacijska metoda uvijek rezultira stabilnim prediktorom. Svaki konjugirano kompleksni par polova određuje jednu rezonantnu karakteristiku, koja se poklapa s jednim od formanata govornog signala. Polovi smješteni blizu jedinične kružnice imaju veliki Q‑faktor i daju izražene maksimume u prijenosnoj funkciji, tj. odgovaraju uskim formantima.

Slika

9.410

Pozicije polova u z-ravnini

Na slici 9.4‑11 prikazana je amplitudno frekvencijska karakteristika H(z) s naznačenim frekvencijama polova.

Slika

9.411

Frekvencijska karakteristika od H(z) i frekvencije polova

 

Na slici 9.4‑12 prikazani su frekvencijska karakteristika prediktora H(ejw) i spektar ulaznog signala S(ejw). Bitno je uočiti kako je frekvencijskom karakteristikom prediktora modeliran spektar ulaznog signala, tj. prediktor opisuje njegov sporo-promjenjivi dio uzduž frekvencijske osi. Radi toga se za prediktor kaže da opisuje spektralnu ovojnicu govornog signala (engl. spectral envelope).

Slika

9.412

Frekvencijska karakteristika od H(z) i spektar ulaznog signala

Na slici 9.4‑13 prikazan je spektar rezidualnog signala E(ejw). To je spektar pogreške predikcije koji se izračunava kao razlika spektra signala i amplitudno frekvencijske karakteristike prediktora u logaritamskoj mjeri, tj. u dB. Drugim riječima, taj spektar zapravo odgovara kvocijentu modula spektra signala i modula frekvencijske karakteristike H(z). Razmak između latica na slici 9.4‑13 odgovara fundamentalnoj (osnovnoj) frekvenciji titranja glasnica f0.

Slika

9.413

Spektar rezidualnog signala

Usporedbom slika 9.4‑12 i 9.4‑13 bitno je uočiti da je spektar pogreške predikcije mnogo 'ravniji' nego spektar ulaznog signala, tj. vrhovi svih latica su približno na istoj visini (unutar 15 dB). Zbog te činjenice, može se reći da filtar A(z) na čijem se izlazu nalazi signal e(n) provodi spektralno izbjeljivanje signala. To izbjeljivanje je to bolje što je red prediktora viši. Na slici 9.4‑14 prikazan je impulsni odziv h(n) sustava H(z), a na slici 9.4‑15 je prikazana njegova autokorelacija.

Slika

9.414

Impulsni odziv h(n) sustava H(z)

Slika

9.415

Autokorelacija impulsnog odziva sustava h(n)

 

Na slici 9.4‑16 prikazana je autokorelacija impulsnog odziva sustava h(n) crtkanom linijom i autokorelacija ulaznog signala pomnoženog vremenskim otvorom punom linijom. Te dvije autokorelacije su identički jednake za pomake od  do , dok se izvan tog područja razlikuju. Ova činjenica je vrlo važna za samu ideju modeliranja primjenom autokorelacijskog postupka, tj. metodom autokorelacije odredili smo linearni sustav H(z) čija će autokorelacija impulsnog odziva biti identički jednaka autokorelaciji izdvojenog segmenta signala za pomake od  do .

Slika

9.416

Autokorelacija signala pomnoženog vremenskim otvorom (punom linijom) i autokorelacija impulsnog odziva sustava h(n) (crtkano)