1.1 Ovisnost predikcijskog dobitka o tipu glasa

Na slici 9.12‑1 prikazane su funkcije ovisnosti normalizirane pogreške predikcije, 10log10(V(i)), o redu predikcije za samoglasnike ‘a’, ‘e’, ‘i’, ‘o’, ‘u’ na kojima je vidljiva različita brzina opadanja pogreške predikcije. Krivulje za glasove ‘o’ i ‘u’ imaju znatno brži pad nego glasovi ‘a’,’i’, a osobito ‘e’.

Slika

9.121

Normalizirana greška predikcije kao funkcija reda prediktora za samoglasnike ‘a’, ‘e’, ‘i’, ‘o’, ‘u

Razlog ove pojave leži u činjenici da glasovi ‘o’ i ‘u’ imaju jako izražen samo jedan ili dva formanta koji se dobro modeliraju već sa prediktorom drugog ili četvrtog reda, što izrazito smanjuje grešku predikcije i sa niskim redom. S druge strane glas ’e’ ima vrlo “rogati” spektar sa četiri vrlo izražena formanta kojeg nedovoljno dobro modelira čak i prediktor 10. reda.

Slika

9.122

Frekvencijska karakteristika prediktora i normalizirana greška predikcije kao funkcija reda prediktora za suglasnik ‘t’

Također uočljiva je i pojava lomova unutar svake pojedine krivulje nakon kojih je opadanje pogreške predikcije znatno blaže, te nije potrebno povećanja reda prediktora za taj određeni glas.

Slika

9.123

Frekvencijska karakteristika prediktora i normalizirana greška predikcije kao funkcija reda prediktora za suglasnik ‘d’

Slike 9.12‑2 do 9.12‑5 prikazuju spektre govornih odsječaka i prijenosne funkcije prediktora 10. reda s lijeve strane, odnosno promjenu greške predikcije zavisno o redu prediktora s desne strane. Prve dvije slike (9.12‑2 i 9.12‑3) su za ‘d’ i ‘t’ kao primjer zvučnog/bezvučnog para zatvornih (praskavih) glasova. Druge dvije slike (9.12‑4 i 9.12‑5) su za glasove ‘ž’ i ‘š’ kao primjer zvučnog/bezvučnog para tjesnačnih glasova (frikativa). Analizirajući ove slike moguće je uočiti slične pojave kao kod samoglasnika.

Slika

9.124

Frekvencijska karakteristika prediktora i normalizirana greška predikcije kao funkcija reda prediktora za suglasnik ‘š’

Slika

9.125

Frekvencijska karakteristika prediktora i normalizirana pogreška predikcije kao funkcija reda predikt. za suglasnik ‘ž’

Suglasnici ‘t’ i ‘d’ imaju u spektru nekoliko podjednako izraženih formanata što se očituje u postupnom padu greške predikcije s povećanjem reda prediktora. S druge strane suglasnik ‘š’ ima jedan jako izražen formant na frekvenciji 2783 Hz koji se uspješno modelira već i prediktorom 2. reda, što uzrokuje nagli pad pogreške predikcije vidljiv na slici 9.12‑4. Općenito, može se zaključiti da dobitak odnosno kvaliteta predikcije linearnog prediktora ovisi o “obojenosti” spektra što je termin za dinamiku (razvedenost po amplitudi) amplitudno frekvencijske karakteristike pojedinog glasa, te o broju i izraženosti formanata u spektru. Što je broj formanata manji i što su oni izraženiji, to je lakše modelirati glas čak i s prediktorom niskog reda (npr. 'o', 'u', 'š'), a energija predikcijske pogreške je značajno manja od ulazne energije signala, te se ostvaruje velik dobitak predikcije. S druge strane, ako je broj formanata velik, te ako su oni podjednako izraženi, potrebno je koristiti prediktore višeg reda koji uspješno modeliraju sve formante (npr. 'e', 'd'). Općenito će za zvučne glasove, dobitak uslijed predikcije biti veći nego kod bezvučnih glasova, kao što je vidljivo na paru 'd' i 't'.