1.1 Alternativni skupovi koeficijenata za definiranje prediktora

1.1.1 Odnos parametara linearnog prediktora i modela s cijevima bez gubitaka

U poglavlju 6 i 7 razmatran je model formiranja govora kojeg čini niz od N akustičkih cijevi bez gubitaka, shematski prikazanih na slici 9.13‑1 a). Ekvivalentni vremenski diskretni model prikazan je na slici 9.13‑1 b), a koeficijenti refleksije rk definirani su kao omjer površina poprečnih presjeka dvije susjedne cijevi bez gubitaka tj. prema izrazu:

(9.131)

Slika

9.131

Model s 4 cijevi bez gubitaka koji završava beskonačno dugom cijevi; (a) i pripadajući graf toka signala uz beskonačnu impedanciju glasnica, (b)

Prijenosna funkcija vremenski diskretnog modela izvedena je u poglavlju 7.2 i dana je u konačnim izrazima (7.2‑9) do (7.2‑11). Sustav sa N spojenih cijevi je u općenitom slučaju opisan sa N‑1 faktora refleksije r1 do rN‑1 na spojevima svake dvije cijevi, kao i zaključnim faktorima refleksije na glasnicama rG i usnicama rL. Ako se radi jednostavnosti pretpostavi da je koeficijent refleksije na glasnicama rG=1, tj. da je impedancija glasnica beskonačna, te ako se koeficijent refleksije na usnicama rL označi sa rN, tada se prijenosna funkcija vremenski diskretnog modela (7.2‑9) svodi na slijedeći oblik:

(9.132)

gdje D(z) zadovoljava slijedeću polinomialnu rekurziju:

(9.133)

(9.134)

(9.135)

Ovu rekurziju je lako dokazati analizom izraza (7.2‑10) za specijalni slučaj rG=1. Svi ovi izrazi dosta podsjećaju na razmatranje mrežastih struktura u poglavlju 9.8, gdje je pokazano da polinom koji definira prijenosnu funkciju inverznog filtra:

(9.136)

a koji je dobiven analizom pomoću linearne predikcije, može biti određen sljedećom rekurzijom:

(9.137)

(9.138)

(9.139)

gdje se parametri {ki} nazivaju PARCOR koeficijentima. Usporedbom izraza (9.13‑3) do (9.13‑5) sa izrazima (9.13‑7) do (9.13‑9) proizlazi da prijenosna funkcija sustava:

(9.1310)

dobivena analizom pomoću linearne predikcije ima isti oblik kao i prijenosna funkcija sustava modela s cijevima bez gubitaka koji se sastoji od p spojenih cijevi. Uz pretpostavku da je:

(9.1311)

tada je očito da će polinomi D(z) i A(z) biti identični, tj.:

(9.1312)

Koristeći izraze (9.13‑1) i (9.13‑11) može se lako pokazati da odnos između površina poprečnih presjeka ekvivalentnog modela sa cijevima bez gubitaka i PARCOR koeficijenata glasi:

(9.1313)

Može se uočiti da PARCOR koeficijenti definiraju samo omjer između površina presjeka dviju susjednih cijevi. Na ovaj način površine modela s cijevima bez gubitaka nisu apsolutno određene, jer će svaka normalizacija (množenje svih površina s istim faktorom) dati novi model s istom prijenosnom funkcijom. Uz definiciju apsolutnog iznosa površine presjeka bilo kojeg segmenta (npr. zadnjeg), sve se ostale mogu odrediti korištenjem koeficijenata ki i izraza (9.13‑13).

Treba naglasiti da funkcija poprečnog presjeka dobivena korištenjem izraza (9.13‑13) ne predstavlja pravu funkciju površine presjeka ljudskog vokalnog trakta. Međutim, pokazano je u literaturi da ako se prije analize linearnom predikcijom provede prednaglašavanje govornog signala (visoko‑propusna filtracija), da će tada utjecaji spektra glotalnog pulsa i utjecaji zračenja na usnicama biti otklonjeni, pa će tako dobivene funkcije površina biti vrlo slične stvarnom obliku vokalnog trakta prilikom izgovora.

1.1.2 Odnos koeficijenata linearnog prediktora i PARCOR koeficijenata

Postupak za određivanje koeficijenata prediktora {aj(p), j=1,2,..,p} na osnovu PARCOR koeficijenata {, i=1,2,.......,p} već je ustvari objašnjen u okviru Durbin‑ovog algoritma za određivanje rješenja autokorelacijske metode. Koeficijenti prediktora mogu se dobiti iz PARCOR koeficijenata korištenjem slijedeće rekurzije:

(9.1314)

(9.1315)

Ako se izrazi (9.13‑14) i (9.13‑15) izračunavaju za i=1, …, p, tada koeficijenti prediktora a1 do ap slijede iz zadnjeg koraka rekurzije prema izrazu:

(9.1316)

Slično tome, skup PARCOR koeficijenata može se odrediti iz skupa LPC koeficijenata prediktora koristeći obrnutu rekurziju oblika:

(9.1317)

(9.1318)

Za razliku od prethodne rekurzije, varijabla i u ovom slučaju ide od p prema dolje do 1, a kao inicijalna vrijednost postavlja se:

(9.1319)

1.1.3 LAR koeficijenti

Postoji veći broj jedan‑na‑jedan transformacija parametara prediktora u neki novi skup parametara, koji za određene primjene imaju bolja svojstva nego originalni parametri. Jedan takav skup ekvivalentnih parametara, koji se mogu odrediti iz PARCOR koeficijenata su LAR parametri (engl. Log Area Ratio coefficients) koji su definirani slijedećim izrazom:

(9.1320)

Parametri gi su jednaki logaritmu omjera površina poprečnih presjeka susjednih segmenata kod modela s cijevima bez gubitaka, gdje taj model ima identičnu prijenosnu funkciju kao i LPC model opisan koeficijentima ki. Utvrđeno je da su gi parametri vrlo pogodni za kvantizaciju, jer imaju relativno ravnu karakteristiku spektralne osjetljivosti. To znači da će neovisno o apsolutnom iznosu pojedinog parametra, promjena njegovog iznosa uslijed kvantizacije prouzročiti podjednaku spektralnu pogrešku, tj. razliku između originalne i kvantizirane prijenosne funkcije modela.

Iz gi parametra je moguće inverznom transformacijom odrediti ki koeficijente korištenjem slijedećeg izraza:

(9.1321)