1. Akustička teorija nastajanja govora

1.1 Širenje zvuka

Pod pojmom zvuka se podrazumijevaju vibracije. Vibracije su uzrok nastanka zvučnih valova koji se nakon toga šire titranjem čestica medija kroz koji putuje. Zbog toga osnovu za opisivanje nastanka i širenja zvuka u vokalnom traktu čine zakoni fizike. To se posebno odnosi na osnovne zakone očuvanja mase, očuvanja količine gibanja i očuvanja energije zajedno sa zakonima termodinamike i mehanike fluida koji se svi mogu primijeniti na zrak. Zrak je osnovni medij širenja zvuka kod govora, a može se svrstati u grupu stlačivih fluida niske viskoznosti. Koristeći ove fizikalne principe moguće je postaviti skup parcijalnih diferencijalnih jednadžbi koje opisuju gibanje zraka u govornom sustavu. Sama formulacija, a i rješenje ovih diferencijalnih jednadžbi je iznimno složeno izuzev u slučaju velikih pojednostavljenja oblika vokalnog trakta i gubitaka energije u njemu. Detaljna akustička teorija mora uzeti u obzir slijedeće utjecaje:

Ø      vremenska promjenjivost oblika vokalnog trakta

Ø      gubitci zbog toplinske vodljivosti i viskoznog trenja na stjenkama vokalnog trakta

Ø      mekoća stjenki vokalnog trakta

Ø      zračenje zvuka na usnama

Ø      akustička veza usne i nosne šupljine

Ø      izvor zvuka u vokalnom traktu

Potpuna i detaljna akustička teorija koja bi uzimala u obzir sve gore navedene efekte nadmašuje opseg ove skripte, a preciznije, kao takva još ni ne postoji. Treba se zadovoljiti pojednostavljenim matematičkim modelom uz zanemarenja nekih od gore navedenih faktora.

Slika

5.11

(a) Model vokalnog trakta; (b) Odgovarajuća  funkcija površine poprečnog presjeka A(x,t)

 

Najjednostavnija fizikalna konfiguracija kojom se može opisati proces nastanka govora je prikazana na slici 5.1‑1 a). Vokalni trakt je modeliran kao cijev nejednolikog, vremenski promjenjivog poprečnog presjeka. Za frekvencije čije su valne duljine dugačke u usporedbi s dimenzijama vokalnog trakta (manje od otprilike 4000 Hz), moguće je pretpostaviti da se zvučni val kroz vokalni trakt širi kao plošni val koji putuje duž osi cijevi. Daljnje pojednostavljenje uvodi se pretpostavkom da nema gubitaka uslijed viskoznosti ili toplinske vodljivosti bilo u unutrašnjosti cijevi (u samom fluidu) ili na njenim stjenkama. Koristeći ove pretpostavke i zakone očuvanja mase, momenta i energije, Portnoff je pokazao da zvučni valovi u cijevi zadovoljavaju slijedeći par jednadžbi:

(5.11)

(5.12)

gdje su:

Ø      p=p(x,t) ..... promjena zvučnog tlaka na mjestu x u trenutku t

Ø      u=u(x,t) ..... promjena brzine protoka volumena zraka na mjestu x u trenutku t

Ø      r ................ gustoća zraka u cijevi

Ø      c ................. brzina širenja zvuka u zraku

Ø      A=A(x,t) .... prostorna funkcija cijevi, tj. iznos površine poprečnog presjeka

                          okomitog na os cijevi kao funkcija udaljenosti x duž cijevi i vremena t

Jednadžbe (5.1‑1) i (5.1‑2)nije moguće analitički riješiti osim u slučaju najjednostavnijih konfiguracija. Međutim, moguće ih je riješiti numerički. Potpuno rješenje diferencijalnih jednadžbi iziskuje nalaženje tlaka i brzine protoka zraka za sve vrijednosti x i t u prostoru ograničenom glasnicama i usnama. Da bi se sustav mogao riješiti, moraju biti definirani rubni uvjeti za oba kraja cijevi. Na strani usnica, rubni uvjet je određen zračenjem zvuka iz cijevi, tj. pretvorbom brzine protoka volumena zraka na mjestu usnica u varijacije zvučnog tlaka koje se zatim šire prostorom. Rubni uvjet na strani glasnica uvjetuje sama priroda uzbude.

Pored rubnih uvjeta, mora također biti poznata i funkcija površine poprečnog presjeka A(x,t). Na slici 5.1‑1 b) prikazana je funkcija površine poprečnog presjeka cijevi prikazane na slici 5.1‑1 a) u određenom vremenskom trenutku. Za trajne glasove realno je pretpostaviti da se funkcija A(x,t) ne mijenja značajno u vremenu, dok se međutim kod tranzijentnih glasova to ne može pretpostaviti. Detaljna mjerenja funkcije A(x,t) je iznimno teško provesti, čak i kod trajnih glasova. Jedan pristup takvim mjerenjima je upotrebom Rontgenskih zraka za dobivanje "filma" koji prikazuje oblik i promjene oblika vokalnog trakta kroz vrijeme. Fant i Perkell su radili takva mjerenja, međutim zbog štetnosti x-zraka ovakva mjerenja mogu biti samo vrlo ograničenog opsega. Drugi pristup je zaključivanje o obliku vokalnog trakta na osnovi provedenih akustičkih mjerenja. Sondhi i Gopinath su opisali jedan takav pristup koji se temelji na uzbudi vokalnog trakta pomoću vanjskog izvora. Oba ova pristupa su korisna za prikupljanje znanja o dinamici nastanka govora, ali nisu direktno primjenjivi na modeliranje govornih signala (npr. u svrhu prijenosa). Atal je opisao istraživanja usmjerena ka dobivanju A(x,t) direktno iz snimljenih govornih signala.

Potpuno rješenje jednadžbi (5.1‑1) i (5.1‑2) je jako složeno čak i kada je A(x,t) točno određena. Na sreću, nije neophodno rješavanje jednadžbi u najopćenitijim uvjetima da bi se dobio uvid u samu prirodu govornih signala. Za dobivanje rješenja moguće je koristiti čitav niz razumnih pojednostavljenja i aproksimacija.