Proučavanje govora kao jednog od glavnih čimbenika ljudske komunikacije jest multidisciplinarni problem, te se različita područja znanosti bave pojedinim aspektima ovog problema. Tako se lingvistika bavi studijom pravila jezika i njihovog utjecaja na ljudsku komunikaciju, dok se fonetika bavi studijom i klasifikacijom glasova u govoru.
Poznavanje lingvistike i fonetike je od velikog značaja kod većeg broja primjena digitalne obrade govora, kao što su npr. sinteza i prepoznavanja govora.
Na osnovu konfiguracije i otvora vokalnog trakta, glasovi u hrvatskom jeziku se dijele na tri osnovne grupe. To su:
· otvorni glasovi ili samoglasnici ili vokali,
· poluotvorni glasovi ili glasnici ili sonanti i
· zatvorni glasovi ili suglasnici ili konsonanti.
Sonanti i konsonanti se nekad u širem smislu ubrajaju u istu grupu, tj. u suglasnike.
Vokali ili samoglasnici čine prvu grupu i karakterizira ih činjenica da su to glasovi najveće energije, kod kojih je vokalni trakt većim dijelom otvoren, a tokom cijelog trajanja izgovora glasnice titraju. Osnovna namjena vokala jest povezivanje suglasnika u slogove, tj. formiranje izgovorljivih riječi. Vokali često sami za sebe nose malo informacije, tj. u većini slučajeva prepoznavanje govorne poruke je moguće i kada su iz riječi kompletno izbačeni svi samoglasnici. Tako npr. iz poruke: "dns sm bl škl", nije teško prepoznati da je originalna poruka bila: "danas sam (ili smo) bila (ili bili) (u) školi". Pri "dešifriranju" ove poruke, koristili smo se upravo statističkim informacijama o vjerojatnosti pojavljivanja određenih glasova u nizu, kao i lingvističkim pravilima formiranja rečenica. I pored toga što u rečenici ima čak osam samoglasnika (a a a/o i a/i u o i), moguća su samo dva značenja ove rečenice. Postoje više podjela samih vokala. Prva podjela je po mjestu tvorbe, a prikazana je u tablici 4.1‑1. Mjesto tvorbe je mjesto najvećeg suženja vokalnog trakta. Tako se npr. prilikom izgovora samoglasnika "u" stražnji dio jezika podiže i približava stražnjem (mekom) nepcu. Kao što će biti pokazano u narednim poglavljima, pozicija i oblik takvog suženja u vokalnom traktu direktno će određivati njegovu frekvencijsku karakteristiku a samim time i karakter glasa koji se proizvodi.
Tip glasa |
Glas |
Mjesto tvorbe |
prednji |
i e |
prednji dio jezika i prednje nepce |
srednji |
a |
sredina jezika |
stražnji |
o u |
stražnji dio jezika i stražnje nepce |
Duga podjela vokala je prema veličini otvora između jezika i nepca i prikazana je u tablici 4.1‑2.
Tip glasa |
Glas |
najviši ili najotvoreniji |
a |
srednji |
e o |
najniži ili najzatvoreniji |
i u |
Druga grupa glasova u hrvatskom jeziku su glasnici ili sonanti. Svi glasnici su također zvučni glasovi jer pri njihovom izgovoru glasnice titraju. Ovi glasovi su prikazani u tablici 4.1‑3, a spadaju u grupu polu-otvornih glasova, jer se uslijed približavanja ili dodirivanja pojedinih organa (artikulatora) u vokalnom traktu, otvor za prolaz zraka sužava ili djelomično zatvara. Naravno da je u usporedbi s vokalima, taj preostali otvor značajno manji.
j |
l |
lj |
m |
n |
nj |
r |
v |
Interesantno je uočiti da sonant "r" može biti i samoglasnik, tj. u nekim riječima on preuzima ulogu povezivanja konsonanata u slogove, odnosno riječi (npr. riječ "prst"). U povijesti hrvatskog jezika istu ulogu su imali i neki drugi sonanti.
Zadnja grupa glasova su zatvorni glasovi ili konsonanti. Kod tih glasova se prolaz zračnoj struji potpuno zatvara ili ostaje samo uski tjesnac kroz koji se ona tare. Neki od konsonanata su zvučni, dok su preostali bezvučni. Zavisno o tipu prepreke (suženja) u vokalnom traktu dijele se u tri osnove grupe:
· zatvorni ili praskavi ili eksplozivni konsonanti
· tijesnačni ili strujni ili frikativni konsonanti
· složeni glasovi, ili zatvorno-tijesnačni, ili afrikati
U tablici 4.1‑4 prikazani su svih 18 konsonanata podijeljeni po zvučnosti i tipu prepreke. Kod zatvornih konsonanata, struja zraka je potpuno zatvorena na određenom mjestu vokalnog trakta. Dolaskom zraka iz pluća, raste tlak iza navedene prepreke, te nakon što postigne dovoljnu razinu uzrokuje naglo otvaranje prepreke i formiranje impulsnog zvučnog signala. Za razliku od zatvornih, kod tjesnačnih konsonanata je vokalni trakt otvoren cijelo vrijeme, ali je prolaz vrlo uzak, te struja zraka prolazi kroz takav tjesnac vrlo velikom brzinom. Uslijed te velike brzine i uslijed trenja o stjenke tog tjesnaca, dolazi do turbulencija u zračnoj struji i do formiranja glasa "šumovitog" karaktera.
Zadnja grupa konsonanata su složeni konsonanti, tj. oni koji nastaju kao kombinacija zatvornih i tjesnačnih konsonanata. Tako npr. glas "č" je vrlo sličan istovremenom izgovoru glasova "t" i "š". Parovi glasova koji formiraju navedene složene konsonante prikazani su u trećem i četvrtom redu tablice 4.1‑4.
Interesantno je uočiti da se konsonanti praktički uvijek javljaju u zvučno / bezvučnom paru. Tako su npr. oblik i vremenske promjene vokalnog trakta prilikom izgovora glasova "b" i "p" vrlo slične, dok je jedina bitna razlika u modu pobude, tj. kod "b" glasnice titraju, dok kod "p" ne. Isto vrijedi i za preostale parove prikazane u prva dva reda tablice 4.1‑4.
tip |
zatvorni ili |
složeni glasovi ili |
tijesnačni ili strujni ili |
|||||||
zvučni |
b |
d |
g |
dž |
đ |
- |
v |
z |
ž |
- |
bezvučni |
p |
t |
k |
č |
ć |
c |
f |
s |
š |
h |
|
|
|
|
dž |
d'z' |
|
|
|
|
|
|
|
|
|
tš |
t's' |
ts |
|
|
|
|
Slično kao što je u tablici 4.1‑1 napravljena podjela samoglasnika po mjestu tvorbe, to isto je napravljeno u tablici 4.1‑5 za sve sonante i konsonante. Ova podjela nije ekskluzivna, tj. neki se glasovi javljaju u dvije kategorije. Tako je npr. glas "m" istovremeno dvousneni glas, kao i nazalni glas, jer prilikom prvog dijela izgovora glasa "m" struja zraka prolazi kroz nosni trakt i izlazi na nosnicama, dok su usnice potpuno zatvorene. Tek na kraju izgovora dolazi do naglog otvaranja usnica. Slično je i za glas "n" koji je istovremeno i zubni i nazalni glas.
Tip glasa |
Glas |
Mjesto zapreke (tvorbe) |
dvousneni ili |
b p m |
zapreka su obje usne |
usnenozubni ili |
f v |
donja usna i gornji zubi |
zubni ili |
d t n c z s |
zubi i jezik |
prednjonepčani ili |
j lj nj č ć dž đ ž š |
jezik i prednje nepce |
stražnjonepčani ili |
k g h |
zadnji dio jezika i stražnje nepce |
tekući ili |
l r |
vrh jezika dodiruje prednje nepce |
nosni ili |
m n |
resica je spuštena |
piskavi ili |
s z c |
stvara se piskav šum |
Kao što je vidljivo iz tablice, mjesto prepreke u vokalnom traktu može biti na raznim mjestima i između različitih organa (usnice, zubi, zubno meso, jezik, nepce).
Iako u hrvatskom jeziku ima samo 30 različitih glasova, u stvarnom govoru se pojavljuje daleko veći broj modifikacija istih. Način izgovora pojedinog glasa ovisi značajno o njegovom kontekstu, tj. o glasovima koji se nalaze lijevo i desno od njega. Ova pojava se naziva koartikulacija. Zbog toga, kvalitetni sintetički govor nije moguće dobiti jednostavnim spajanjem 30 diskretnih glasova. Isto tako važno je naglasiti da prijelazi iz jednog glasa prema drugom nisu nagli (skokoviti), već su vrlo postepeni i određeni postepenim prijelazom artikulatora iz početne pozicije koja odgovara prvom glasu, prema novoj poziciji koja odgovara slijedećem glasu. Dakle pri tome vokalni trakt prelazi kroz niz među-stanja, što uzrokuje formiranje niza prijelaznih glasova relativno kratkog trajanja. Izbacivanje tih prijelaza značajno narušuje prirodnost sintetičkog govora. U svrhu rješavanja ovog problema, kod jednostavnijih sintetizatora govora, se kao osnovni elementi sinteze koriste parovi glasova (fonema) ili tzv. "difoni" koji su izvađeni (snimljeni) iz stvarnog govora. Na taj način se unutar tog osnovnog elementa nalaze i navedeni prijelazi između glasova.
Za razliku od hrvatskog jezika koji ima samo 30 fonema, u engleskom jeziku ih ima čak 42. Posebno je velika razlika u broju samoglasnika. Tako npr. dok u hrvatskom ima samo 5 samoglasnika, u engleskom ih je čak 11. Pored samih samoglasnika, postoje i tzv. "diftonzi" koji predstavljaju prijelazne samoglasnike, koji na početku izgovora odgovaraju jednom, a na kraju drugom samoglasniku. Tako npr. u riječi "bay" (zaljev), diftong započinje u samoglasniku "e" a završava sa "i", ili npr. u "boy" (dječak), započinje u "o", a završava sa "i". Naravno taj prijelaz je vrlo postepen, pa je to i razlog zašto se navedeni prijelazni glasovi tretiraju kao posebna kategorija fonema.
Sve navedene podjele i klasifikacije ne treba tretirati previše strogo, jer obzirom da govor nastaje kao rezultat prirodnog živog bića, a ne nekog stroja ili mehaničke naprave točno određenih i ponovljivih dimenzija, varijacije između pojedinih govornika, dijalekata i jezika su vrlo velike, što problem digitalne obrade govora čini posebno složenim.
U hrvatskom jeziku, govorna informacija je potpuno sadržana u zvučnosti pobudnog signala (glasnice titraju ili ne) i u frekvencijskoj karakteristici vokalnog trakta. Visina glasa ne predstavlja nikakvu informaciju, tj. neovisno o visini (osnovnoj frekvenciji) zvučnih glasova, poruka je uvijek ista. Međutim to nije istina za sve jezike, jer npr. u mandarinskom kineskom jeziku, smisao (značenje) riječi ovisi i o visini izgovora, što predstavlja dodatni problem kod sustava za automatsko prepoznavanje govora.
Spajanjem glasova dobivaju se slogovi. Slog je skup glasova koji se izgovara jednim izdisajem. Količina ili kvantitet sloga određena je vremenom potrebnim da se slog izgovori. Naravno da do varijacija u trajanju sloga dolazi upravo varijacijama trajanja samoglasnika, dok su trajanja suglasnika većinom stalna. Tako je npr. trajanje samoglasnika "u" različito u riječima "muž" i "muževi".
Pored trajanja, drugi mogući način modifikacije izgovora pojedinog glasa u riječi je modifikacija amplitude. Tako se isticanjem pojedinog samoglasnika izgovarajući ga većom snagom formira akcent. U hrvatskom jeziku postoje četiri tipa akcenta, koja su navedena u tablici 4.1‑6 zajedno s nekoliko primjera za svaki od tipova.
tip akcenta |
primjer |
kratkosilazni |
brat, ginuti, govor, istina |
dugosilazni |
budim, dragi, glad, meso |
kratkouzlazni |
gora, loza, voda, pero |
dugouzlazni |
glava, hvaliti, pitati, trava |