1. Nauke o govoru i jeziku

Proučavanje govora kao jednog od glavnih čimbenika ljudske komunikacije jest multidisciplinarni problem, te se različita područja znanosti bave pojedinim aspektima ovog problema. Tako se lingvistika bavi studijom pravila jezika i njihovog utjecaja na ljudsku komunikaciju, dok se fonetika bavi studijom i klasifikacijom glasova u govoru.

Poznavanje lingvistike i fonetike je od velikog značaja kod većeg broja primjena digitalne obrade govora, kao što su npr. sinteza i prepoznavanja govora.

1.1 Podjela glasova u hrvatskom jeziku

Na osnovu konfiguracije i otvora vokalnog trakta, glasovi u hrvatskom jeziku se dijele na tri osnovne grupe. To su:

·      otvorni glasovi ili samoglasnici ili vokali,

·      poluotvorni glasovi ili glasnici ili sonanti i

·      zatvorni glasovi ili suglasnici ili konsonanti.

Sonanti i konsonanti se nekad u širem smislu ubrajaju u istu grupu, tj. u suglasnike.

1.1.1 Samoglasnici

Vokali ili samoglasnici čine prvu grupu i karakterizira ih činjenica da su to glasovi najveće energije, kod kojih je vokalni trakt većim dijelom otvoren, a tokom cijelog trajanja izgovora glasnice titraju. Osnovna namjena vokala jest povezivanje suglasnika u slogove, tj. formiranje izgovorljivih riječi. Vokali često sami za sebe nose malo informacije, tj. u većini slučajeva prepoznavanje govorne poruke je moguće i kada su iz riječi kompletno izbačeni svi samoglasnici. Tako npr. iz poruke: "dns sm bl škl", nije teško prepoznati da je originalna poruka bila: "danas sam (ili smo) bila (ili bili) (u) školi". Pri "dešifriranju" ove poruke, koristili smo se upravo statističkim informacijama o vjerojatnosti pojavljivanja određenih glasova u nizu, kao i lingvističkim pravilima formiranja rečenica. I pored toga što u rečenici ima čak osam samoglasnika (a a a/o i a/i u o i), moguća su samo dva značenja ove rečenice. Postoje više podjela samih vokala. Prva podjela je po mjestu tvorbe, a prikazana je u tablici 4.1‑1. Mjesto tvorbe je mjesto najvećeg suženja vokalnog trakta. Tako se npr. prilikom izgovora samoglasnika "u" stražnji dio jezika podiže i približava stražnjem (mekom) nepcu. Kao što će biti pokazano u narednim poglavljima, pozicija i oblik takvog suženja u vokalnom traktu direktno će određivati njegovu frekvencijsku karakteristiku a samim time i karakter glasa koji se proizvodi.

 

Tablica

4.11

Podjela samoglasnika po mjestu tvorbe

 

Tip glasa

Glas

Mjesto tvorbe

prednji

i e

prednji dio jezika i prednje nepce

srednji

a

sredina jezika

stražnji

o u

stražnji dio jezika i stražnje nepce

 

Duga podjela vokala je prema veličini otvora između jezika i nepca i prikazana je u tablici 4.1‑2.

 

 

Tablica

4.12

Podjela samoglasnika po veličini otvora

 

Tip glasa

Glas

najviši ili najotvoreniji

a

srednji

e o

najniži ili najzatvoreniji

i u

 

1.1.2 Glasnici

Druga grupa glasova u hrvatskom jeziku su glasnici ili sonanti. Svi glasnici su također zvučni glasovi jer pri njihovom izgovoru glasnice titraju. Ovi glasovi su prikazani u tablici 4.1‑3, a spadaju u grupu polu-otvornih glasova, jer se uslijed približavanja ili dodirivanja pojedinih organa (artikulatora) u vokalnom traktu, otvor za prolaz zraka sužava ili djelomično zatvara. Naravno da je u usporedbi s vokalima, taj preostali otvor značajno manji.

 

Tablica

4.13

Glasnici u hrvatskom jeziku

 

j

l

lj

m

n

nj

r

v

 

Interesantno je uočiti da sonant "r" može biti i samoglasnik, tj. u nekim riječima on preuzima ulogu povezivanja konsonanata u slogove, odnosno riječi (npr. riječ "prst"). U povijesti hrvatskog jezika istu ulogu su imali i neki drugi sonanti.

1.1.3 Suglasnici

Zadnja grupa glasova su zatvorni glasovi ili konsonanti. Kod tih glasova se prolaz zračnoj struji potpuno zatvara ili ostaje samo uski tjesnac kroz koji se ona tare. Neki od konsonanata su zvučni, dok su preostali bezvučni. Zavisno o tipu prepreke (suženja) u vokalnom traktu dijele se u tri osnove grupe:

·      zatvorni ili praskavi ili eksplozivni konsonanti

·      tijesnačni ili strujni ili frikativni konsonanti

·      složeni glasovi, ili zatvorno-tijesnačni, ili afrikati

U tablici 4.1‑4 prikazani su svih 18 konsonanata podijeljeni po zvučnosti i tipu prepreke. Kod zatvornih konsonanata, struja zraka je potpuno zatvorena na određenom mjestu vokalnog trakta. Dolaskom zraka iz pluća, raste tlak iza navedene prepreke, te nakon što postigne dovoljnu razinu uzrokuje naglo otvaranje prepreke i formiranje impulsnog zvučnog signala. Za razliku od zatvornih, kod tjesnačnih konsonanata je vokalni trakt otvoren cijelo vrijeme, ali je prolaz vrlo uzak, te struja zraka prolazi kroz takav tjesnac vrlo velikom brzinom. Uslijed te velike brzine i uslijed trenja o stjenke tog tjesnaca, dolazi do turbulencija u zračnoj struji i do formiranja glasa "šumovitog" karaktera.

Zadnja grupa konsonanata su složeni konsonanti, tj. oni koji nastaju kao kombinacija zatvornih i tjesnačnih konsonanata. Tako npr. glas "č" je vrlo sličan istovremenom izgovoru glasova "t" i "š". Parovi glasova koji formiraju navedene složene konsonante prikazani su u trećem i četvrtom redu tablice 4.1‑4.

Interesantno je uočiti da se konsonanti praktički uvijek javljaju u zvučno / bezvučnom paru. Tako su npr. oblik i vremenske promjene vokalnog trakta prilikom izgovora glasova "b" i "p" vrlo slične, dok je jedina bitna razlika u modu pobude, tj. kod "b" glasnice titraju, dok kod "p" ne. Isto vrijedi i za preostale parove prikazane u prva dva reda tablice 4.1‑4.

Tablica

4.14

Parovi zvučnih i bezvučnih suglasnika

 

tip
glasa

zatvorni ili
praskavi ili
eksplozivni

složeni glasovi ili
zatvorno-tijesnačni ili
afrikati

tijesnačni ili

strujni ili
frikativni

zvučni

b

d

g

đ

-

v

z

ž

-

bezvučni

p

t

k

č

ć

c

f

s

š

h

 

 

 

 

d'z'

 

 

 

 

 

 

 

 

 

t's'

ts

 

 

 

 

 

1.1.4 Mjesto tvorbe glasnika i suglasnika

Slično kao što je u tablici 4.1‑1 napravljena podjela samoglasnika po mjestu tvorbe, to isto je napravljeno u tablici 4.1‑5 za sve sonante i konsonante. Ova podjela nije ekskluzivna, tj. neki se glasovi javljaju u dvije kategorije. Tako je npr. glas "m" istovremeno dvousneni glas, kao i nazalni glas, jer prilikom prvog dijela izgovora glasa "m" struja zraka prolazi kroz nosni trakt i izlazi na nosnicama, dok su usnice potpuno zatvorene. Tek na kraju izgovora dolazi do naglog otvaranja usnica. Slično je i za glas "n" koji je istovremeno i zubni i nazalni glas.

 

Tablica

4.15

Podjela glasnika i suglasnika po mjestu tvorbe

 

 

Tip glasa

Glas

Mjesto zapreke (tvorbe)

dvousneni ili
bilabijalni

b p m

zapreka su obje usne

usnenozubni ili
labiodentalni

f v

donja usna i gornji zubi

zubni ili
dentalni

d t n c z s

zubi i jezik

prednjonepčani ili
palatalni

j lj nj č ć dž đ ž š

jezik i prednje nepce

stražnjonepčani ili
velarni

k g h

zadnji dio jezika i stražnje nepce

tekući ili
likvidni

l r

vrh jezika dodiruje prednje nepce

nosni ili
nazalni

m n

resica je spuštena

piskavi ili
sibilantni

s z c

stvara se piskav šum

 

Kao što je vidljivo iz tablice, mjesto prepreke u vokalnom traktu može biti na raznim mjestima i između različitih organa (usnice, zubi, zubno meso, jezik, nepce).

1.1.5 Preostala fonetska svojstva hrvatskog jezika

Iako u hrvatskom jeziku ima samo 30 različitih glasova, u stvarnom govoru se pojavljuje daleko veći broj modifikacija istih. Način izgovora pojedinog glasa ovisi značajno o njegovom kontekstu, tj. o glasovima koji se nalaze lijevo i desno od njega. Ova pojava se naziva koartikulacija. Zbog toga, kvalitetni sintetički govor nije moguće dobiti jednostavnim spajanjem 30 diskretnih glasova. Isto tako važno je naglasiti da prijelazi iz jednog glasa prema drugom nisu nagli (skokoviti), već su vrlo postepeni i određeni postepenim prijelazom artikulatora iz početne pozicije koja odgovara prvom glasu, prema novoj poziciji koja odgovara slijedećem glasu. Dakle pri tome vokalni trakt prelazi kroz niz među-stanja, što uzrokuje formiranje niza prijelaznih glasova relativno kratkog trajanja. Izbacivanje tih prijelaza značajno narušuje prirodnost sintetičkog govora. U svrhu rješavanja ovog problema, kod jednostavnijih sintetizatora govora, se kao osnovni elementi sinteze koriste parovi glasova (fonema) ili tzv. "difoni" koji su izvađeni (snimljeni) iz stvarnog govora. Na taj način se unutar tog osnovnog elementa nalaze i navedeni prijelazi između glasova.

Za razliku od hrvatskog jezika koji ima samo 30 fonema, u engleskom jeziku ih ima čak 42. Posebno je velika razlika u broju samoglasnika. Tako npr. dok u hrvatskom ima samo 5 samoglasnika, u engleskom ih je čak 11. Pored samih samoglasnika, postoje i tzv. "diftonzi" koji predstavljaju prijelazne samoglasnike, koji na početku izgovora odgovaraju jednom, a na kraju drugom samoglasniku. Tako npr. u riječi "bay" (zaljev), diftong započinje u samoglasniku "e" a završava sa "i", ili npr. u "boy" (dječak), započinje u "o", a završava sa "i". Naravno taj prijelaz je vrlo postepen, pa je to i razlog zašto se navedeni prijelazni glasovi tretiraju kao posebna kategorija fonema.

Sve navedene podjele i klasifikacije ne treba tretirati previše strogo, jer obzirom da govor nastaje kao rezultat prirodnog živog bića, a ne nekog stroja ili mehaničke naprave točno određenih i ponovljivih dimenzija, varijacije između pojedinih govornika, dijalekata i jezika su vrlo velike, što problem digitalne obrade govora čini posebno složenim.

U hrvatskom jeziku, govorna informacija je potpuno sadržana u zvučnosti pobudnog signala (glasnice titraju ili ne) i u frekvencijskoj karakteristici vokalnog trakta. Visina glasa ne predstavlja nikakvu informaciju, tj. neovisno o visini (osnovnoj frekvenciji) zvučnih glasova, poruka je uvijek ista. Međutim to nije istina za sve jezike, jer npr. u mandarinskom kineskom jeziku, smisao (značenje) riječi ovisi i o visini izgovora, što predstavlja dodatni problem kod sustava za automatsko prepoznavanje govora.

1.1.6 Složeniji fonetski elementi

Spajanjem glasova dobivaju se slogovi. Slog je skup glasova koji se izgovara jednim izdisajem. Količina ili kvantitet sloga određena je vremenom potrebnim da se slog izgovori. Naravno da do varijacija u trajanju sloga dolazi upravo varijacijama trajanja samoglasnika, dok su trajanja suglasnika većinom stalna. Tako je npr. trajanje samoglasnika "u" različito u riječima "muž" i "muževi".

Pored trajanja, drugi mogući način modifikacije izgovora pojedinog glasa u riječi je modifikacija amplitude. Tako se isticanjem pojedinog samoglasnika izgovarajući ga većom snagom formira akcent. U hrvatskom jeziku postoje četiri tipa akcenta, koja su navedena u tablici 4.1‑6 zajedno s nekoliko primjera za svaki od tipova.

 

Tablica

4.16

Tip akcenta u hrvatskom jeziku

 

tip akcenta

primjer

kratkosilazni

brat, ginuti, govor, istina

dugosilazni

budim, dragi, glad, meso

kratkouzlazni

gora, loza, voda, pero

dugouzlazni

glava, hvaliti, pitati, trava