LSS Laboratorij za sustave i signale
Fakultet elektrotehnike i računarstva Sveučilište u Zagrebu
ENGLISH Naslovnica Obavijesti Predavanja Vježbe Diplomski FAQ  
Predavanja Digitalna obrada govora / Predavanja
DIGITALNA OBRADA GOVORA
NASLOVNICA
OBAVIJESTI
PREDAVANJA
VJEŽBE
LITERATURA I LINKOVI
OCJENJIVANJE
NASTAVNICI
STUDENTI
LETAK PREDMETA
DIPLOMSKI RADOVI
ČESTO POSTAVLJANA PITANJA (FAQ)

Sadržaj

  1. Skripta iz predmeta Digitalna obrada govora
  2. Elektronička verzija skripte (PDF)
  3. Tiskana verzija skripte
  4. Zabilješke s predavanja
  5. Predavanja po temama
  6. Predgovor skripte s uvjetima korištenja

Skripta iz predmeta Digitalna obrada govora

"Digitalna obrada govora: Interna zavodska skripta" je elektronička publikacija čiji je autor doc. dr. sc. Davor Petrinović. Prvo izdanje ove publikacije objavljeno je 2002. godine u Zagrebu. Ispravljena i dopunjena izdanja izlaze godišnje. Publikacija se može slobodno koristiti u svrhu vlastitog obrazovanja studenata koji su upisali ovaj predmet. Za ostale namjene pogledajte opće uvjete korištenja kao i dodatne uvjete navedene u Predgovoru skripte.

[povratak na vrh stranice]

Elektronička verzija skripte (PDF)

Kompletna skripta se može učitati na ovom mjestu u PDF formatu u skladu s gore navedenim uvjetima korišenja.

Skripta - izdanje 08.02.2002 (PDF)

Skripta - izdanje 08.02.2002 (ZIP)

[povratak na vrh stranice]

Tiskana verzija skripte

Skripta se također može nabaviti u tiskanom obliku u skriptarnici FER-a.

[povratak na vrh stranice]

Zabilješke s predavanja

Generacija 04/05

U nastavku su linkovi na PDF datoteke sa zabilješkama predavanja sa elektroničke školske ploče za generaciju 2004/05. Nedostaju zabilješke sa predavanja koje je održano 10.11 u predavaoni D152, jer je tog dana nestalo struje.

RB Datum Tema
1
13.10.2004
Uvodno predavanje
2
20.10.2004
Osnove modeliranja govornog signala
3
27.10.2004
Glasovi u hrvatskom i engleskom jeziku
4
3.11.2004
Osnove akustičkog modeliranja vokalnog trakta
5
17.11.2004
Modeli sa spojenim cijevima bez gubitaka
6
24.11.2004
Prijenosna funkcija modela sa spojenim cijevima u s i z domeni
7
1.12.2004
Model zračenja i pobude vokalnog trakta, uvod u linearnu predikciju
8
8.12.2004
Estimacija parametara all-pole modela i autokorelacijski postupak
9
15.12.2004
Kovarijancijski postupak estimacije, Levinson Durbinov algoritam
10
12.1.2005
Choleskey dekompozicija, predikcijski dobitak i parametarski model kodera
11
19.1.2005
Homomofrna analiza govornog signala, kepstar i kompleksni kepstar
12
26.1.2005
Estimacija fundamentalne frekvencije, LAR parametri, frekvencije spektralnih linija

[povratak na vrh stranice]

Generacija 03/04

U nastavku su linkovi na PDF datoteke sa zabilješkama predavanja sa elektroničke školske ploče za generaciju 2003/04. Nedostaju zabilješke sa predavanja koje je održano 26.11 u predavaoni D152 i od drugog predavanja 14.01 koje je održano u laboratoriju D-138, jer je dvorana D160 bila zauzeta u navedenim terminima.

RB Datum Tema
1
22.10.2003
Osnovni principi modeliranja govora
2
29.10.2003
Prediktivno kodiranje govornog signala
3
5.11.2003
Osnove prepoznavanja govora
4
12.11.2003
Akustički model homogene cijevi bez gubitaka
5
19.11.2003
Prijenosna funkcija homogene cijevi bez gubitaka
6
3.12.2003
Model sa spojenim cijevima bez gubitaka
7
10.12.2003
Prijenosna funkcija modela sa spojenim cijevima
8
17.12.2003
Model zračenja i način kodiranja pobudnog signala
9
14.1.2004
Osnovni principi linearne predikcije
10
21.1.2004
Postupak kovarijance za određivanje linearnog prediktora
11
28.1.2004
Faktor pojačanja modela, predikcijski dobitak, kvantizacija parametara prediktora

[povratak na vrh stranice]

Predavanja po temama

Radi jednostavnijeg uvida u sadržaj predmeta, u nastavku je prikazan sadržaj skripte s naslovima glavnih poglavlja. Pojedina poglavlja skripte moguće je pročitati i u HTML formatu (uz poznata ograničenja formatiranja, kao i pogrešnu numeraciju poglavlja).

1. Uvod

2. Pregled primjena postupaka digitalne obrade govora

2.1 Kodiranje govornog signala
2.2 Sustavi za telekonferencije i udaljeno učenje
2.3 Primjena digitalne obrade govora u sintezi i prepoznavanju govora
2.4 Sustavi za transformacije govorne poruke
2.5 Sustavi za pomoć ljudima s tjelesnim oštećenjima
2.6 Zaključak
2.7 Potrebna znanja za digitalnu obradu govora

3. Osnove procesa nastajanja govora

4. Nauke o govoru i jeziku

4.1 Podjela glasova u hrvatskom jeziku

5. Akustička teorija nastajanja govora

5.1 Širenje zvuka
5.2 Jednolika cijev bez gubitaka
5.3 Utjecaj gubitaka u vokalnom traktu
5.4 Utjecaj zračenja na usnicama
5.5 Pobudni signal vokalnog trakta

6. Akustički govorni model

6.1 Model izvor-sustav za formiranje govornog signala
6.2 Model sa spojenim cijevima bez gubitaka
6.3 Širenje zvučnih valova u spojenim cijevima
6.4 Rubni uvjeti modela sa spojenim cijevima bez gubitaka

7. Vremenski diskretni akustički model

7.1 Veza akustičkog modela i vremenski diskretnih filtara
7.2 Prijenosna funkcija vremenski diskretnog modela u z-domeni

8. Digitalni model govornog signala

8.1 Model izvor-sustav
8.2 Vokalni trakt
8.3 Zračenje na usnicama
8.4 Pobudni signal
8.5 Potpuni digitalni model
8.6 Zaključak

9. Postupci linearne predikcije govornih signala

9.1 Uvod u linearnu predikciju
9.2 Primjer predikcije govornog signala
9.3 Teoretske postavke analize linearnom predikcijom
9.4 Autokorelacijska metoda
9.5 Metoda kovarijance
9.6 Faktor pojačanja LPC filtra
9.7 Postupci rješavanja sustava LPC jednadžbi
9.7.1 Durbinov rekurzivni postupak za rješavanje autokorelacijskih jednadžbi
9.7.2 Primjer izračunavanja prediktora Durbinovim algoritmom
9.7.3 Računanje prediktora za metodu kovarijance Cholesky dekompozicijom
9.8 Predikcija mrežastom (lattice) strukturom
9.8.1 Burgov algoritam
9.9 Usporedba postupaka linearne predikcije
9.10 Signal predikcijske pogreške
9.11 Izrazi za predikcijsku pogrešku
9.12 Ovisnost predikcijskog dobitka o tipu glasa
9.13 Alternativni skupovi koeficijenata za definiranje prediktora
9.13.1 Odnos parametara linearnog prediktora i modela s cijevima bez gubitaka
9.13.2 Odnos koeficijenata linearnog prediktora i PARCOR koeficijenata
9.13.3 LAR koeficijenti
9.14 Kvantizacija parametara prediktora
9.15 Frekvencijska interpretacija greške predikcije
9.15.1 Interpretacija srednje kvadratne pogreške predikcije u frekvencijskoj domeni

10. Homomorfna obrada govornog signala

10.1 Uvod
10.2 Sustavi homomorfni za konvoluciju
10.3 Svojstva kompleksnog kepstra
10.4 Postupci izračunavanja kepstra
10.4.1 Kepstar i kompleksni kepstar govornog signala
10.5 Primjena kepstralne analize za određivanje fundamentalne frekvencije

[povratak na vrh stranice]

Predgovor skripte s uvjetima korištenja

Ova skripta je namijenjena studentima predmeta "Digitalna obrada govora" u svrhu lakšeg savladavanja gradiva i praćenja laboratorijskih vježbi. Sadržaj skripte pokriva uvod u područje digitalne obrade govora i daje fizikalne osnove postupka formiranja govora kao i osnovne akustičke i digitalne matematičke modele za reprezentaciju govornog signala. Velika pažnja je posvećena postupku linearne predikcije, koji je jedan od glavnih alata u analizi i modeliranju govora. U uvodnom dijelu skripte su opisane i specifičnosti hrvatskog jezika, te su dane neke osnovne klasifikacije glasova. Za potpuno razumijevanje izložene problematike, potreban je i praktični rad kroz laboratorijske vježbe iz ovog predmeta koje su pokrivene posebnom skriptom.

Gradivo ove skripte pripremljeno je kroz seminarske radove studenata šk. god. 1998/99 na osnovu odabranih poglavlja iz knjige "Digital Processing of Speech Signals", L.R. Rabiner, R.W. Schafer, 1978, koja se koristi kao službeni udžbenik iz ovog predmeta na većem broju sveučilišta u svijetu. Iako je ovo jedan od prvih udžbenika iz ovog područja, način izlaganja je dobro prilagođen znanjima studenata stečenim na predmetima "Teorija mreža i linija", "Sustavi i signali" i "Digitalna obrada signala". Velik dio materijala u ovoj skripti potiče iz navedene knjige, pa se radi toga ova skripta može koristiti isključivo kao interna zavodska skripta namijenjena studentima koji su upisali ovaj predmet, dok je svako njeno umnažanje ili distribucija u cjelini ili dijelovima zabranjeno. Osnovni materijali su prošireni većim brojem primjera i ilustracija, kojima se nastoje naglasiti najvažnije postavke izložene teorije. Obzirom da ova skripta pokriva samo jedan dio tematike izložene u knjizi, zainteresiranim studentima se preporuča da svoja znanja prošire čitanjem ove i drugih knjiga iz ovog područja.

[povratak na vrh stranice]

Sveučilište u Zagrebu - FER - ZESOI - LSS - DOG
© 2002. Zavod za elektroničke sustave i obradbu informacija.
Ukoliko imate pitanja ili komentara o ovim stranicama obratite se webmasteru.