LSS Laboratorij za sustave i signale
Fakultet elektrotehnike i računarstva Sveučilište u Zagrebu
ENGLISH Naslovnica Obavijesti Predavanja Vježbe Diplomski FAQ  
Naslovnica Digitalna obrada govora / Diplomski
DIGITALNA OBRADA GOVORA
NASLOVNICA
OBAVIJESTI
PREDAVANJA
VJEŽBE
LITERATURA I LINKOVI
OCJENJIVANJE
NASTAVNICI
STUDENTI
LETAK PREDMETA
DIPLOMSKI RADOVI
ČESTO POSTAVLJANA PITANJA (FAQ)

Diplomski radovi iz područja digitalne obrade govora.

Studenti koji su slušali predmet Digitalna obrada govora i koji su kao mentora odabrali doc. Davora Petrinovića su za diplomski rad imali temu vezanu uz digitalnu obradu govora. U tablici je prikazan smjer i godina diplomiranja za svakog studenta. Za novije diplomske radove je priložen i tekst zadatka.

Ime Prezime Smjer Naslov Godina
Ante Raos INE Kodiranje glasa linearnim kodiranjem s predviđanjem 1995
Josip Lujetić INE Vektorska kvantizacija govornog signala 1996
Petar Ćurković INE Prepoznavanje govora korištenjem skrivenih Markovljevih modela 1998
Ivica Rade INE Kodiranje govora kodno pobuđenim linearnim prediktorom 1998
Danijel Gorupec INE Prediktivno kodiranje govornog signala uz subjektivni kriterij pogreške 1999
Ivan Uremović RKP Kodiranje govora u frekvencijskoj domeni 1999
Tihomir Tadić RKP Višepojasno pobuđeni koder govornog signala 1999
Drago Kozic INE Određivanje frekvencija spektralnih linija interpolacijom frekvencijske karakteristike pomoćnih polinoma 1999
Tihomir Biškupić TKI Filtri za ukljnjanje periodičnosti pri kodiranju govornog signala 1999
Tomislav Ribarić INE Prepoznavanje govora primjenom procesora za digitalnu obradbu signala 1999
Ivan Lukačević RKP Prediktivna vektorska kvantizacija spektralnih linija govornog signala 1999
Mirna Kuzmić RAČ Implementacija kriptografskog algoritma Rijndael na procesoru za digitalnu obradu signala 2002
Maja Adam RAČ Kodiranje govora postupkom interpolacije karakterističnih valnih oblika 2003
Dragan Šajnić INE Višestupanjska vektorska kvantizacija s kodnim knjigama projektiranim sekvencijalnim-iterativnim postupkom 2003

Prediktivno kodiranje govornog signala uz subjektivni kriterij pogreške

Potrebno je istražiti mogućnosti kodiranja govornog signala korištenjem postupaka linearne predikcije uz uvažavanje subjektivnog kriterija izobličenja. Opisati pojavu slušnog maskiranja i diskutirati kako se navedena pojava može iskoristiti u svrhu boljeg kodiranja govornog signala (maji broj bita za prijenos uz istu kvalitetu reproduciranog signala). Algoritme za obradu govornog signala potrebno je realizirati u programskom paketu Matlab, te istražiti ovisnost subjektivne i objektivne kvalitete o parametrima analize. Provjeru je potrebno provesti za stvarne govorne signale snimljene za više muških i ženskih govornika. Istražiti i mogućnost implementacije navedenih algoritama u stvarnom vremenu uz pomoć procesora za digitalnu obradu signala ADSP 2181. Istražiti kako konačna dužina riječi utječe na kvalitetu kodera.

[povratak na vrh stranice]

Kodiranje govora u frekvencijskoj domeni

Potrebno je istražiti postupke kodiranja govornog signala u frekvencijskoj domeni. Pri tome je potrebno analizirati strukture temeljene na pojasnom kodiranju (engl. sub-band coding), kao i postupke temeljene na transformacijskom kodiranju (engl. transform coding). Kodiranje pojasnih signala, odnosno transformacijskih koeficijenata provesti korištenjem adaptivnih PCM tehnika. Istražiti kako na kvalitetu reproduciranog signala utječu: tip transformacije (odnosno tip analizirajuće filtarske banke), način alokacije bitova pojedinim koeficijentima (odnosno pojasnim signalima) i postupci adapatacije veličine koraka za kvantizaciju. U svrhu bolje prilagodbe sustava kodiranja stvarnom govornom signalu, potrebno je primjenitit postupke dinamičke alokacije bitova, temeljene na Vocoder modelu govornog signala. Algoritme za obradu govornog signala potrebno je realizirati u programskom paketu Matlab, te istražiti ovisnost kvalitete o parametrima analize. Provjeru je potrebno provesti za stvarne govorne signale snimljene za više muških i ženskih govornika. Istražiti i mogućnost implementacije navedenih algoritama u stvarnom vremenu uz pomoć procesora za digitalnu obradu signala ADSP 2181. Istražiti kako konačna dužina riječi utječe na kvalitetu kodera.

[povratak na vrh stranice]

Višepojasno pobuđeni koder govornog signala

Potrebno je istražiti mogućnost poboljšanja Vocoder tehnike kodiranja govornog signala korištenjem složenijeg modela pobudnog signala. Nakon određivanja osnovne frekvencije zvučnog govornog segmenta, potrebno je za svaki harmonik osnovne frekvencije ustanoviti njegovu zvučnost. Svi zvučno identificirani harmonici modeliraju se pomoću harmonijskih oscilatora, dok se bezvučni frekvencijski pojasevi modeliraju korištenjem izvora bijelog šuma, spektralno ograničenog na promatrani pojas. Usporediti kvalitetu ovog modela s klasičnim Vocoder modelom koji koristi samo jedan bit za kodiranje informacije o zvučnosti. Istražiti kako razumljivost reproduciranog govora ovisi o prisutnosti dodatnog šuma za oba modela kodiranja. Algoritme za obradu govornog signala potrebno je realizirati u programskom paketu Matlab. Provjeru je potrebno provesti za stvarne govorne signale snimljene za više muških i ženskih govornika. Istražiti i mogućnost implementacije navedenih algoritama u stvarnom vremenu uz pomoć procesora za digitalnu obradu signala ADSP 2181. Istražiti kako konačna dužina riječi utječe na kvalitetu kodera

[povratak na vrh stranice]

Određivanje frekvencija spektralnih linija interpolacijom amplitudno frekvencijske karakteristike pomoćnih polinoma

U okviru diplomskog rada je potrebno detaljno proučiti postupak određivanja frekvencija spektralnih linija (LSF) koje se koriste za kodiranje spektralne ovojnice govornog signala. Postupak je temeljen na transformaciji polinoma nazivnika filtra linearne predikcije u dva pomoćna polinoma od kojih jedan ima simetrične a drugi anti?simetrične koeficijente. U svrhu određivanja LSF-a potrebno je odrediti korijene ovih pomoćnih polinoma koji se nalaze na jediničnoj kružnici u z-domeni. Potrebno je izračunati realne amplitudne karakteristike ovih polinoma uz nulti fazni pomak, te odrediti frekvencije u kojima amplitudna karakteristika mijenja predznak. Početno određivanje pozicija nultočaka treba se ostvariti otipkavanjem vrijednosti amplitudne karakteristike u N ekvidistantnih frekvencijskih točaka. Poboljšanje rezultata ostvariti primjenom linearne interpolacije između točaka u kojima dolazi do promjene predznaka. U svrhu verifikacije, cjelokupni postupak je potrebno simulirati u programskom paketu Matlab, te ocijeniti točnost postupka kao funkciju svih parametara analize. Provjera se mora provesti na stvarnim govornim bazama snimljenim za više govornika ukupnog trajanja barem 10 minuta. Algoritam je potrebno prilagoditi i za izvođenje na procesorima sa cjelobrojnom aritmetikom. Potrebno je razviti program za digitalni procesor za obradu signala ADSP2181 u asembleru, te provjeriti točnost postupka usporedbom s rezultatima simulacije u Matlabu. Provesti i analizu složenosti postupka, tj. potrebnog vremena izvršavanja zavisno o parametrima analize.

[povratak na vrh stranice]

Filtri za uklanjanje periodičnosti pri kodiranju govornog signala

U okviru diplomskog rada potrebno je proučiti postupke automatskog projektiranja predikcijskog FIR filtara za uklanjanje periodičnosti govornog signala. Namjena ovih filtara je smanjenje varijance govornog signala prije njegove kvantizacije, u svrhu učinkovitijeg kodiranja. Obzirom da se ovi filtri redovito koriste u kombinaciji s predikcijskim filtrima za uklanjanje formantne strukture govornog signala, potrebno je provesti i analizu njihovog zajedničkog djelovanja. Adaptaciju ovih filtara potrebno je provesti na blokovskoj osnovi korištenjem postupka linearne predikcije. Zbog toga je potrebno proučiti postupke linearne predikcije temeljene na metodi autokorelacije i kovarijance, kao i linearnu predikciju temeljenu na mrežastoj strukturi. Diskutirati postupke određivanja optimalnih koeficijenata prediktora za sve tri navedene metode, kao i osnove značajke ovih postupaka. Obzirom da je struktura oba predikcijska filtra slična, analizu je potrebno provesti na strukturi s općenitim pomakom (kašnjenjem). U okviru rada je potrebno provesti analizu dobitka predikcijskog kodiranja zavisno o brojnim parametrima analize (stupnju predikcijskih filtara, postupku određivanja pomaka, kao i redoslijedu filtara), Simulaciju algoritma je potrebno provesti u programskom paketu Matlab, a postupak je potrebno i verificirati njegovom izvedbom na cjelobrojnom procesoru za digitalnu obradu signala ADSP2181. Diskutirati probleme vezane uz cjelobrojnu izvedbu, te ocijeniti točnosti i složenost postupka, kao funkciju parametara analize.

[povratak na vrh stranice]

Prepoznavanje govora primjenom procesora za digitalnu obradu signala

U okviru diplomskog rada je potrebno je razviti sustav za automatsko prepoznavanje govornog signala temeljen na maketi EZKIT-Lite sa cjelobrojnim procesorom za digitalnu obradu signala ADSP2181. Statističko modeliranje riječi i njihovo prepoznavanje treba temeljiti na skrivenim Markovljevim modelima (HMM). Diskutirati modele s diskretnim i polu-kontinuiranim opservacijama, te usporediti njihovu složenosti i točnost prepoznavanja. Gradnju modela svake pojedine riječi provesti postupkom maksimalne vjerojatnosti (MLE), na osnovu akustičke baze s barem 10 izgovora iste riječi od strane više govornika. Kao karakteristične vektore potrebno je koristiti obične kepstralne vektore, kao i MFCC vektore, te usporediti točnosti prepoznavanja za oba tipa vektora. Gradnju modela provesti van stvarnog vremena korištenjem programskog paketa Matlab. Postupak prepoznavanja je potrebno izvesti i u okviru Matlab-a, kao i korištenjem DSP procesora. Diskutirati problem brzine izvođenja, kao i potrebne memorije potrebne za pohranu modela riječi, kao funkciju tipa Markovljevih modela (diskretni ili polu-kontinuirani) i kao funkciju tipa karakterističnog vektora.

[povratak na vrh stranice]

Prediktivna vektorska kvantizacija frekvencija spektralnih linija govornog signala

U okviru diplomskog rada potrebno je proučiti postupak prediktivne vektorske kvantizacije (PVQ) frekvencija spektralnih linija (LSF) govornog signala. Naročito obratiti pažnju na postupak korištenjem preklapanih prediktora (engl. Switched-Adaptive Interframe Vector Prediction). Proučiti postojeći algoritam za simulaciju ostvaren u programskom paketu Matlab. Na temelju njega napraviti algoritam u Matlabu prilagođen za rad s cjelobrojnim aritmetikom, a zatim postupak realizirati na cjelobrojnom procesoru za digitalnu obradu signala ADSP2181. Pri izradi programa voditi računa o brzini izvođenja. Diskutirati probleme vezane uz cjelobrojnu izvedbu, te ocijeniti točnosti i složenost postupka, kao funkciju parametara analize. Provjeru rada sustava temeljiti na stvarnoj govornoj bazi.

[povratak na vrh stranice]

Kodiranje govora postupkom interpolacije karakterističnih valnih oblika

U okviru diplomskog rada je potrebno proučiti kodere govornog signala koji su temeljeni na interpolaciji karakterističnih valnih oblika decimiranih glotalnih pulseva (engl. prototype waveform interpolation). Potrebno je razviti programe za analizu govornog signala koji će formirati valnu plohu u fazno/vremenskoj domeni. Istražiti postupke kojima se ta ploha razdvaja na sporo i brzo promjenjiv dio (SEW i REW), te ukratko prodiskutirati metode učinkovite kvantizacije parametara tih ploha. Razviti i odgovarajuće postupke za sintezu govornog signala na osnovi kvantiziranih parametara. Sve programe razviti u okviru programskog paketa Matlab.

[povratak na vrh stranice]

Implementacija kriptografskog algoritma Rijndael na procesoru za digitalnu obradu signala

U okviru diplomskog zadatka protrebno je proučiti novi standard za blok-kriptografiju s tajnim ključem pod originialnim nazivom "Advanced Encryption Standard", AES. Odabrani kriptografski algoritam se zove Rijndael, a sva pripadajuća dokumentacija i izvorni kodovi u programskom jeziku C su dostupni na www.nist.gov/aes. Potrebno je detaljno proučiti način rada algoritma, te istražiti mogućnosti implementacije navedenog algoritma na procesoru za digitalnu obradbu signala ADSP2181, Analog Devices. Istražiti kako je moguće internu arhitekturu 16-bitne aritmetičko logičke (ALU) jedinice pocesora iskoristiti za učinkovitu implementaciju. Posebnu pažnju posvetiti korištenju više-funkcijskih instrukcija koje u sebi pored ALU operacije sadrže i jedan ili više dohvata operanada ili pohranu rezultata. Odrediti zahtjeve na programsku i podatkovnu memoriju, te maksimalnu brzinu izvođenja, tj. kriptiranja ulaznih podataka u stvarnom vremenu. Dobivene rezultate usporediti sa rezultatima C-implementacije na PC računalu.

[povratak na vrh stranice]

Višestupanjska vektorska kvantizacija s kodnim knjigama projektiranim sekvencijalnim-iterativnim postupkom

U okviru diplomskog rada potrebno je proučiti postupak višestupanjske vektorske kvantizacije (MSVQ). Posebno je istražiti same postupke kvantizacije tj. kodiranje, kao i postupke projektiranja optimalnih kodnih knjiga za kvantizaciju. Napraviti pregled poznatih postupaka kvantizacije, te s teoretskog stanovišta usporediti MSVQ postupak s razlomljenom vekotrskom kvantizacijom (SplitVQ), odnoso kvantizacijom s pretraživanjem po stablu (TSVQ). Proučiti kako različiti postupci projektiranja kodnih knjiga poznati u literaturi utječu na kvalitetu ostvarenog sustava. Posebnu pažnju posvetiti suboptimalnim tehnikama projektiranja, kao što je sekvencijalni-iterativni postupak. Postupke za projektiranje kodnih knjiga i postupke za kodiranje i evaluaciju rezultata kodiranja implementirati u okviru programskog paketa Matlab. Svojstva sustava potrebno je demonstrirati na kodiranju vektora frekvencijskih linija u svrhu učinkovite kvantizacije spektralne ovojnice govornog signala. Prodiskutirati i aspekte stvarne izvedbe sustava za kodiranje na procesoru za digitalnu obradbu signala (DSP).

[povratak na vrh stranice]

 

Sveučilište u Zagrebu - FER - ZESOI - LSS - DOG
© 2002. Zavod za elektroničke sustave i obradbu informacija.
Ukoliko imate pitanja ili komentara o ovim stranicama obratite se webmasteru.