Diplomski radovi iz područja
digitalne obrade govora.
Studenti koji su slušali predmet Digitalna obrada govora i koji
su kao mentora odabrali doc. Davora Petrinovića su za diplomski
rad imali temu vezanu uz digitalnu obradu govora. U tablici je prikazan
smjer i godina diplomiranja za svakog studenta. Za novije diplomske
radove je priložen i tekst zadatka.
Prediktivno kodiranje govornog
signala uz subjektivni kriterij pogreške
Potrebno je istražiti mogućnosti kodiranja govornog signala korištenjem
postupaka linearne predikcije uz uvažavanje subjektivnog kriterija
izobličenja. Opisati pojavu slušnog maskiranja i diskutirati kako
se navedena pojava može iskoristiti u svrhu boljeg kodiranja govornog
signala (maji broj bita za prijenos uz istu kvalitetu reproduciranog
signala). Algoritme za obradu govornog signala potrebno je realizirati
u programskom paketu Matlab, te istražiti ovisnost subjektivne i
objektivne kvalitete o parametrima analize. Provjeru je potrebno
provesti za stvarne govorne signale snimljene za više muških i ženskih
govornika. Istražiti i mogućnost implementacije navedenih algoritama
u stvarnom vremenu uz pomoć procesora za digitalnu obradu signala
ADSP 2181. Istražiti kako konačna dužina riječi utječe na kvalitetu
kodera.
[povratak na vrh stranice]
Kodiranje govora u frekvencijskoj
domeni
Potrebno je istražiti postupke kodiranja govornog signala u frekvencijskoj
domeni. Pri tome je potrebno analizirati strukture temeljene na
pojasnom kodiranju (engl. sub-band coding), kao i postupke temeljene
na transformacijskom kodiranju (engl. transform coding). Kodiranje
pojasnih signala, odnosno transformacijskih koeficijenata provesti
korištenjem adaptivnih PCM tehnika. Istražiti kako na kvalitetu
reproduciranog signala utječu: tip transformacije (odnosno tip analizirajuće
filtarske banke), način alokacije bitova pojedinim koeficijentima
(odnosno pojasnim signalima) i postupci adapatacije veličine koraka
za kvantizaciju. U svrhu bolje prilagodbe sustava kodiranja stvarnom
govornom signalu, potrebno je primjenitit postupke dinamičke alokacije
bitova, temeljene na Vocoder modelu govornog signala. Algoritme
za obradu govornog signala potrebno je realizirati u programskom
paketu Matlab, te istražiti ovisnost kvalitete o parametrima analize.
Provjeru je potrebno provesti za stvarne govorne signale snimljene
za više muških i ženskih govornika. Istražiti i mogućnost implementacije
navedenih algoritama u stvarnom vremenu uz pomoć procesora za digitalnu
obradu signala ADSP 2181. Istražiti kako konačna dužina riječi utječe
na kvalitetu kodera.
[povratak na vrh stranice]
Višepojasno pobuđeni koder govornog
signala
Potrebno je istražiti mogućnost poboljšanja Vocoder tehnike kodiranja
govornog signala korištenjem složenijeg modela pobudnog signala.
Nakon određivanja osnovne frekvencije zvučnog govornog segmenta,
potrebno je za svaki harmonik osnovne frekvencije ustanoviti njegovu
zvučnost. Svi zvučno identificirani harmonici modeliraju se pomoću
harmonijskih oscilatora, dok se bezvučni frekvencijski pojasevi
modeliraju korištenjem izvora bijelog šuma, spektralno ograničenog
na promatrani pojas. Usporediti kvalitetu ovog modela s klasičnim
Vocoder modelom koji koristi samo jedan bit za kodiranje informacije
o zvučnosti. Istražiti kako razumljivost reproduciranog govora ovisi
o prisutnosti dodatnog šuma za oba modela kodiranja. Algoritme za
obradu govornog signala potrebno je realizirati u programskom paketu
Matlab. Provjeru je potrebno provesti za stvarne govorne signale
snimljene za više muških i ženskih govornika. Istražiti i mogućnost
implementacije navedenih algoritama u stvarnom vremenu uz pomoć
procesora za digitalnu obradu signala ADSP 2181. Istražiti kako
konačna dužina riječi utječe na kvalitetu kodera
[povratak na vrh stranice]
Određivanje frekvencija spektralnih
linija interpolacijom amplitudno frekvencijske karakteristike pomoćnih
polinoma
U okviru diplomskog rada je potrebno detaljno proučiti postupak
određivanja frekvencija spektralnih linija (LSF) koje se koriste
za kodiranje spektralne ovojnice govornog signala. Postupak je temeljen
na transformaciji polinoma nazivnika filtra linearne predikcije
u dva pomoćna polinoma od kojih jedan ima simetrične a drugi anti?simetrične
koeficijente. U svrhu određivanja LSF-a potrebno je odrediti korijene
ovih pomoćnih polinoma koji se nalaze na jediničnoj kružnici u z-domeni.
Potrebno je izračunati realne amplitudne karakteristike ovih polinoma
uz nulti fazni pomak, te odrediti frekvencije u kojima amplitudna
karakteristika mijenja predznak. Početno određivanje pozicija nultočaka
treba se ostvariti otipkavanjem vrijednosti amplitudne karakteristike
u N ekvidistantnih frekvencijskih točaka. Poboljšanje rezultata
ostvariti primjenom linearne interpolacije između točaka u kojima
dolazi do promjene predznaka. U svrhu verifikacije, cjelokupni postupak
je potrebno simulirati u programskom paketu Matlab, te ocijeniti
točnost postupka kao funkciju svih parametara analize. Provjera
se mora provesti na stvarnim govornim bazama snimljenim za više
govornika ukupnog trajanja barem 10 minuta. Algoritam je potrebno
prilagoditi i za izvođenje na procesorima sa cjelobrojnom aritmetikom.
Potrebno je razviti program za digitalni procesor za obradu signala
ADSP2181 u asembleru, te provjeriti točnost postupka usporedbom
s rezultatima simulacije u Matlabu. Provesti i analizu složenosti
postupka, tj. potrebnog vremena izvršavanja zavisno o parametrima
analize.
[povratak na vrh stranice]
Filtri za uklanjanje periodičnosti
pri kodiranju govornog signala
U okviru diplomskog rada potrebno je proučiti postupke automatskog
projektiranja predikcijskog FIR filtara za uklanjanje periodičnosti
govornog signala. Namjena ovih filtara je smanjenje varijance govornog
signala prije njegove kvantizacije, u svrhu učinkovitijeg kodiranja.
Obzirom da se ovi filtri redovito koriste u kombinaciji s predikcijskim
filtrima za uklanjanje formantne strukture govornog signala, potrebno
je provesti i analizu njihovog zajedničkog djelovanja. Adaptaciju
ovih filtara potrebno je provesti na blokovskoj osnovi korištenjem
postupka linearne predikcije. Zbog toga je potrebno proučiti postupke
linearne predikcije temeljene na metodi autokorelacije i kovarijance,
kao i linearnu predikciju temeljenu na mrežastoj strukturi. Diskutirati
postupke određivanja optimalnih koeficijenata prediktora za sve
tri navedene metode, kao i osnove značajke ovih postupaka. Obzirom
da je struktura oba predikcijska filtra slična, analizu je potrebno
provesti na strukturi s općenitim pomakom (kašnjenjem). U okviru
rada je potrebno provesti analizu dobitka predikcijskog kodiranja
zavisno o brojnim parametrima analize (stupnju predikcijskih filtara,
postupku određivanja pomaka, kao i redoslijedu filtara), Simulaciju
algoritma je potrebno provesti u programskom paketu Matlab, a postupak
je potrebno i verificirati njegovom izvedbom na cjelobrojnom procesoru
za digitalnu obradu signala ADSP2181. Diskutirati probleme vezane
uz cjelobrojnu izvedbu, te ocijeniti točnosti i složenost postupka,
kao funkciju parametara analize.
[povratak na vrh stranice]
Prepoznavanje govora primjenom
procesora za digitalnu obradu signala
U okviru diplomskog rada je potrebno je razviti sustav za automatsko
prepoznavanje govornog signala temeljen na maketi EZKIT-Lite sa
cjelobrojnim procesorom za digitalnu obradu signala ADSP2181. Statističko
modeliranje riječi i njihovo prepoznavanje treba temeljiti na skrivenim
Markovljevim modelima (HMM). Diskutirati modele s diskretnim i polu-kontinuiranim
opservacijama, te usporediti njihovu složenosti i točnost prepoznavanja.
Gradnju modela svake pojedine riječi provesti postupkom maksimalne
vjerojatnosti (MLE), na osnovu akustičke baze s barem 10 izgovora
iste riječi od strane više govornika. Kao karakteristične vektore
potrebno je koristiti obične kepstralne vektore, kao i MFCC vektore,
te usporediti točnosti prepoznavanja za oba tipa vektora. Gradnju
modela provesti van stvarnog vremena korištenjem programskog paketa
Matlab. Postupak prepoznavanja je potrebno izvesti i u okviru Matlab-a,
kao i korištenjem DSP procesora. Diskutirati problem brzine izvođenja,
kao i potrebne memorije potrebne za pohranu modela riječi, kao funkciju
tipa Markovljevih modela (diskretni ili polu-kontinuirani) i kao
funkciju tipa karakterističnog vektora.
[povratak na vrh stranice]
Prediktivna vektorska kvantizacija
frekvencija spektralnih linija govornog signala
U okviru diplomskog rada potrebno je proučiti postupak prediktivne
vektorske kvantizacije (PVQ) frekvencija spektralnih linija (LSF)
govornog signala. Naročito obratiti pažnju na postupak korištenjem
preklapanih prediktora (engl. Switched-Adaptive Interframe Vector
Prediction). Proučiti postojeći algoritam za simulaciju ostvaren
u programskom paketu Matlab. Na temelju njega napraviti algoritam
u Matlabu prilagođen za rad s cjelobrojnim aritmetikom, a zatim
postupak realizirati na cjelobrojnom procesoru za digitalnu obradu
signala ADSP2181. Pri izradi programa voditi računa o brzini izvođenja.
Diskutirati probleme vezane uz cjelobrojnu izvedbu, te ocijeniti
točnosti i složenost postupka, kao funkciju parametara analize.
Provjeru rada sustava temeljiti na stvarnoj govornoj bazi.
[povratak na vrh stranice]
Kodiranje govora postupkom interpolacije
karakterističnih valnih oblika
U okviru diplomskog rada je potrebno proučiti kodere govornog
signala koji su temeljeni na interpolaciji karakterističnih valnih
oblika decimiranih glotalnih pulseva (engl. prototype waveform interpolation).
Potrebno je razviti programe za analizu govornog signala koji će
formirati valnu plohu u fazno/vremenskoj domeni. Istražiti postupke
kojima se ta ploha razdvaja na sporo i brzo promjenjiv dio (SEW
i REW), te ukratko prodiskutirati metode učinkovite kvantizacije
parametara tih ploha. Razviti i odgovarajuće postupke za sintezu
govornog signala na osnovi kvantiziranih parametara. Sve programe
razviti u okviru programskog paketa Matlab.
[povratak na vrh stranice]
Implementacija kriptografskog
algoritma Rijndael na procesoru za digitalnu obradu signala
U okviru diplomskog zadatka protrebno je proučiti novi standard
za blok-kriptografiju s tajnim ključem pod originialnim nazivom
"Advanced Encryption Standard", AES. Odabrani kriptografski
algoritam se zove Rijndael, a sva pripadajuća dokumentacija i izvorni
kodovi u programskom jeziku C su dostupni na www.nist.gov/aes.
Potrebno je detaljno proučiti način rada algoritma, te istražiti
mogućnosti implementacije navedenog algoritma na procesoru za digitalnu
obradbu signala ADSP2181, Analog Devices. Istražiti kako je moguće
internu arhitekturu 16-bitne aritmetičko logičke (ALU) jedinice
pocesora iskoristiti za učinkovitu implementaciju. Posebnu pažnju
posvetiti korištenju više-funkcijskih instrukcija koje u sebi pored
ALU operacije sadrže i jedan ili više dohvata operanada ili pohranu
rezultata. Odrediti zahtjeve na programsku i podatkovnu memoriju,
te maksimalnu brzinu izvođenja, tj. kriptiranja ulaznih podataka
u stvarnom vremenu. Dobivene rezultate usporediti sa rezultatima
C-implementacije na PC računalu.
[povratak na vrh stranice]
Višestupanjska vektorska kvantizacija
s kodnim knjigama projektiranim sekvencijalnim-iterativnim postupkom
U okviru diplomskog rada potrebno je proučiti postupak višestupanjske
vektorske kvantizacije (MSVQ). Posebno je istražiti same postupke
kvantizacije tj. kodiranje, kao i postupke projektiranja optimalnih
kodnih knjiga za kvantizaciju. Napraviti pregled poznatih postupaka
kvantizacije, te s teoretskog stanovišta usporediti MSVQ postupak
s razlomljenom vekotrskom kvantizacijom (SplitVQ), odnoso kvantizacijom
s pretraživanjem po stablu (TSVQ). Proučiti kako različiti postupci
projektiranja kodnih knjiga poznati u literaturi utječu na kvalitetu
ostvarenog sustava. Posebnu pažnju posvetiti suboptimalnim tehnikama
projektiranja, kao što je sekvencijalni-iterativni postupak. Postupke
za projektiranje kodnih knjiga i postupke za kodiranje i evaluaciju
rezultata kodiranja implementirati u okviru programskog paketa Matlab.
Svojstva sustava potrebno je demonstrirati na kodiranju vektora
frekvencijskih linija u svrhu učinkovite kvantizacije spektralne
ovojnice govornog signala. Prodiskutirati i aspekte stvarne izvedbe
sustava za kodiranje na procesoru za digitalnu obradbu signala (DSP).
[povratak na vrh stranice]
|