Hoofdpagina | Master of Science in de industriële wetenschappen: elektronica-ICT
Spraak- en beeldverwerking, theorie (1011MAeict04a)
Master of Science in de industriële wetenschappen: elektronica-ICT |
2010-11 |
2 |
60 uur |
|
|
Ja |
Ja |
Verplicht |
Punt op 20 |
Ja |
|
Docenten
Onderwijstaal
Onderwijsvorm
Begincompetentie
Signaalverwerking (0910ABAeict205) en Digitale signaalprocessing (0910ABAeict306) gevolgd hebben.
Eindcompetentie
MA_IV_01 - Probleemoplossend vermogen |
MA_IV_02 - Praktische vaardigheden |
MA_KI - Diepgaande technische kennis |
MA_OV_01 - Kritische reflectie en onderzoekende houding |
MA_OV_02 - Uitvoeren van onderzoek |
MA_OV_03 - Wetenschappelijke wijze denken en handelen |
Leerresultaten
De student:
heeft inzicht in diverse beeld- en spraakverwerkingsalgoritmes, KI
kan inschatten wat de hardware- en rekenkrachtconsequenties zijn van de beeld- en spraakverwerkingsalgoritmes, IV1
is creatief en kan kritisch reflecteren bij het modelleren en beschrijven van de beeld- en spraakverwerking algoritmes gebruikmakend van MATLAB/SIMULINK en de signal processing toolbox en –blockset en de image processing toolbox IV1,IV2,OV1
is creatief en kan kritisch interpreteren bij het visualiseren in MATLAB van de simulatie resultaten van de beeld- en spraakverwerkingsalgoritmes OV1,IV2
kan een gestructureerde en efficiënte MATLAB code opstellen KI,IV2,IV1
is zelfredzaamheid bij het gebruik van diverse MATLAB functies en de interpretatie van hun parameters, IV1,OV1
is resultaatgericht en kan de beeld- en spraakverwerking concepten demonstreren IV1
Inhoud
Basisbegrippen en spraak- en beeldverwerkingalgoritmes worden aangebracht en geanalyseerd. Het betreft fundamentele begrippen, zoals acquisitie, sampling, quantisatie en reconstructie die zowel in beeld- als audio omgeving worden toegelicht en met elkaar vergeleken.
Specifiek voor spraakverwerking wordt dieper ingegaan op frequentie analyse, equilazation, spectrogram representatie, het LPC spraakmodel en modellen voor audio effecten.
Beeldverbeteringsalgoritmes in het spatiaal domein zoals, grijswaarde resolutie, zero en eerste orde zoom, contrast stretching door diverse gray-level transformaties, histogram processing, spatiale filters worden gecombineerd met volgende topics:
Inleiding tot 2D-FFT van beelden en inverse FFT, om in het frequentie domein LP- en HP filtering van beelden toe te passen en de beeld kwaliteit te verbeteren.
Kleurmodellen (RGB HSI, CMY en CMYK) en kleurtransformatie, waziger maken en verscherpen van gekleurde beelden, segmenteren van gekleurde beelden.
Segmentatie en morfologische beeldverwerkingsalgoritmes: open, close, dilatie, erosie… worden ingeleid als preprocessing stappen van beeldherkenningsalgoritmes.
Studiematerialen
- Cursustekst “Introduction to Digital Image Processing ”.
- Cursustekst "Introduction to Speech and Audio Processing".
- Het cursusmateriaal is beschikbaar op Toledo in PDF en in ZIP voor wat betreft image-, audio- en matlab script library.
Evaluatie
Tweede examenkans | Derde examenperiode (augustus) | Schriftelijk examen met mondelinge voortzetting met computer | 100% | | Eerste examenkans | Eerste examenperiode (januari) | Schriftelijk examen met mondelinge voortzetting met computer | 100% | |