Hoofdpagina | Bachelor in het informaticamanagement en de multimedia
Datawarehousing
Bachelor in het informaticamanagement en de multimedia |
2010-11 |
nvt |
IM_400 |
4 |
120 uur |
Derde Programmajaar |
Ja |
Ja |
Ja |
Verplicht |
Punt op 20 |
Ja |
Ja |
Docenten
Onderwijstaal
Onderwijsvorm
Begincompetentie
Geroutineerd zijn in het gebruik van SQL en PL-SQL.
Eindcompetentie
IM_AC_01 | IM_AC_01 - Kwaliteitsvol handelen door problemen o.m. flexibel, creatief en nauwkeurig op te lossen. | Doorgroeiniveau |
IM_AC_02 | IM_AC_02 - Opbouwen van een kwaliteitsvolle redenering. | Doorgroeiniveau |
IM_AC_03 | IM_AC_03 - Verwerven en verwerken van informatie. | Integratieniveau |
IM_AC_08 | IM_AC_08 – Klantgericht denken en handelen. | Doorgroeiniveau |
IM_BS_IMS_04 | IM_BS_IMS_04 - Ondersteunen van het bedrijfsbeleid. | Integratieniveau |
IM_BS_IMS_06 | IM_BS_IMS_06 - Realiseren van een informatie-infrastructuur. | Integratieniveau |
IM_BS_IMS_08 | IM_BS_IMS_08 - Databanken ontwerpen. | Integratieniveau |
IM_BS_IMS_08 | IM_BS_IMS_08 - Databanken ontwerpen. | Doorgroeiniveau |
Leerresultaten
De student moet kunnen
- de ETL (Extract-Transform-Load) van een datawarehouse organiseren en automatiseren, zowel a.d.h.v. PL-SQL als via een ETL-tool.
- legacy-gegevens analyseren wat betreft mogelijke fouten en deze gegevens cleansen, in samenspraak met eindgebruikers en/of management.
- een stermodel en een busstructuur ontwerpen voor een datawarehouse.
- een stermodel aanpassen aan bijzondere situaties (slowly changing dimensions, junk dimensions, demografiedimensies, ...)
- management-rapporteringen maken via SQL, op basis van gegevens in een datawarehouse.
Inhoud
KENNEN:
Het onderscheid tussen
• enerzijds operationele database en anderzijds datawarehouse,
• enerzijds datawarehouse en anderzijds datamart.
• enerzijds ER-modelleren en anderzijds dimensioneel modelleren (incl. redenen kennen voor normalisatie en denormalisatie).
De regels en methoden van het dimensioneel modelleren.
Verder ook het verplicht studiemateriaal (lectuur KIMBALL).
KUNNEN
• gegevens extraheren en manipuleren (datatransformatie).
• gegevens cleanen (zuiveren van fouten).
• een dimensioneel model ontwerpen en opvullen met de nodige data (sterschema's opvullen).
• Slowly changing dimensions definiëren en voorzien van data.
• gegevens via scripts laden in een dimensioneel model.
• fouten in queries, procedures en scripts oplossen.
• geavanceerde queries maken op een dimensioneel model.
• performance van queries verbeteren.
• een database en databasetools gebruiken om een datawarehouse te bouwen.
Alle bovenstaande technieken moeten zowel uitgevoerd kunnen worden met SQL en PLSQL als met meer geavanceerde datawarehousingtools.
Studiematerialen
Meer info op de cursussen- en boekenlijst.
Toledo (Digitale leeromgeving)
- Online studiemateriaal
- Opdrachten en studiemateriaal op Toledo
Evaluatie
Eerste examenkans | Eerste examenperiode (januari) | Tussentijdse evaluatie | 25% | | Eerste examenkans | Eerste examenperiode (januari) | Schriftelijk examen met computer | 75% | | Tweede examenkans | Derde examenperiode (augustus) | Mondeling examen met computer | 100% | |