Fakta om programmet
- Studiepoeng:
- 15
- Studiets varighet:
- ½ år
- Undervisningsspråk:
- Engelsk
- Studiested:
- Høgskolen i Østfold, studiested Halden
Studieplan for Big Data and Analytics (15 studiepoeng) (Høst 2017)
Informasjon om studiet
Dette er et betalingsstudium. For nærmere informasjon om studieavgift, vennligst se studiekatalog eller kontakt HiØ VIDERE.
Samfunnet er og blir i større og større grad digitalisert. Flere og flere av våre aktiviteter foregår på digitale arenaer. Fra kontakt med venner, familie og kolleger gjennom sosiale medier, til levering av selvangivelse, registrering av strømforbruk og bruk av medisinske målesystemer. Behovet for analyse av store datamengder blir bare større og større i dagens samfunn.
Målgruppen er personer som ønsker å øke sin kompetanse innen metoder for analyse av store datamengder.
Anbefalte forkunnskaper ut over opptakskravet (se nedenfor) er grunnleggende kompetanse i:
- programmering,
- lineær algebra,
- sannsynlighetsteori,
- statistikk,
- kalkulus og
- optimalisering.
Hva lærer du?
Studiets læringsutbytte
Kunnskap
Studenten
- har oversikt over alle de viktigste metodene innen dataanalyse.
- har kunnskap om de utfordringer som i praksis finnes innen dataanalyse, for eksempel overfitting, manglende verdier og klassifiseringer som har forskjellig kostnad.
- har fått bedre kunnskaper i grunnleggende emner som numerisk optimering og statistiske metoder relatert til dataanalyse, for eksempel Bayesianske metoder brukt av søkemotorer som Google og i spam filter.
Ferdigheter
Studenten kan
- tilrettelegge eller kode om data slik at det passer for dataanalyse og maskinlæringsalgoritmer.
- velge rett verktøy for en gitt type data.
- avgjøre hvor gode resultater man faktisk har ved hjelp av enkel statistisk analyse av for eksempel klassifiseringsnøyaktighet.
- bruke dataanalyse i praktiske applikasjoner.
Generell kompetanse
Studenten har kompetanse til å behandle og analysere data av vilkårlig type.
Opptak
Generell studiekompetanse eller realkompetanse.
Oppbygging og gjennomføring
Studiets oppbygging og innhold
Studiet består av ett emne med et omfang på 15 studiepoeng.
Dette emnet gir en bred introduksjon i dataanalyse og statistisk mønstergjenkjenning. Du blir kjent med klassiske, så vel som moderne dataanalysemetoder. I tillegg vil du lære om metodenes fordeler og ulemper, samt om når og hvordan du skal benytte dem.
Emnet tar for seg følgende temaer:
Del 1: Course Introduction, linear regression and logistic regression
Del 2: Overfitting problem, statistical view and probability density estimation
Del 3: Decision tree, Random forest, Bayesian Network and Hidden Markov Model
Del 4: Data pre-processing, generalization and advanced models
Organisering og læringsformer
Studiet går over ett semester med fire to-dagers samlinger på dagtid, totalt 8 dager. Det gis veiledning via e-post mellom samlingene.
Arbeidskrav: Minimum 75% deltakelse på undervisningssamlinger. Tilstedeværelse vil bli registrert. For at studenten skal kunne framstille seg til eksamen må arbeidskravet være godkjent senest 3 uker før eksamen.
Evaluering av studiet
For å kunne tilby en aktuell og relevant utdanning av god kvalitet er vi avhengige av studentenes tilbakemeldinger. Evaluering gjennomføres i henhold til høgskolens kvalitetssystem. Etter fullført studium evaluerer studentene studiet på elektronisk skjema fra HiØ VIDERE.
Vurdering
Mappevurdering
Mappen består av fire prosjekter. Det første prosjektet vil bli gitt etter første samling, det andre etter andre samling osv. Prosjektene skal gjennomføres individuelt eller i grupper på to og to.
Mappen vurderes som en helhet, og det gis én samlet, individuell karakter for mappen.
Karakterregel: Bestått/Ikke bestått.
Det benyttes enten to interne sensorer, eller en ekstern og en intern sensor.
Ved ny eksamen må hele mappen gjennomføres på nytt.
Plagiatkontroll
Alle skriftlige arbeidskrav og eksamensoppgaver kan plagiatkontrolleres. Plagiering og avskrift av faglitteratur og andre skriftlige arbeider uten korrekt bruk av referanser/kilder vil bli vurdert som forsøk på fusk. Se for øvrig Forskrift om eksamen og studierett ved Høgskolen i Østfold
Litteratur
Studiet baserer seg i hovedsak på forelesningsmateriale og webressurser.
Anbefalt litteratur:
- Tom. M. Mitchell, Machine Learning, 1997, McGraw-Hill Higher Education; ISBN: 0070428077
- M. Bishop, Neural Networks for Pattern Recognition, 1996.
- H. Witten, E. Frank and M. A. Hall, Data Mining: Practical Machine Learning Tools and Techniques, 2011.
- A. Ng, Machine Learning, Stanford University, online course.
- D. Koller, Probabilistic Graphical Models, Stanford University, online course.
- G. Hinton, Neural Networks for Machine Learning, University of Toronto, online course.
- M. Collins, Neural language Processing, Columbia University, online course.
Jobb og videre studier
Ønsker du ytterligere kompetanse innen dataanalyse, kan du søke deg til bachelorstudium i informatikk - design og utvikling av IT-systemer eller masterstudium i Applied Computer Science ved Høgskolen i Østfold dersom du fyller gjeldende krav til opptak.
Personer med kompetanse innenfor analyse av store datamengder vil i en økende digitalisert verden bli svært ettertraktede ressurser.