ITI43210 Maskinlæring (Vår 2014)

Fakta om emnet

Studiepoeng:
15
Ansvarlig avdeling:
Fakultet for informasjonsteknologi, ingeniørfag og økonomi
Emneansvarlig:
Roland Olsson
Undervisningsspråk:
Engelsk
Varighet:
½ år

Emnet er tilknyttet følgende studieprogram

Obligatorisk emne for masterstudiet i anvendt informatikk.

Undervisningssemester

2. semester (vår)

Studentens læringsutbytte etter bestått emne

Kunnskap

Etter endt emne skal studenten

  • ha oversikt over alle de viktigste metodene innen maskinlæring og ha dypere kunnskaper om tre av dem, nemlig beslutningstrær, nevrale nettverk og evolutionary computation.
  • ha kunnskap om de utfordringer som i praksis finnes med data mining, for eksempel overfitting, manglende verdier og klassifiseringer som har forskjellig kostnad.
  • ha fått bedre kunnskaper i grunnleggende emner som numerisk optimering og statistiske metoder relatert til machine learning, for eksempel Bayesianske metoder brukt av søkemotorer som Google og i spam filter.

Ferdigheter

Etter endt emne skal studentene kunne

  • tilrettelegge eller kode om data slik at det passer for data mining og maskinlæringsalgoritmer.
  • velge rett verktøy for en gitt type data.
  • avgjøre hvor gode resultater man faktisk har ved hjelp av enkel statistisk analyse av for eksempel klassifiseringsnøyaktighet.
  • bruke maskinlæring i praktiske applikasjoner og selv kunne overføre maskinlærings modeller til kode i et programmeringsspråk.


Generell kompetanse

Kandidaten skal ha bedret sin evne til utvikling og forskning, som krever at en selv finner referanser og skjønner disse godt. En annen generell kompetanse er evne til vitenskaplig skriving på engelsk som legger grunnen for å kunne skrive en masteroppgave.

Videre gir emnet bedret kompetanse til å behandle og analysere data av vilkårlig type, selv om dette gjøres uten bruk av induktiv læring.

Innhold

Maskinlæring innebærer at datamaskiner lærer seg gjennom trening og erfaring istedenfor å bli eksplisitt programmert for en gitt oppgave. Studentene skal i dette emnet bli kjent med flere forskjellige metoder og algoritmer for maskinlæring. Ut fra dette skal studentene kunne velge noen passende av disse metodene når han eller hun står overfor et nytt problem der maskinlæring kan brukes.

Emnet gir forståelse for grunnleggende egenskaper som er felles for alle metoder for maskinlæring. Noen eksempler på slike egenskaper er generaliserende evne og heuristisk søking.

Emnet inneholder tre prosjekter, et for beslutningstrær, regler og regresjonsanalyse, et for nevrale nett og et for evolutionary computation.

Induksjon av beslutningstrær og noen applikasjoner som medisinsk diagnostikk og kredittvurdering.

Kunstige nevrale nett og treningsalgoritmer for dem, for eksempel steepest descent og trust region Newton metoder som er klassiske teknikker for numerisk optimering. Applikasjoner som behandling av lyd og bilder.

Grunnleggende teori for maskinlæring som Bayes formel, maximum likelihood og minimum description length prinsippet.

Instanse basert læring, for eksempel nearest neighbour, lokalt vektet regresjon og radielle basisfunksjoner.

Evolutionary computation, spesielt genetiske algoritmer og genetisk programmering. Generelle prinsipper for evolusjon. Seleksjonsmetoder og genetiske operatorer som mutasjon og overkryssning. Baldwin-effekten.

Algoritmer for lokal og global optimering, for eksempel tabusøk, simulated annealing og genetiske algoritmer.

Noen av emnets temaer trenger elementær informasjonsteori og statistikk. Dette undervises etter behov.

Undervisnings- og læringsformer

Timer pr. uke: 2 timer forelesning pluss timer for veiledning med møteplikt hver uke.

Eksamen

Mappevurdering og hjemmeeksamen
Eksamen består av både mappeeksamen og hjemmeeksamen.

Mappen (teller 65 %) består av:

  • ett prosjekt innen beslutningstrær
  • ett prosjekt innen nevrale nett
  • ett prosjekt om automatisk programmering (teller til sammen 65 %).

Prosjektene kan gjennomføres individuelt eller i grupper på to og to studenter.

Hjemmeeksamen er en individuell, 3 dagers eksamen med teorispørsmål (teller 35%).

Det settes en samlet, individuell karakter. Det benyttes karakterskala A - F.

Ved ny og utsatt eksamen avtales prosjektleveransene og ny hjemmeeksamen med emneansvarlig.

Evaluering av emnet

Dette emnet evalueres på følgende måte:

- Midtsemesterevaluering (frivillig)
- Sluttevaluering (obligatorisk)

Den emneansvarlige lager en emnerapport på bakgrunn av studentenes tilbakemeldinger og sine egne erfaringer med emnet. Emnerapporten behandles av studiekvalitetsutvalget ved avdeling for informasjonsteknologi.

Litteratur


Litteraturlisten sist oppdatert våren 2010.

Machine Learning, Tom. M. Mitchell, McGraw-Hill Higher Education; ISBN: 0070428077

Sist hentet fra Felles Studentsystem (FS) 16. juni 2024 02:45:35