Beskjeder

Publisert 21. mai 2014 09:40

Spørretimen blir 4. June kl. 14:15, med både Aleksander og Pierre.  Beklager endringene.

Publisert 21. mai 2014 09:38

Læreboka:
* Kapitler 1-10
* Kapitler 12-15
* Kapitler 19 (fra 19.1 til 19.4), 20 (fra 20.1 til 20.3) og 21 (21.1 og 21.2)
(med andre ord: hele læreboka med unntak av kapitler 11, 16, 17, og 18)

Utvalgte utdelte artikler
* MapReduce: Simplified Data Processing on Large Clusters
* Suffix arrays: A new method for on-line string searches
* Tries for Approximate String Matching
* Efficient String Matching: An Aid to Bibliographic Search
* How to squeeze a lexicon (sans implementation details)
* Tightly Packed Tries: How to Fit Large Models into Memory, and Make them Load Fast, Too

Alle slides brukt i undervisningen
* Tilgjengelig fra hhv lærebokas hjemmeside og kursets hjemmeside

Alle øvingsoppgaver    
* Tilgjengelig fra kursets hjemmeside

 

Publisert 2. mai 2014 12:42

Timeplanen for resten av semesteret er oppdatert. Legg merke til at forelesningen onsdag 7/5 er avlyst.

Publisert 20. apr. 2014 20:43

Kommentarer til oppgavene i assignment D finner dere her.

Publisert 26. mars 2014 16:32

Programmeringsoppgaven i assignment C så ut til å ha falt vanskelig for mange. Tanken var at man skulle implementere en document-at-a-time løsning der man traverserer mange postinglister samtidig, og underveis sjekker N/M kravet og bruker et Sieve objekt for å holde rede på kun de dokumentene som rankeren gir høyest score. Se forøvrig også kommentarene i koden utgitt som en del av assignment D, eller slides 11-14 her. :-)

For penn-og-papir oppgavene finner dere noen kommentarer her.

Publisert 26. mars 2014 13:40

Slide settene fra Stanford som følger læreboka er ved en inkurie ikke lenger tilgjengelig fra lærebokas hjemmeside. Slidene kan derfor lastes ned herfra.

Publisert 28. feb. 2014 13:59

I perioden fra og med 4.3 til og med 8.4 blir det gjort noen mindre justeringer i gjennomføringen av gruppetimene:

  • Hverken jeg eller Pierre vil være tilstede på tirsdagene. Terminalstuene er fremdeles reservert til bruk for kurset, så klart.
  • Istedet vil jeg være igjen 1 time etter forelesningene på onsdagene (det vil si fra 16-17) for å svare på spørsmål i forbindelse med øvingene.
Publisert 18. feb. 2014 19:30

Noen tilleggsslides om komprimering til morgendagens forelesning er lagt ut her.

Publisert 8. feb. 2014 23:44

Som bakgrunnsmateriale til neste forelesning er det lagt ut en del artikler her. Alle artiklene er ikke pensum, noen av dem er ekstramateriale for spesielt interesserte. Dersom du bare vil skumme gjennom noen få av dem vil jeg anbefale:

  • Artikkelen om suffix arrays. Denne er direkte relevant til en kommende programmeringsoppgave på en øving.
  • Artikkelen om tries for approximate string matching. Beskriver hvordan man passe effektivt kan finne alle innslag i en ordbok innen en gitt edit distance fra en referansestreng.
  • Artikkelen om Aho-Corasick algoritmen. Relevant til en av tegn-og-fortell oppgavene på en øving.
  • Artikkelen om MapReduce. Ekstra bakgrunn for avsnitt 4.4 i læreboka om distribuert indeksering.
Publisert 29. jan. 2014 19:47

Som varslet i dagens forelesning, på grunn av reisevirksomhet blir det en mindre rokering på forelesningsplanen: Forelesningen 19. februar blir avholdt og likevel ikke avlyst. Istedet blir forelesningen 26. februar avlyst. Forelesningsplanen skal nå være oppdatert.

Publisert 28. jan. 2014 09:02

Slider og annet undervisningsmateriale som blir brukt i forelesningene blir lagt fortløpende ut i denne mappen. Unntaket er slides som tilhører læreboka, som kan lastes ned fra lærebokas hjemmeside.

Publisert 12. jan. 2014 16:33

There will only be one "gruppetime" per week this semester, on Tuesdays 10:15-12:00.  The schedule currently shown on the webpage (which indicates two gruppetimer per week) will be updated soon.

Publisert 12. jan. 2014 16:30

The course will start on Wednesday, 15th of January at 14:15 with a short overview of the practical organisation of the course this semester.