Undervisningsplan

DatoUndervises avStedTemaKommentarer / ressurser
31.05.2006Dan Flickinger (dpf), Tore Langholm (tl), and Stephan Oepen (oe)  3C, Informatikkbygningen  Motivation, Overview, Course Organization  Slide Copies 
05.09.2006oe  LNS Møterommet, Forskningsparken   The Typed Feature Structure Formalism  Slide Copies

Chapter 3 of Implementing Typed Feature Structure Grammars (Copestake, 2002)

Sections 11.1, 11.2, 11.3, and 11.6 in Jurafsky & Martin (2000) 

07.09.2006oe  3C, Informatikkbygningen  Linguistics in Typed Feature Structures  Chapter 2 and Sections 3.1 through 3.3.3 in Sag, Wasow, & Bender (2003) 
11.09.2006dpf & oe  100m-skogen, Forskningsparken  A Baby Grammar of English  Exercise 1 (Due at noon on 18-sep)

Chapter 2 (A first session with the LKB system) and Section 4.4 (The description language) of Copestake (2002) 

14.09.2006oe  3C, Informatikkbygningen   Categories and Rules  Slide Copies  
18.09.2006dpf & oe  100m-skogen, Forskningsparken   Modification  Exercise 2 (Due by 09:00 on 28-sep) 
21.09.2006dpf  3C, Informatikkbygningen   Fine Points of Modification  Slide Copies

Sections 4.1 through 4.6 in Sag, Wasow, & Bender (2003)  

25.09.2006oe  LNS Møterommet, Forskningsparken  Lisp  Slide Copies  
28.09.2006oe  3C, Informatikkbygningen   Bottom-Up Chart Parsing  Slide Copies

Lisp Games 

02.10.2006dpf  100m-skogen, Forskningsparken   Implementing the Parser  Exercise 3 (Due by 12:00 on 9-oct) 
05.10.2006tl    Litt grunnbegreper i sannsynlighetsteori, definisjon av N-gram, og noen enkle metoder for "smoothing".  Vi bruker utdrag fra kapittel 4 (ca. første halvdel) av den nye, planlagte versjonen av Jurafsky og Martin, som ligger online (som et pdf-dokument ) her. 
09.10.2006    INGEN GRUPPER/FORELESNINGER DENNE UKEN   
06.10.2006    INGEN GRUPPER/FORELESNINGER DENNE UKEN   
16.10.2006tl  LNS Møterommet, Forskningsparken   Tagging/HMM/Statistiske metoder  Merk stedet! Denne uken gjennomgår vi deler av kapittel 5 (til og med side 26) og 6 i nettversjonen av Jurafsky og Martin.

Obligatorisk oppgave 4 går ut på å implementere den såkalte "forward-algoritmen" for beregening av sannsynlighet for ordstrenger produsert av HMM'er. Les kapittel 6 i nettversjonen hos Jurafsky og Martin, og ta gjerne utganspunkt i disse leke-dataene som kommer sammen med en veldig ineffektiv algoritme for beregning av de samme sannsynlighetene. Innleveringsfrist er 26. oktober klokken 10.00.

 

19.10.2006tl    Tagging/HMM/Statistiske metoder  Vi snakker om Viterbi-algoritmen, med utganspunkt i denne presentasjonen fra University of Maryland. 
24.10.2006tl  100m-skogen, Forskningsparken  Tagging/HMM/Statistiske metoder  Øvelse. Merk ukedagen. Vi møtes altså tirsdag denne uken.

Løsningsforslag til oblig4 basert på innleverte besvarelser. 

26.10.2006  3C, Informatikkbygningen   lexical rules  Slide Copies 
31.10.2006dpf & oe  100m-skogen, Forskningsparken  lexical rules  Exercise 5 (Due by noon on 7-nov)

Sections 8.1, 8.2, 8.4 through 8.8 in Sag, Wasow, & Bender (2003)  

02.11.2006dpf  3C, Informatikkbygningen   semantics  Slide Copies 
07.11.2006oe  LNS Møterommet, Forskningsparken   graph unification  Sections 11.1, 11.2, and 11.4 of Jurafsky & Martin (2000)  
09.11.2006oe  100m-skogen, Forskningsparken  graph unification  Exercise 6 (Due by noon on 18-nov)

Model Solution  

14.11.2006oe  LNS Møterommet, Forskningsparken  unification-based parsing  Slide Copies

Background Reading: Wroblewski (1987) 

16.11.2006oe  100m-skogen, Forskningsparken  unification-based parsing   
21.11.2006tl  LNS Møterommet, Forskningsparken. (Tirsdag kl. 12.15-14.)  Probabilistiske kontekstfrie grammatikker.  Forelesning. Les gjerne s. 447-455 i Jurafsky og Martin på forhånd. 
23.11.2006tl    Forward--Backward-algoritmen for trening av HMM'er.  Vi ser på avsnitt 6.5 i nettversjonen av Jurafsky og Martin. 
28.11.2006tl  100m-skogen, Forskningsparken (Tirsdag kl. 12.15-14.)  Vi prøver å trene opp en HMM  Denne planen tar utgangspunkt i disse to (horrible) kodefilene.

Og her ligger et program som kaller opp forback mange ganger og langsomt endrer a- og b-tabellene. Spørsmålet nå er hvordan de to tabellene vil se ut etter for eksempel et kall som (tren 100). Men prøv mindre verdier først; dette tar tid.

For å se hvordan a- og b-tabellene ser ut etterpå, er det bare å evaluere de globale variablene a og b. Med litt hell bør disse etter hvert begynne å ligne på de tilsvarende lokale tabellene i funksjonen sample på filen generator.cl. En slik oppførsel er imidlertid ikke garantert, se side 18 her . Blant annet er de opprinnelige a- og b-tabellene viktige. Det er mulig at forskjellen mellom disse og de skjulte tabellene i generatoren i dette eksempelet er for store til at forward-backward-algoritmen har en sjanse.  

30.11.2006dpf, oe, and tl  3C, Informatikkbygningen   sample exam  Sample Exam  
Publisert 29. aug. 2006 20:49 - Sist endret 29. nov. 2006 18:33