Mappingseminar 9. februar 2016

Mappingseminar 9. februar 2016

 

Saksliste

1) Referat fra forrige møte: http://www.uio.no/for-ansatte/enhetssider/ub/prosjekter/mapping-mot-webdewey/moter/2015-12-11.mappem%C3%B8te.html

2) Ccmapper – status, arbeidsform UBO/Pansoft (grafisk design, interaksjonsdesign m.v.)

3) Mappingarbeidet – status, arbeidsformer, produksjon m.v.

4) EDUG-møtet i april

5) Videre organisering av arbeidet inkl. opplæring

 

Til stede fra UBO: Vibeke Stockinger Lundetræ, Berit Sonja Hougaard, Mari Lundevall, Dan Michael Heggø og Grete Seland (møteleder og referent). Fra USIT: Are Gulbrandsen. Fra NB: Elise Conradi.

Forfall: Unni Knutsen og Viola Kuldvere.

 

 

1) Referat fra forrige møte

Forrige referat ble godkjent. Angående saker fra forrige møte: Styringsdokumentet for prosjektet ble publisert på prosjektsidene 26. januar. Personal: Are er 10 % på prosjektet (uavklart hvor lenge, men i hvert fall fram til sommeren).

 

 

2) Ccmapper

Are og Dan Michael har ukentlige nettmøter med Pansoft. Ccmapper lages flerspråklig mht. menyvalg (norsk, engelsk og tysk). Jobber med interaksjonsdesign, søk mot dataene og endringshåndtering. Menylinje ikke ferdig bearbeidet. Nedtrekksmeny for «concepts in progress». Kan ha flere vinduer oppe samtidig. Lemmatisering («nedskrelling av ord til ordstamme») leveres fra USIT.

 

Hovedfokus nå: å ha et demonstrerbart produkt når vi kommer til EDUG i Göttingen 25.-26. april – en programversjon der man kan mappe, men at endringsmodulen ikke er klar. Tar det viktigste først. Smidig utvikling. Endringsmodul for å ivareta at både kilde- og målvokabularer er i endring: ikke påbegynt – det som ligger i systemet er ganske statisk. Første versjon til å bruke til faktisk mapping i prosjektet: stipulert til medio mai. Ligger foreløpig ganske godt an mht. tidsskjemaet.

 

Hvis en person er inne på en mappingside i ccmapper, vil den bli låst («locking på eier»). En annen kan likevel samtidig gå inn og se på den siste lagrede versjonen. Man låser sin egen post ved å lagre i mappingskjermbildet (kan eventuelt ha det sånn at man må ha gjort minst én endring for å kunne låse – uavklart om man får det sånn). Må være mulig å overta andres poster – detaljer rundt det er ikke avklart. Ønsker ikke å legge inn harde hindringer i systemet før vi vet om det virkelig trengs.

 

Eksempler på ting som Are og Dan Michael trenger innspill på fra mappergruppa: Skal UBs emneregister være i skjermbildet «Identify concept»? Hva skal foregå når man klikker på «Search WebDewey» mht. utseende og funksjonalitet? Det ble meldt at det er viktig med registersøk, ikke bare fritekst i WD. Fanen «Review» skal liste alle mappingkandidater man har tatt stilling til (inkludert reject). På «List»-siden må man ha en måte å gå kjapt til det man bruker mest.

 

Hva skal være kriteriene i «Concept picker»? Står helt fritt mht. kriterier for valg av kildebegrep - vanskeligere å implementere valg på grunnlag av målvokabular. Det ble meldt ønske om at man må kunne søke på deweynr, og da få opp både foreslåtte og godkjente til et klassenr. Men: bare mulig å få de som er ferdigmappet – fra begge vokabularene. «Include completed»: funksjonalitet for å inkludere/ekskludere umappede – må lett få se hvilke som er ferdige og ikke.

 

Nummerbygging i WD og håndtering i ccmapper – hvordan tenker vi oss at det skal være mulig å mappe til nybygde numre? Behov for å kunne mappe til deweynr som foreløpig ikke finnes i ccmapper, altså: Den som lager mappinger må kunne gå inn i WD, bygge et deweynr som institusjonelt nummer, og direkte i flukt med dette lage en mapping til dette nummeret i ccmapper. I utgangspunktet får vi ikke nybygde deweynr inn i ccmapper før de er godkjent av NB. (Elise om WD: Nummerbygging har sin egen modul. WD-redaksjonen får inn bygde numre med forslag til registertermer fra alle bibliotek som har abonnement på WD. De prioriterer numre laget med brukeren UBO-mapper. Godkjenner fortløpende, men har etterslep.) Peter i Pansoft foreslår at man kan vente til nummeret er godkjent av WD-redaksjonen som nasjonalt nummer, men det var enighet på mappingseminaret om at man ikke kan være avhengig av dette. Funksjonalitet for mapping av nybygde institusjonelle numre må lages som en egen bit av modulen for endringshåndtering. I praksis må vi bygge et deweynr i WD og deretter kopiere det inn i ccmapper. Behov for rutine som sørger for at vi får beskjed fra WD-redaksjonen hvis et nummer vi har bygget ikke blir godkjent av dem.

 

 

3) Mappingarbeidet

Framdriften: går det fortere med mer erfaring? Bare delvis. Vibeke tar for tiden batch-jobber i forbindelse med folkegrupper, geografiske navn og persongrupper. 6 000 ferdige før EDUG? [Etter møtet: Antall godkjente mappinger til WD unntatt reject, pr. 16.03.2016, er 6 712.] Ca. 500 nye mappinger pr. uke i januar.

 

Tidsregistrering for første 5 uker viser følgende antall minutter pr. godkjent mapping (altså ikke pr. begrep) utenom reject: Ren mappetid 6,2 minutter, totaltid 8,6 minutter. Mappetid omfatter mapping + korrektur. Totaltid omfatter i tillegg til dette møtetid, jobbing med dokumenter, forberedelser og gjennomføring av presentasjoner osv. [Etter møtet: Tilsvarende tall for første 9 uker er: Mappetid 3,6 minutter, totaltid 5,9 minutter. De lavere tallene kan forklares av at Vibeke har foretatt batch-jobber som har gitt et stort antall likeartede mappinger som har krevd lavere minutt-tall pr. mapping.]

 

Når vi skal stipulere antall arbeidstimer som kreves for å ferdigstille mapping av begge kildevokabularene, må vi i tillegg ta hensyn til:

- at vi nå jobber med overlapps-vokabularet, og at utenom-overlappet, som utgjør 65-70 %, vil ta lenger tid pr. mapping

- at vi ikke vet hva som blir gjennomsnittlig antall mappinger pr. begrep i utenom-overlappet, og dermed vet vi ikke hvor mange mappinger vi kommer til å lage totalt (til nå har vi ofte regnet med ca. 2 mappinger pr. begrep på tvers av overlapp/utenom-overlapp, noe som vil gi rundt 60 000 mappinger totalt for begge vokabularene – dette er et usikkert tall)

- tidsbruk IKT-personell og prosjektleder er ikke iberegnet

- tidsbruk til alt som er utenom totaltid, mens som tar av arbeidstid – f.eks. seksjonsmøter, kurs, jobbreiser, lunsjpauser, legebesøk, sykdom, ferieavvikling osv.

- vi vet ikke hvordan overgangen til ccmapper vil slå ut mht. tidsbruk

- opplæring av de nye som skal inn i prosjektet

 

Selv med tidsregistrering siden januar, er vi fortsatt langt unna å kunne estimere gjenstående timetall/kommende personalressurser i forbindelse med oppskalering av prosjektet.

 

[Etter møtet: Forutsatt 60 000 mappinger totalt, hvorav ca. 10 % er ferdige, og beregnet med en totaltid på 8 minutter pr mapping, gjenstår det for de resterende 54 000 mappingene 7 200 arbeidstimer, noe som er drøyt 4 årsverk à 1 750 timer. I tillegg kommer tidsbruk for alle strekpunktene over, så dette er et veldig usikkert anslag!]

 

*Til oppfølging*
Grete lager forslag til forklaring på relasjonsbetegnelsene, slik de skal komme fram ved «mouseover» på våre mappinger i WD. [Etter møtet: Betegnelser som nå er tatt i bruk i WD: =EQ: Begrepet tilsvarer hele deweyklassen, ~EQ: Begrepet har stort overlapp med deweyklassen, BM: Begrepet er snevrere enn deweyklassen, RM: Begrepet er assosiert med deweyklassen. Tilsvarende betegnelser beregnet på bruk når man står i kildevokabularet, f.eks. på en full marc-post for et Humord: =EQ: Deweyklassen tilsvarer hele begrepet, ~EQ: Deweyklassen har stort overlapp med begrepet, BM: Deweyklassen er videre enn begrepet, RM: Deweyklassen er assosiert med begrepet]

 

 

4) EDUG i Göttingen 25.-26. april

Elise ferdig med program, men ikke fastspikrede titler for hvert innlegg. Uma i Göttingen ønsker å motta abstracts for innlegg, pluss biografier for alle som skal presentere.

 

Dag 1: Symposium (med oppstart etter rundtur i Göttingen): Satt av 45 min. til vårt prosjekt for demo av ccmapper v/ UiO og Pansoft, foreløpig tittel: UiO library: On the state of mapping and ccmapper. Kan også presentere prosjektet generelt, med tanke på EDUG-deltakere som ikke kjenner til hva mapping er. UiO bestemmer tittel og innhold. Struktur på dag 1: OCLC v/Rebecca om hvordan redaktørene i USA bestemmer hva man skal jobbe med av utvidelser og revisjoner. Tina/Peter/Elise om WebDewey, bla. endringshåndtering i oversettelsesverktøyet. Om sluttbrukertjenester i WebDewey. Coli-conc-prosjektet v/ Uma – Mapping av RVK (tysk klassifikasjonssystem) til Dewey, RDF-standardisering av mappinger. Uavklart hvor mye hun skal fokusere på deres verktøy. Etter Coli-conc har vårt prosjekt 45 minutter, før OCLC v/Julie Beal skal snakke om Dewey-nummerbygging, Ulrike om automatisk desyntetisering av deweynr («dekomponering av deweynumre til betydningsbærende elementer»). Tysk NB: automatisert klassifikasjon. Ekstern person om Basil-registeret – satt sammen av mange tesauri og klassifikasjoner.

 

Dag 2: Etter «library tour» er det satt av 2,5 timer til oppfølging av mapping-workshopen i fjor – vårt prosjekt har ansvar for innhold og gjennomføring. Endringshåndtering bør bli et stort punkt. Presentasjoner og plenumsdiskusjoner, ikke gruppearbeid. Aktuelt å be OCLC + Tina om å komme med presentasjon av sitt arbeid med endringshåndtering. Muligens også: scenarier mht. sluttbrukerverktøy – «moc-ups» på tenkte sluttbrukerverktøy – i så fall involvere Dan Michael. Pågående mappingprosjekter i EDUG: Kun oss + Umas coli-conc-miljø, men vi er trolig de eneste som bruker EDUGs retningslinjer. Resten av dag 2: Dewey-saker som skal diskuteres i plenum. Hva gjøres i forhold til at dewey.info er fjernet? Utbygging av fagområder, f.eks. arkeologi. Business-møte på slutten av dagen. Må diskutere bruken av EDUG-forumsiden.

 

*Til oppfølging*
Grete sender tentativt program for de 2,5 timene til Elise snarest mulig.
Grete legger forslag til revisjoner i EDUGs retningslinjer ut på EDUG-forumet i forkant av annual meeting.

 

[Etter møtet: Program for EDUG-møtet ble publisert 11.02.2016 på http://edug.pansoft.de/tiki-index.php?page=Annual%20meetings]

 

Fra vårt prosjekt deltar hele gruppen. I tillegg reiser fagreferentene Lars Lørdal og Heidi Sjursen Konestabo.

 

 

5) Videre organisering av arbeidet inkl. opplæring

Punktet utgikk pga. at Unni hadde forfall.

 

*Til oppfølging*
Unni: plan for rekruttering/oppskalering av prosjektet.

 

 

Neste mappingseminar: tirsdag 5. april kl. 12-14 på GSH rom 3236.

 

Publisert 23. mai 2017 16:01 - Sist endret 14. mai 2018 15:02