data-skup sørlandsporten

25
Er lat. Synes 30.000 sider er for mye å lese Fædrelandsvennen, ved Atle Brandt og Tarjei Leer-Salvesen

Upload: stiftelsen-for-en-kritisk-og-undersokende-presse

Post on 08-Jul-2015

113 views

Category:

News & Politics


2 download

DESCRIPTION

Med «Sørlandsporten» har Fædrelandsvennen samlet alle journalene for en hel landsdel. Prosjektet innebærer å lage søkbare journaler for offentlige etater som ikke har det selv. Målet på kort sikt er å gi et verktøy til både journalister, ansatte, organisasjoner og næringsliv. På lengre sikt er målet å påvirke landsdelens kommuner og offentlige foretak til å bli åpnere. Den undersøkende journalisten Tarjei Leer-Salvesen og medieutvikler Atle Brandt forklarer hvordan de jobbet.

TRANSCRIPT

Page 1: Data-Skup Sørlandsporten

Er lat. Synes 30.000 sider er for mye å lese

Fædrelandsvennen, ved Atle Brandt og Tarjei Leer-Salvesen

Page 2: Data-Skup Sørlandsporten

Postjournaler gir oss gode saker

Page 3: Data-Skup Sørlandsporten

Når journalen ikke virker, misser vi på viktige prosesser…

Denne kom via tips når saken hadde pågått i månedsvis i postlistene

Page 4: Data-Skup Sørlandsporten

Men fyrtårnet var en skikkelig sinke• Rotete PDF-system der alt er bilder • De la flid i at ingenting skulle være søkbart

Page 5: Data-Skup Sørlandsporten

Hvordan kan vi hjelpe alle Sørlendinger å søke?

Page 6: Data-Skup Sørlandsporten

Portal for åpenhet – rangert på kvaliteten til løsningen i ulike kommunene

Page 7: Data-Skup Sørlandsporten

Fvn ble med i DocumentCloud• Knight Foundation betaler, IRE organiserer:

Page 8: Data-Skup Sørlandsporten

I skyen ser det slik ut

Page 9: Data-Skup Sørlandsporten

Det er opprettet «prosjekter» for hver etat som blir med i portalen

Page 10: Data-Skup Sørlandsporten

Hurra - ferdige widgets!

• jQuery, vår magiske tryllestav for raske grep gikk amok !

• Ikke så bra brukeropplevelse: nye vinduer og søke igjen etter samme tingene

Page 11: Data-Skup Sørlandsporten

Neste skritt? Finne en API !Få opp noen knapper !Som igjen lagde nye knapper !I lange lange lister !Nærmere svaret, men ikke opplevelsen

Page 12: Data-Skup Sørlandsporten

–every tech support, ever

When in doubt: reboot

Page 13: Data-Skup Sørlandsporten

Tide å tegne OG tenke• Fullstendig gjennomgang av

mulighetene og strukturen i Document CLoud

• Lage vår egen datamodell på toppen, med logiske objekter for:

• søk

• resultatliste

• faktisk dokument

• treff i dokuemnt

• faktiske sider

• faktisk innhold på siden

• faktisk omtalte journal / saksnummer

Page 14: Data-Skup Sørlandsporten

Dermed: Angular og struktur

Page 15: Data-Skup Sørlandsporten

Magisk kode• Front end Angular ser ut

som html - nesten i hvertfall

• Lett å diskutere hvor ting skal, hva som skal vises og hva som skal gjentas

• Lagt på Bootstrap på toppen for enda mer ferdig ut av boksen

Page 16: Data-Skup Sørlandsporten

RegExp <3 …?• Men et viktig skritt gjensto: selve bestillingen fra journalen

• Først fant vi saksnummer, så gravde vi frem tittelen - som gjennom OCR kom helt annet sted i flyten

• rxCase = new RegExp('20[\\d]{7}-[\\d]{1,3}', 'g');

• caseArray = dm.curDoc.curText.match(rxCase);

• if (caseArray !== null){

• rxTitle = new RegExp('(?!<=Sak: )([^:])+(?=Dok:)', 'g');

Page 17: Data-Skup Sørlandsporten

Helsereporter Steinar leser 30 sider journal hos SSHF daglig, de mangler søkefunksjon

Page 18: Data-Skup Sørlandsporten

Så da la vi inn en løsning for de også

Page 19: Data-Skup Sørlandsporten

Gjenbruk – en god koder er lat og smart i passe balanse

• Vi hadde omtrent 30 000 sider fra Kristiansand Kommune !

• Med UiA doblet det til 60’

• • SSHF brakte

oss til 90’

Page 20: Data-Skup Sørlandsporten

UiA er vel ikke unikt? Vi tar alle!

Page 21: Data-Skup Sørlandsporten

Med alle universitetene? Rundt en million sider - go fortsatt bare journalene

Page 22: Data-Skup Sørlandsporten

Feedback

• Direktoratet for IKT for forvaltning (DIFI) ringte • Ene levrandøren (ACOS) tok kontakt for lære mer om

våre (journalistiske) behov og krav til systemene !

• Litt fart i sosial medier; Rune Thomas Ege @rtege: Et strålende stykke arbeid for mer åpenhet! @FVNeivind og @fvn_mediesjef fortjener all mulig heder og ære ! Kristine Foss @Kriho Beste stuntet ever, @fvn_no: http://bit.ly/1hVd1BD #innsyn #demokrati ! Hysj! Hemmelig! @HysjHemmelig Til inspirasjon for journalister som sliter med dårlige postjournaler?

!• “Universitas takker for Sørlandsporten” • Bergen med På høyden likeså

Page 23: Data-Skup Sørlandsporten

Hva nå KRS?

• Etter ytterligere fire måneder med «mas» lanserte kommunen den 3. oktober en «beta» side for søk i postjournalen

• Men bare for perioden fra august 2014 !

• Vi har begjært innsyn i underlaget og historikken i den gamle løsningen.

Page 24: Data-Skup Sørlandsporten

Prøv selv, bestill med et klikk på saksnr: www.fvn.no/sorlandsporten

Page 25: Data-Skup Sørlandsporten

Eller hvorfor ikke lage en egen utgave?

Koden som den er har vi delt fritt og åpent på https://github.com/fvnno/sorlandsporten !Og med litt kaffepauser her skal eksempel for komme i gang bli enda enklere…

25