2011-04-10

Datadrevet demokrati?

Kort tid etter at Datalagringsdirektivet var oppe til votering på Stortinget spurte jeg på Twitter om det var noen som hadde en liste over eksakt hvem som stemte hva.  Noen timer senere ramlet det en PDF ned i mailboksen min fra en kompis som hadde bedt om resultatet av voteringen fra Stortinget.

Dessverre viste det seg at dokumentet fra Stortinget var innscannede sider -- så det var ikke bare å klippe ut teksten for å få listen i mer håndterbart format.  Den måtte tastes inn på nytt.  Jeg vurderte å bruke OCR, men det ville antagelig blitt minst like mye jobb for å lese korrektur.  Like greit å knotte det inn manuelt.

Jeg begynte å knotte inn resultatene i et regneark.  For å gjøre det enklere å dele dataene siden valgte jeg å bruke Google Docs.  Etter en stund innså jeg at det kom til å ta en god stund.  Det er også den type arbeide der det er lett å taste inn feil.  Så jeg bestemte meg for å be om hjelp.  Jeg spurte noen venner samt at jeg spurte på twitter om noen gadd å hjelpe meg med å knotte inn resultatet fra voteringen samt å kontrollere at det som var tastet inn var korrekt.  En håndfull stilte opp og etter relativt kort tid hadde vi listen i et regneark.

Neste trinn var å legge ut en lenke til regnearket og be folk på twitter om å lese korrektur på den.  Vi fikk inn 2-3 korreksjoner.  Den mest graverende var at jeg hadde vært litt kjapp i vendingen og plassert Erna Solberg i Arbeiderpartiet.  Min feil, jeg vet bedre, men sånt skjer.  Heldigvis regnet jeg med at jeg kom til å gjøre feil så jeg ba folk sjekke og dobbeltsjekke.

Resten var stort sett mindre stavefeil.  Vi fikk også lagt til en kolonne med hvem som var vararepresentanter.  Jeg la så ut regnearket som en CSV-fil slik at andre kan gjenbruke dataene enkelt.  Uten noen bruksbegrensninger.  (Værsågod.  Du kan bruke dataene til akkurat hva du vil.  Men hvis du finner feil regner jeg med at du sier ifra).


Hva lærte jeg av denne øvelsen?

Hvem er disse menneskene?

Jeg snakket med flere av de som hjalp til med å taste inn og korrekturlese resultatene fra voteringen, og alle la merke til det samme:  de fleste av menneskene på Stortinget er mennesker de aldri har hørt om.

Dette er ikke noen behagelig tanke.  Man kjenner et visst ubehag ved å være stemmeberettiget -- og så samtidig ikke ha den fjerneste anelse om hvem som representerer en på tinget.  Og i den grad man vet hvem de er, hva vet man egentlig om dem?  Hva vet man om deres parlamentariske historie, om holdningene og standpunktene deres?

Og dette er litt viktig, for det er disse menneskene som styrer landet.  Som forvalter fremtiden vår.  Som fatter beslutninger på våre vegne.

Som et minimum burde man som velger i alle fall vite hvem som representerer fylket man kommer fra.  Vet du det?

Tilgang på informasjon.

Hvis du setter av en søndag til å gå gjennom websidene til Stortinget oppdager du at det ligger veldig mye informasjon der.  Problemet er at det meste er drepende kjedelige dokumenter skrevet på et byråkratisk språk.  Det kreves en viss erfaring for å tolke mye av det som står der.  Og tid.  Svært mye tid til å grave, lese og forstå.  Det er så å si ingen velgere som har tid eller evne til å nyttegjøre seg mye av denne informasjonen, og det er et problem.

Det er også litt betenkelig at informasjon som er strukturert og relativt enkel av natur ikke finnes tilgjengelig i noen form som gjør det mulig å automatisere analyse.  For eksempel finnes det ikke noen måte å kunne hente ut resultater fra voteringer på en strukturert form slik at man f.eks kan mate disse dataene inn i analyseverktøy.

I prinsippet burde alle voteringer noensinne vært tilgjengelig i et strukturert format som gjør det mulig å laste dataene inn i databaser eller analyseverktøy.  Uten restriksjoner.  Og uten tap av detaljrikdom.

Det finnes organisasjoner som systematiserer noe av denne informasjonen, men de er av svært begrenset verdi fordi tilgangen til disse dataene er byråkratisk -- og samtidig befengt med begrensende bruksbetingelser.   Man må derfor se bort fra disse organisasjonene.  De produserer produkter som kanskje er anvendelige i en mer lukket forskningskontekst, men ikke for å oppmuntre anvendelse av disse dataene i folkeopplysningsøyemed.

Det er ikke uvilje fra Stortinget som ligger bak.  Hvis du ber om informasjon får du den.  Omsider.  Men det er fremdeles mye jobb å omsette det du får ut i noe som faktisk kan brukes til noe annet enn å bare lese informasjonen.   Problemet er snarere en viss mangel på visjoner.  Jeg tror de trenger hjelp til å forstå hva behovene er og jeg tror det trengs en viss dugnadsinnsats for å få endel av disse tingene gjort.

La oss starte med å få voteringene og biografisk informasjon om representantene tilgjengelige på et fornuftig format og ta det derifra.  F.eks via et enkelt REST-API.  Dette burde være helautomatisk slik at voteringer blir tilgjengelige så snart de er avholdt.  Så får vi se på hva vi gjør med historiske data.  Kanskje man kan gjøre det som en dugnadsinnsats?

Vi har tilgang på endel informasjon -- men ikke i en form som den jevne velger kan nyttegjøre seg.  Vi må gjøre noe med den saken.