2011-01-11

Vi vet 97.3% sikkert hvor du er 14:03 i morgen

Med nok datapunkter om hvor du befinner deg på ulike tider av døgnet, ulike dager i uka, går det an å bygge en veldig presis modell av dine bevegelser.  Det vil si, det blir mulig å med ekstremt høy sannsynlighet å kunne forutsi hvor du vil befinne deg på et gitt tidspunkt i fremtiden.

Mye av livene våre er så forutsigbare at sted og tidspunkt er forutsigbart med 95% sikkerhet eller mer.  Det er også forutsigbart når lokasjonen din er uforutsigbar.   F.eks når du er på ferie.  Dette burde ikke komme som noen overraskelse på noen.  Selv om vi kanskje ikke selv er klar over hvor forutsigbare vi er.

Mye av retorikken fra Storberget har gått ut på at Datalagringsdirektivet ikke er farlig fordi det ikke er snakk om innhold, men "bare trafikkdata".  Det er to problemer med dette.  For det første bagatelliserer det sensitiviteten i trafikkdata ved å fokusere på noe annet:  innhold.  

Dette er data som er så sensitive at det ligger endel begrensninger på hva selskaper som samler slike data kan gjøre med dem (f.eks teleselskaper).  Det er også data som håndteres ekstremt forsiktig i endel Internet-selskaper som aggregerer store mengder slike data.  Det er ikke uvanlig for slike bedrifter å anonymisere disse dataene for intern bruk -- for å redusere sjansen for ødeleggende lekkasjer fra utro tjenere.

Det er sjelden du får lese om disse problemstillingene, begrensningene og holdningene.  Det er fordi dette er følsomme tema som selskaper ugjerne snakker om.  Og det er ikke så veldig rart, for det er en, ofte berettiget, skepsis mot denne formen for datainnsamling.  Jo mindre som sies, desto bedre for dem.

Men det andre problemet er litt mer alvorlig:  det distraherer oss fra det faktum at staten vil vite hvor du er og hvem du snakker med til enhver tid.  Vi fokuserer på at de ikke myser på "innholdet" og er ment å skulle få oss til å tenke på trafikkdata som "mindre farlig".  Fordi det kunne vært verre.

(når det er sagt:  hvis jeg skulle overvåket en større populasjon: det er mer interessant hvor de er og hvem de snakker med enn innholdet i disse samtalene.  sistnevnte er for det meste søppel.  trafikkdata er rent gull fordi det er kompakt, presist og relativt enkelt å analysere)

Det største problemet i debatten rundt datalagringsdirektivet er manglende folkeopplysning.  De som lever og ånder dataanalyse i massive datasett har ikke vært flinke nok til å formidle denne kunnskapen til mennesker som ikke engang har overfladisk forståelse av elementær statistikk -- langt mindre datamining.

Denne manglende bevisstheten på hvor gjennomsiktig et liv blir, selv med uskyldig utseende drypp av informasjon, er urovekkende.  Og slike som meg må ta en del av ansvaret -- fordi vi ikke er så flinke til å forklare disse tingene på vis som er forståelige for vanlige mennesker.  I alle fall ikke uten å få folk til å føle seg som idioter.

No comments:

Post a Comment