2010-12-11

"Bare" trafikkdata

Politikere som forsøker å introdusere Datalagringsdirektivet har iherdig understreket at det ikke er innhold som skal lagres, men trafikkdata.   Altså data som forteller hvem, hvor og når, men ikke hva. (Eksempel: de vet hvem du ringer, når du ringer og hvor du befinner deg -- men ikke selve innholdet i samtalen.)   

De fremholder dette som om det var noe som skulle berolige oss: at innhold er sensitivt, men at de data som detaljerer hvor vi er og hvem vi kommuniserer med ikke skulle være sensitivt.  Dette er litt merkelig med tanke på at å samle inn, analysere og anvende kunnskap fra slike data er en svært stor industri og det er en pågående kamp mellom tjenestetilbydere, myndigheter og konsumenter for å forsøke å finne anstendige grenser.

Bedrifter er villige til å gå over lik for denne typen ekstremt verdifull informasjon.

Jeg kunne sagt mye om verdien av disse dataene og deres prediktive kraft -- hvordan man svært presist kan avlede informasjon fra disse dataene; informasjon som ikke eksplisitt opptrer i dataene.   At de kan brukes for å finne indikatorer på alt fra utroskap, demens, religion, legning, politisk syn, rusmiddelbruk til sannsynligheten for at du vil være mottagelig for tilbud om en toroms timeshare i Spania.  Men det er slikt de fleste allerede er vagt klar over og fint klarer å finne ut mer om selv.  Det er ingen mangel på svært lettilgjengelig litteratur på området selv for de med matte-fobier.

Isteden har jeg lyst til å si litt om hvorfor dette ikke dreier seg om "bare trafikkdata".

Det er viktig å ikke tenke på disse trafikkdataene i isolasjon.  Man må tenke på dem i sammenheng med hvilke andre datakilder som eksisterer.   Vi er vant med debatter om kobling av registre og hvor farlig dette er.   Som oftest snakker vi da om tilfeller der koblingen kan gjøres presis ved hjelp av en nøkkel.  Som f.eks personnummer.  Dette er en måte å koble data på som er triviell å forstå.

Men det er også mulig å koble informasjon uten slike nøkler.  Og det finnes endel forskning på hvordan man gjør slike koblinger f.eks på tvers av en informasjonsbarriere -- eller for å si det enklere:  å koble data som har gjennomgått en anonymiseringsprosess med data fra en annen kilde (som er ditto anonymisert ...  eller ikke).

For å forenkle litt: dette betyr at trafikkdataene myndighetene ønsker å samle kan brukes for å de-anonymisere annen informasjon.  Et godt eksempel på dette er arbeide som er gjort på å identifisere individer på tvers av sosiale nettverk uten å bruke "nøkler" som navn, mailadresse etc, men utelukkende ved å se på topologien i disse nettverkene.   For å forenkle enda mer:  din sosiale graf er ditt fingeravtrykk -- og selv om du ikke forsøker å skjule identiteten din på tvers av sosiale nettverk vil enhver kobling av dine identiteter og aktiviteter øke mengden informasjon som kan anvendes for å kartlegge deg.  Og for å finne ytringer og innhold du trodde du gjorde tilgjengelig under dekke av anonymitet.

I lys av dette blir forsikringene om at dette ikke dreier seg om innhold relativt hule påstander.

Og videre: dersom man kan koble tekstlig innhold til en identitet åpner det for enda flere måter å nøste opp i livet ditt ved hjelp av teknikker fra f.eks "forensic linguistics" (aner ikke om feltet har noe godt norsk navn). 

Jeg vil tippe at pådrivere for Datalagringsdirektivet i etterretningsmiljøet antagelig skjønner at politikerne bagatelliserer betydningen av dataene og hvor dypt de griper inn i vårt privatliv og vår integritet.  Dog tror jeg ikke at politikerne selv forstår omfanget av hvor sensitive disse dataene er og hvor blottlagt enkeltindividet er i ferd med å bli.  En indikasjon på dette fraværet av bevissthet hos politikerne er at politikerne later til å slippe unna med å bagatellisere rekkevidden av dataene i debatten.  Dessverre er det svært få med den rette kombinasjonen av faglig tyngde og retoriske evner som har kunnet belyse dette for pressen og dermed gjøre disse bekymringene til en del av den offentlige debatten.

Det er mange som synes jeg har vært ufin mot politikere når jeg sier at de er i ferd med å ta en avgjørelse de ikke er kompetente til å forstå rekkevidden av.  Selvsagt er det aldri hyggelig når noen påpeker slikt, men dersom overfladisk høflighet skal komme i veien for å påpeke et kritisk faktum i en sak som kan få katastrofale følger for samfunnet må man nesten tåle litt hard kritikk.

Såvidt jeg husker er ikke opphetet debatt forbudt.  Ennå.


Litt nyttig lesestoff:

No comments:

Post a Comment