2010-12-13

Funkspiel

Antenna searches
Retriever's nose in the wind
Ether's far secrets

I dager der Datalagringsdirektivet kaster lange og mørke skygger over rettsstaten er det kanskje på tide å grave opp igjen en gammel idé og tilpasse den dagens forhold. Lenge før myndighetene viste noen interesse for å overvåke, kontrollere, kneble og regulere Internet var det enkelte brukere av nettet som (antagelig rettmessig) antok at epost og annen kommunikasjon over nettet ble overvåket.

Antagelsen var at myndighetene, for å gjøre jobben litt enklere for seg selv, antagelig ville bruke varslingssystemer for å se etter bestemte ord og fraser, og så manuelt inspisere meldinger som inneholdt disse. For å drukne eventuelle avlyttere i falske alarmer sørget enkelte skøyere for å legge til samlinger av "tvilsomme" nøkkelord i meldingene sine. Enkelte tekstredigeringsprogrammer hadde til og med denne funksjonaliteten innebygget.

Her er noen eksempler på hva kommandoen M-x spook i Emacs kunne produsere:

fundamentalist analyzer Montenegro tempest NORAD pipeline import [Hello to all my friends and fans in domestic surveillance] Rubin David John Oates mindwar eavesdropping ANDVT ASDIC PET
NSA munitions ICE Osama LLNL Mole USCOI doctrine supercomputer analyzer mania lynch kilderkin Sears Tower MD2

Harmløs moro, med andre ord.  Ingen jeg kjenner har noengang kunnet fortelle meg om disse tilfeldige ordene faktisk hadde den ønskede effekten.  Jeg vil anta at en smart informasjonsanalytiker ville bruke en dag eller to på å forbedre et eventuelt nøkkelorddeteksjonssystem for kunne sile ut disse disse falske positivene.  De er ikke så vanskelige å kjenne igjen egentlig.

Med litt flid kan man dog prestere noe bedre.  Tidlig på 90-tallet viste en kompis meg (Anders Christensen) en svadagenerator han hadde skrevet.  Han hadde matet programmet med artikler om objektorientert programmering.  Deretter produserte den vilkårlige mengder plausibelt utseende tulletekst.  Statistisk sett halvveis plausible artikler i alle fall.

(Ok, for å være helt ærlig: de kunne faktisk se ut som faktiske vitenskaplige artikler for en menneskelig leser også.  Akademisk publisering om tema som er i til enhver tid er i vinden kan til forveksling se ut som noe en svadagenerator kunne produsert.  Det forholder seg sikkert på samme måten med mye som skrives i religiøs eller politisk affekt).

Jeg husker ikke eksakt hvordan han gjorde det.  Jeg vil tippe han brukte en Markov-modell samt noen heuristikker for å få teksten til å se plausibel ut (Anders?).  Dette er i så fall endel størrelsesordener mer slitsomt å avsløre enn naiv sammenstilling av tilfeldige ord og fraser fra en liste.  Men i dag burde det ikke være så altfor vanskelig å lage noe som kan avsløre slikt.  Selv når teksten man har gitt svadageneratoren som inndata er ukjent.  (Oppgave for den interesserte leser: lag et program som kan avsløre hvorvidt en tekst er produsert av en svadagenerator som bruker en Markov-modell).

Den observante leser har allerede merket seg et mønster her:  dette ligner på et våpenkappløp.  Og det er et kappløp som i tiltagende grad blir mer og mer asymmetrisk.  Det vil si:  å lage utfordringene krever ikke så veldig mye innsats, men å kontre disse utfordringene krever gradvis mer og mer kløkt og kapasitet.

Dette er langt fra noen ny idé.  Teknikker som dette har vært brukt i f.eks krigføring veldig, veldig lenge.  Tanken er at man binder opp motstanderens ressurser i å tyde, fange opp, tolke eller verifisere ulike former for desinformasjon eller tullball.

Med tiltagende økning i overvåkning blir disse teknikkene igjen interessante for nettbrukere.  Selvsagt er listen mye høyere i dag.  Ikke bare fordi eventuelle motstandere har årevis av erfaring i å bygge analysesystemer som kan skille skitt fra kanel, men fordi de har langt mer formidable ressurser å kaste på problemet.

Det er også en utfordring i dette å tilpasse lokkematen til konteksten den skal brukes i -- nå som myndighetene skal samle metadata (trafikkdata) snarere enn innhold.  Men akkurat det er ikke nødvendigvis den største utfordringen.  Den største utfordringen er at du må regne med at opponenten ser kortene dine.  Slik software vil antagelig mest effektivt utvikles og spres som åpen kildekode.

En annen form av dette angrepet er å feilaktig implisere en uskyldig tredjepart:  å sørge for at denne tredjeparten havner i myndighetenes søkelys.   Dette er selvsagt umoralsk og slemt, men man må nesten regne med at folk kommer til å gjøre slikt.  I alle fall i lys av alle smålige nabokrangler som ender opp i forliksråd over det ganske land.

I så måte vil det under Datalagringsdirektivet bli svært viktig å sørge for at man passer på å ha et potte tett trådløsnett eller et kablet nett det ikke er enkelt for uvedkommende å koble seg til.  Jeg ville sjekket den trådløsruteren du fikk av ISP'en din om jeg var deg:  det er sannsynligvis noe billig ræl og utgjør et attraktivt mål fordi det antagelig er endel tusen slike installert i husstander over det ganske land.

Hvis du synes dette var morsom lesning anbefaler jeg deg å finne ut hvor haiku-diktet i starten av denne blogposten stammer fra ;-)

No comments:

Post a Comment