Anonymisering af trafikdata
Der er stort potentiale i at anvende omfattende mængder trafikdata til forskellige forskningsmæssige formål. Forskere på Institut for Institut for Byggeri og Anlæg arbejder på metoder til anonymisering af sådanne store mængder data, så GDPR-regulativer o.lign. overholdes, men dataene stadig har tilstrækkelig værdi til forskernes formål.
Lektor Niels Agerholm, sektionsleder for Sektionen for Veje, Trafik og Transport, forklarer:
”Vi ligger inde med en stor mængde trafikdata fra Nordjylland, som stammer fra et tidligere big data-projekt. Her opsamlede man data fra en lang række bilister, som fik installeret en sporingsboks i deres biler, og fik således information om eksempelvis køremønstre, hastighed osv. Det giver nogle meget spændende perspektiver for os som forskere at have adgang til sådanne data – eksempelvis vil vi kunne bruge dem til undervisning, forskning, test af algoritmer og meget mere.”
For at forskerne kan anvende dataene, kræves der dog, at de anonymiseres – og det er lettere sagt end gjort.
”Udfordringen er, hvornår dataene er gjort anonyme nok – og de stadig har værdi for os. Ideelt er målet, at vi har adgang til al data, men uden mulighed for sporing af den individuelle bilist – for eksempel ved, at data opsamlet, når bilisten starter og slutter sin rute, fjernes, så man ikke kan spore, hvem der har kørt den givne rute, men stadig har dataene for midterstykket af den pågældende rute,” siger Niels Agerholm.
Forskerne påbegyndte arbejdet i et EU-projekt ved navn FOT-Net Data, hvor man arbejde med små data, og fortsættes nu i regi af DiCyPS, hvor forskerne ser på større mængder data. Målet er at kunne lægge dataene ud offentligt som open data, som er tilgængelige for forskere over hele verden.
”Udfordringen er at finde den metode, der giver os den nødvendige grad af anonymitet i dataene – og så det, at vi har måske 1 mia. observationer at undersøge ift. tid, køredata osv. Når vi har programmeret en metode til anonymisering, skal vi efterfølgende teste, om den lever op til kravene – fx i forhold til GDPR – og på den anden side om de anonymiserede data er i en form, så vi vil kunne bruge dem i vores videre forskning,” siger Niels Agerholm og afslutter:
”Der er ingen tvivl om, at potentialet er stort, hvis vi får gjort disse data tilgængelige, og forskere rundt omkring forstår at gribe dem. De vil kunne udnyttes i en lang række forskellige kontekster – lige fra dybere indsigt i køremønstre og myldretider til uheldsmønstre og optimerede køreruter.”
Niels Agerholm, lektor, Institut for Byggeri og Anlæg, Aalborg Universitet