Nyt værktøj til avanceret dataanalyse
I analyse af Big Data arbejder man som oftest med at se tilbage på mønstre, hændelser og årsager, og frem mod forudsigelser af, hvordan fremtidig udvikling vil være. Ved Daisy – Center for Data-Intensive Systemer, arbejder forskerne med at lægge nu et tredje trin ovenpå, som viser, hvad det optimale i en fremtidig udvikling vil være.
”Normalt i arbejdet med data taler man om tre slags analyse. Første trin er Descriptive Analytics, hvor man ser tilbage på, hvad der er sket og hvorfor. I andet trin anvender man Machine Learning og bygger modeller, der giver Predicitive Analytics, som kan give meget præcise forudsigelser – fx i form af, hvor stor elproduktionen fra vindmøller og solceller bliver, og hvor stort elforbruget i en given periode bliver,” forklarer professor Torben Bach Pedersen, AAU.
Forskerne arbejder netop nu på at lægge et tredje trin ovenpå i form af Prescriptive Analytics, der som navnet antyder siger noget om, hvordan man kan optimere en fremtidig udvikling – eksempelvis i forhold til, hvornår man skal bruge strøm, og hvilke apparater man skal bruge hvornår for at mindske CO2-forbruget.
”Prescriptive Analytics kan anvendes til at skedulere apparater for at opnå ønskede mål – fx minimering af CO2-udslip eller anvendelse af mest muligt egenproduceret strøm. Indtil nu har man kun kunnet lave Prescriptive Analysis ved at anvende en masse forskellige værktøjer, der ikke i udgangspunktet passer sammen, for at opnå dette: Fx skal man for at lave en optimering bruge en database, som man sætter sammen med værktøjet R og et yderligere tredje værktøj. Ulempen er, at hvis man skal kode rigtig meget for at få det hele til at spille sammen, er det langsomt, og det kommer ikke til at hænge særligt godt sammen, så det bliver svært at finde eventuelle fejl,” siger Torben Bach Pedersen.
Forskerne på AAU tager nu en ny tilgang til udfordringen og flytter alle steps i processen ind i selve database-motoren. Det sker i værktøjet SolveDB, som er et værktøj målrettet udviklere, der arbejder med databaser. Arbejdet tyder indtil videre yderst lovende.
”De prototyper, vi har lavet indtil nu i open source, viser, at det kan gøres smartere på netop denne måde. Der bliver meget mindre kode, alt er SQL, det er meget nemmere at finde fejl – og der bliver færre fejl – og det er meget hurtigere,” afslutter Torben Bach Pedersen.
Værktøjet er som udgangspunkt udviklet med henblik på anvendelse i energisektoren, men forskerne håber, at de inden for DiCyPS’ projektperiode er nået til et punkt, hvor det også kan anvendes i transportsammenhænge.
Torben Bach Pedersen, professor, Institut for Datalogi, Aalborg Universitet