BI-bransjens pubertale fasinasjon for det enkle

6 min read

Min lyntale fra BI-Talentiaden 2017 –  En høyst subjektiv betraktning om BI begreper og konsepter, og hvorfor jeg mener det er på tide at BI-bransjen rister barndommen av seg om vi skal henge med på det nye spennende som skjer.

Av Øyvind W. Remme, Partner, NextBridge Advisory

Jeg fikk min første computer da jeg var 12 år gammel. Det imponerer jo absolutt ingen i dag, men dette var altså i 1981. Samme året programmerte jeg min første graf. Det imponerer jo heller ingen i dag, men jeg var jo bare sååå stolt. I BI-bransjen, så er datavisualisering begrepet for det å lage grafer, så om jeg ønsker å smøre tykt på, kan jeg si at jeg har drevet med visualisering siden 1981. Men det får meg jo bare til å fremstå som hauggammel.

Det er populære begreper i relasjon til BI som jeg har tenkt å reflektere litt rundt. Dataforeningens faggruppe, for eksempel, kaller seg nå «Faggruppen for Business Intelligence og Analytics». Hvorvidt Analytics er en del av BI eller ikke, er det delte meninger om, men jeg vil nå hevde at BI blir ganske blodfattig uten Analytics. Hva står vi egentlig igjen med da? Rapportering og visualisering? Mange i bransjen vil vel også inkludere ETL og datavarehus, men det er jaggu delte meninger der også.

De senere årene har jeg jobbet mye i samarbeid med analytikere og data scientists, og av dem får jeg høre litt av hvert, blant annet:

  • Business Intelligence er bare sååå forrige årtusen
  • for noen få år siden var også begrepet Analytics ut, og Data Science var trendy
  • og nå er det blant annet Artificial Intelligence (AI), Robotisering og Data Product Development som er inn

Spørsmålet er da om BI favner alle disse begrepene, om det er en form for modning eller evolusjon innen BI, eller om det er ulike områder?

Jeg vil påstå at det, i alle fall nå, er forskjellige disipliner, ulike verktøy og designmessig forskjeller. Og ikke nok med det; utvikling av AI og dataprodukter blir gjerne utført av en helt ny generasjon unge, lovende mennesker, som kanskje ikke engang kjenner til begrepene Business Intelligence og Datavarehus (BI/DVH). Og dette er med på å skape et ytterligere skille.

Forrige uke annonserte sjefen at vi hadde ansatt enda en data scientist med doktorgrad, bakgrunn fra Cern, hadde forsket på antimatter og det hele, og da plumpet jeg ut med i månedsmøtet at «herregud, nå har vi ansatt hele gjengen fra Big Bang Theory», hvorpå en av de impliserte geekene svarte: «Don’t worry, I’m mot crazy – my mother had me tested».

Men selv om dette kan ansees som ulike disipliner, så betyr ikke det at de bør holdes helt adskilt. Det dreier seg blant annet om anvendelse av mye av det samme dataunderlaget, selv om bruksområdene er ulike.

Og for å prøve å definere dette skillet på bruksområder, kan vi si at:

  • BI dreier seg tradisjonelt om beslutningsstøtte
  • mens dataprodukter gjerne er operative og kan nå helt ut i sluttproduktet til kunden, for eksempel i form av smarte produkter og kunstig intelligens

Jeg mener at BI, Data Science, Data Product Development etc. bør sees i sammenheng, at områdene kan dra stor nytte av hverandre og har mye å lære av hverandre, for eksempel:

  • Jeg ser at dataprodukter typisk blir utviklet i siloer, slik umodne BI-løsninger ble til på 90-tallet, dvs. at historien gjentar seg. Her har BI-miljøene mye erfaring som kan komme til nytte for å unngå at man går i de samme fellene
  • På den andre siden må de som jobber med klassisk BI/DVH ta inn over seg skillet mellom defensiv vs. aggressiv databruk, og at ikke alt skal håndteres på «datavarehusmåten». Her må trøtte BI-folk begynne å våkne

En annen morsom side er hvordan GDPR nå virkelig begynner å krype innunder huden på folk, og kaldt nedover ryggen på mange i vår bransje, blant annet når det nyansatte personvernombudet eller andre i ledelsen innser at BI-løsningene ligger langt unna deres forståelse av GDPR, og enda verre når de oppdager at de har null kontroll på dataene i sin raskt voksende Data Lake.

En god metode for å få kontroll på Stage, Sandboxes, Data Lake etc. går via god, gammeldags kildeanalyse, dokumentert i et egnet Repository, før dataene lastes inn, slik som er vanlig praksis i datavarehusprosjekter.

Men, noen av dere husker kanskje tilbake til 90-tallet, da vi bygde datavarehus mer eller mindre uten å spørre brukerne om hva de trengte. Isteden startet vi med en omfattende kildeanalyse, dokumenterte hver eneste kolonne i hver eneste tabell i kildene, og da vi mente å ha forstått kildene godt nok, så begynte vi å bygge.

Den komplette kildeanalysen var egentlig ikke der vi tråkket feil (med GDPR kommer nok dette heller tilbake på agendaen igjen). Den største feilen vi gjorde, var at vi deretter forsøkte å strømlinjeforme alle dataene på vei inn i datavarehuset; konsolidere, standardisere, skape én sannhet osv. Prosjektene pågikk over år og fikk gjerne kallenavn som X-files eller lignende. Det er dette som nå kalles for defensiv datastrategi, og datavarehuset har blitt selve symbolet på dette.

Poenget er ikke enten/eller, men at defensiv datastrategi først og fremst skal brukes på de dataene som må være konforme på tvers av virksomheten, mens for å henge med i utviklingen må vi tillate en mer aggressiv datastrategi på øvrige data.

Men vi må likevel være defensive i ett par ledd: Dokumentasjon og klassifisering av dataene vi tar inn, og differensiert tilgangsstyring på bakgrunn av dette, er essensielt for å imøtekomme GDPR. Dette gjelder like mye for Data Lake som for Datavarehus. For øvrig, er dokumentasjon av inndataene tvingende nødvendig for å unngå at vår Data Lake ender opp som en Data Swamp.

Igjen er det mye som vi gamle «die hard BI-arkitekter» kan bidra med i den nye verden av late binding / schema on read.

Slik jeg ser det, står BI-bransjen i et veiskille nå: Skal vi delta i utvikling av dataprodukter eller skal vi bare være beslutningsstøtte? Er det ikke på tide at BI-bransjen vokser av seg denne litt barnslige fasinasjonen for visualisering, og heller rettet fokus mot utvikling av sluttprodukter som virkelig endrer hverdagen til folk?

For meg, dersom BI-domenet skal avgrenses til bare beslutningsstøtte og visualisering, da sier jeg takk, og farvel til BI. Så foreslår jeg at vi relanserer faggruppen som «Faggruppen for Business Intelligence, Analytics, Data Science, Artificial Intelligence og Data Product Development»

About Øyvind W. Remme

Øyvind W. Remme er partner i NextBridge Advisory AS. Han har over 20 års erfaring med Business Intelligence og Analytics innen et stort spekter av bransjer, bruksområder og teknologier. Med brennende interesse for faget, har han holdt en rekke foredrag og kurs, blogget og skrevet artikler, samt vært styreleder i Dataforeningens faggruppe for Business Intelligence & Analytics.