Infotalk

Mina topp fem datalager-citat

12 september Linus Hjorth

Jag tror att det är just inom vår bransch många som liksom jag gillar listor. Det kanske kommer naturligt med territoriet, om jag får använda en anglicism. Sedan har jag en fäbless för citat. Så här är listan som kombinerar det med mitt favoritämne: datalager.

 

Plats fem:

 

“It is a capital mistake to theorize before one has data.”

(Sherlock Holmes, eg. Sir Arthur Conan Doyle från “En studie i rött”).

Kanske inte ett renodlat datalager-citat, men det förklarar varför vi håller på med det vi gör: samlar fakta före beslut.

 

Plats fyra:

Som svar på Kimballs bild av datalager som är “…nothing more than the union of all the data marts”.

"You can catch all the minnows in the ocean and stack them together and they still do not make a whale"

(Bill Inmon)

Burned!

Inmon skjuter effektivt bilden av ett EDW som kan bygga på dimensionsmodellering i sank– det kan aldrig bli 100 procent integrerat och förvaltningsbart. (Not: minnows - spigg, småfisk)

 

Plats tre:

 

“Data Warehouse contains all the data, all the time”

(Hans Hultgren)

Hans var kanske inte den som myntade uttrycket, men han får min credit ändå. Det är inte jättepoppigt, men är rakt på sak om vad datalager handlar om. Vi vill ta in all sorts data in i datalagret. Inte filtrera, inte aggregera. Samt med full historik och spårbarhet - vilken data laddades när, från vilket system och av vilken process.

 

Plats två:

 

“Data Marts are the interpretation layer of the integrated data warehouse data”

(Dan Linstedt)

Detta citat och Dans utveckling har fått mig att tänka om kring delar av min syn på datalager-arkitektur. Senare i samma text tydliggör Linstedt skillnaderna genom att kalla datalagrets data för ”fakta”, och att alla data som genomgår någon typ av tvätt, transformation och andra affärsregler är förvanskad information – tolkningar av sanningen. I min tidigare världsbild fanns ett fullt integrerat datalager i centrum. Fullt integrerat betyder också att en hel del transformationer krävs för att få data mellan olika system och över tid att samsas i samma datamodell, med gemensamma begrepp och termer. Ville man se hur data såg ut innan det landade i databasen så kunde man bygga ett ”Operational Data Store” – ett lager med historiserat data lagrat enligt den modell och begreppsvärld som källsystemen använder.

Men med Linstedts syn så ligger ett ”rått” datalager i centrum. Visserligen integrerat med gemensamma affärsnycklar, men i övrigt ska data i princip flöda in med 1 – 1-mappningar från källorna. I denna värld kompletteras då det råa datalagret med ett affärsdatalager, som är anpassat efter affärskrav.

 

Plats ett:

 

“Data Warehouse is forever”

(Hans Hultgren)

Wow! Man flyttas genast till en episk storfilm, och är fortfarande kvar på jobbet. Detta är en variant på temat från plats tre – bygg ditt datalager så att det kan ta emot all sorts data, och lagra det utan tanke på att det ska fasas ut. Detta står i kontrast med andra affärssystem som är byggda för att klara den löpande verksamheten, specifika funktioner under en specifik tid.

Det var mina favoriter, vilka är dina?

Linus Hjorth

Linus Hjorth är Infotreks områdesansvarig för datalager. En specialist inom datalager-arkitektur som blir extra engagerad när affärskrav ska omvandlas till datamodeller.

Finns inga kommentarer för detta inlägg

Lämna en kommentar
  •  

    Send this to a friend