Mitä on dimensiomallinnus tietovarastossa?

Dimensionaalinen mallinnus

Dimensionaalinen mallinnus (DM) on tietorakennetekniikka, joka on optimoitu tietojen tallentamiseen tietovarastoon. Dimensiomallinnuksen tarkoituksena on optimoida tietokanta tietojen nopeampaa hakua varten. Dimensiomallinnuksen käsitteen kehitti Ralph Kimball, ja se koostuu ”fakta”- ja ”dimensiotaulukoista”.

Dimensiomalli tietovarastossa on suunniteltu lukemaan, tiivistämään ja analysoimaan numeerista tietoa, kuten arvoja, saldoja, lukumääriä, painoja jne. tietovarastossa. Sitä vastoin relaatiomallit on optimoitu tietojen lisäämiseen, päivittämiseen ja poistamiseen reaaliaikaisessa online-transaktiojärjestelmässä.

Näillä dimensio- ja relaatiomalleilla on omat ainutlaatuiset tapansa tallentaa tietoja, joilla on erityisiä etuja.

Relaatiotilassa esimerkiksi normalisointi ja ER-mallit vähentävät tietojen redundanssia. Sitä vastoin tietovaraston dimensiomalli järjestää tiedot siten, että tietojen hakeminen ja raporttien tuottaminen on helpompaa.

Dimensiomalleja käytetään siis tietovarastojärjestelmissä, eivätkä ne sovi hyvin relaatiojärjestelmiin.

Tässä opetusohjelmassa, opit-

  • Dimensiomuotoisen tietomallin elementit
  • Fakta
  • Dimensio
  • Attribuutit
  • Fakta-taulu
  • Dimensiotaulukko
  • Dimensiotaulukko
  • Dimensioiden tyypit tietovarastossa
  • Dimensiomuotoisen mallinnuksen askeleet
  • Vaihe 1) Liiketoimintaprosessin yksilöiminen
  • Vaihe 2) Jyvän yksilöiminen.
  • Vaihe 3) Tunnista dimensiot
  • Vaihe 4) Tunnista fakta
  • Vaihe 5) Rakenna skeema
  • Säännöt dimensiomallinnusta varten
  • Hyötyjä dimensiomallinnuksesta

Dimensiomuotoisen tietomallin elementit

Fakta

Faktat ovat mittausarvoja/metriikoita tai faktaesineitä, jotka ovat lähtöisin liiketoimintasi prosessista. Myynnin liiketoimintaprosessissa mittaustieto olisi neljännesvuosittainen myyntiluku

Dimension

Dimension tarjoaa liiketoimintaprosessin tapahtumaan liittyvän kontekstin. Yksinkertaisesti sanottuna ne kertovat faktan kuka, mitä ja missä. Myynti-liiketoimintaprosessissa faktan Neljännesvuosittainen myyntinumero osalta ulottuvuudet olisivat

  • Kuka – Asiakkaiden nimet
  • Missä – Sijainti
  • Mitä – Tuotteen nimi

Toisin sanoen ulottuvuus on ikkuna, jonka kautta voi tarkastella faktojen tietoja.

Attribuutit

Attribuutit ovat dimensioiden erilaisia ominaisuuksia dimensiotietomallinnuksessa.

Sijainti-ulottuvuudessa attribuutteja voivat olla

  • valtio
  • maa
  • postinumero jne.

Attribuutteja käytetään faktojen etsimiseen, suodattamiseen tai luokitteluun. Dimensiotaulukot sisältävät attribuutteja

Faktataulu

Faktataulu on ensisijainen taulukko dimensiomallinnuksessa.

Faktataulu sisältää

  1. Mittaukset/faktat
  2. Lähdeavain dimensiotaulukkoon

Dimensiotaulukko

  • Dimensiotaulukko sisältää faktan ulottuvuudet.
  • Ne liitetään faktatauluun vieraan avaimen kautta.
  • Dimensiotaulukot ovat de-normalisoituja taulukoita.
  • Dimensioattribuutit ovat dimensiotaulukon eri sarakkeita
  • Dimensiot tarjoavat kuvailevia ominaisuuksia faktoille niiden attribuuttien avulla
  • Dimensioiden lukumäärälle ei ole annettu tiettyä rajaa
  • Dimensio voi myös sisältää yhden tai useamman hierarkkisen suhteen

Dimensiotyypit tietovarastossa

Seuraavissa on lueteltu dimensioiden tyyppejä tietovarastossa:

  • Muotoiltu ulottuvuus
  • Ohjaava ulottuvuus
  • Supistettu ulottuvuus
  • Rooli-playing Dimension
  • Dimension to Dimension Table
  • Junk Dimension
  • Degenerate Dimension
  • Swappable Dimension
  • Step Dimension

Dimensiomallinnuksen vaiheet

Dimensiomallinnuksen luomisen tarkkuus ratkaisee tietovarastototeutuksen onnistumisen. Tässä ovat vaiheet ulottuvuusmallin luomiseen

  1. Tunnista liiketoimintaprosessi
  2. Tunnista jyvä (yksityiskohtaisuuden taso)
  3. Tunnista ulottuvuudet
  4. Tunnista faktat
  5. Rakenna tähti

Mallin tulisi kuvata Miksi, Kuinka paljon, Milloin/Missä/Kuka ja Mitä liiketoimintaprosessistasi

Vaihe 1) Tunnista liiketoimintaprosessi

Todellisen liiketoimintaprosessin tunnistaminen, jonka tietovaraston tulisi kattaa. Tämä voi olla markkinointi, myynti, HR jne. organisaation data-analyysitarpeiden mukaan. Liiketoimintaprosessin valinta riippuu myös kyseistä prosessia varten käytettävissä olevien tietojen laadusta. Se on tietomallinnusprosessin tärkein vaihe, ja jos tässä epäonnistutaan, seurauksena on kaskadoituvia ja korjaamattomia vikoja.

Liiketoimintaprosessin kuvaamiseen voidaan käyttää pelkkää tekstiä tai käyttää BPMN:n (Business Process Modelling Notation) tai UML:n (Unified Modelling Language) perusmerkintöjä.

Vaihe 2) Määritä jyvitys

Jyvitys kuvaa liiketoimintaongelman/ratkaisun yksityiskohtaisuuden tasoa. Se on prosessi, jossa tunnistetaan tietovaraston minkä tahansa taulukon alin tietotaso. Jos taulukko sisältää myyntitietoja jokaiselta päivältä, sen pitäisi olla päivittäinen rakeisuus. Jos taulukko sisältää kokonaismyyntitietoja jokaiselta kuukaudelta, sen rakeisuus on kuukausittainen.

Tässä vaiheessa vastaat seuraavanlaisiin kysymyksiin:

  1. Tarvitseeko meidän tallentaa kaikki saatavilla olevat tuotteet vai vain muutamia tuotetyyppejä? Tämä päätös perustuu tietovarastoon valittuihin liiketoimintaprosesseihin
  2. Tallennammeko tuotteiden myyntitiedot kuukausittain, viikoittain, päivittäin vai tunneittain? Tämä päätös riippuu johtajien pyytämien raporttien luonteesta
  3. Miten edellä mainitut kaksi valintaa vaikuttavat tietokannan kokoon?

Esimerkki Grain:

Monikansallisen yrityksen toimitusjohtaja haluaa löytää tiettyjen tuotteiden myynnin eri paikkakunnilla päivittäin.

Jyvä on siis ”tuotteiden myyntitiedot paikkakunnittain päiväkohtaisesti”.

Vaihe 3) Tunnista dimensiot

Dimensiot ovat substantiiveja, kuten päivämäärä, myymälä, varasto jne. Näihin ulottuvuuksiin kaikki tiedot on tallennettava. Esimerkiksi päivämääräulottuvuus voi sisältää tietoja, kuten vuosi, kuukausi ja viikonpäivä.

Esimerkki ulottuvuuksista:

Yhtiön toimitusjohtaja haluaa löytää tiettyjen tuotteiden myynnin eri toimipisteissä päivittäin.

Dimensiot: Tuote, Paikka ja Aika

Attribuutit: Tuotteen osalta: Tuotteen avain (Foreign Key), Nimi, Tyyppi, Tekniset tiedot

Hierarkiat: Sijainnin osalta: Maa, osavaltio, kaupunki, katuosoite, nimi

Vaihe 4) Tunnista fakta

Tämä vaihe liittyy yhdessä järjestelmän liiketoimintakäyttäjiin, koska tässä vaiheessa he pääsevät käsiksi tietovarastoon tallennettuihin tietoihin. Suurin osa faktataulukon riveistä on numeerisia arvoja, kuten hinta tai yksikkökustannus jne.

Esimerkki faktatiedoista:

Erään monikansallisen yrityksen toimitusjohtaja haluaa löytää tiettyjen tuotteiden myynnin eri paikkakunnilla päivittäin.

Fakta tässä on Sum of Sales by product by location by time.

Vaihe 5) Rakenna skeema

Tässä vaiheessa toteutetaan dimensiomalli. Skeema ei ole mitään muuta kuin tietokannan rakenne (taulujen järjestely). On olemassa kaksi suosittua skeemaa

  1. Tähti skeema

Tähti skeema-arkkitehtuuri on helppo suunnitella. Sitä kutsutaan tähtikaavioksi, koska kaavio muistuttaa tähteä, jonka keskipisteestä säteilevät pisteet. Tähden keskipiste koostuu faktataulukosta, ja tähden pisteet ovat dimensiotaulukoita.

Tähtikaaviossa faktataulukot ovat kolmannessa normaalimuodossa, kun taas dimensiotaulukot ovat de-normalisoituja.

  1. Lumihiutalekaavio

Lumihiutalekaavio on tähtikaavion laajennus. Lumihiutalekaaviossa jokainen ulottuvuus normalisoidaan ja liitetään useampiin ulottuvuustaulukoihin.

Dimensiomallinnuksen säännöt

Seuraavassa on esitetty dimensiomallinnuksen säännöt ja periaatteet:

  • Lataat atomiset tiedot dimensiorakenteisiin.
  • Rakennat dimensiomallit liiketoimintaprosessien ympärille.
  • Varmennat, että jokaisella faktataululla on siihen liittyvä päivämäärää kuvaava dimensiotaulukko.
  • Varmennat, että kaikki faktat yksittäisessä faktataulussa ovat samassa rakeisuudessa tai samalla detaljitasolla.
  • Tärkeää tallentaa raporttitarrat ja suodatusalueen arvot dimensiotaulukoihin
  • Varmista, että dimensiotaulukoissa käytetään sijaisavainta
  • Tasapainota jatkuvasti vaatimuksia ja realiteetteja, jotta voit toimittaa liiketoimintaratkaisun tukemaan niiden päätöksentekoa

Dimensiomallinnuksen hyödyt

  • Dimensioiden vakioiminen mahdollistaa helpon raportoinnin liiketoiminnan eri osa-alueilla.
  • Dimensiotaulukot tallentavat dimensiotietojen historian.
  • Sen avulla voidaan ottaa käyttöön kokonaan uusia ulottuvuuksia ilman suuria häiriöitä faktatauluun.
  • Dimensiotaulukot myös tallentavat tietoja siten, että niistä on helpompi hakea tietoa, kun tiedot on tallennettu tietokantaan.
  • Vertailtuna normalisoituun malliin dimensiotaulukot ovat helpompia ymmärtää.
  • Tiedot on ryhmitelty selkeisiin ja yksinkertaisiin liiketoimintaluokkiin.
  • Dimensiomalli on liiketoiminnan kannalta hyvin ymmärrettävä. Tämä malli perustuu liiketoiminnan termeihin, joten liiketoiminta tietää, mitä kukin fakta, ulottuvuus tai attribuutti tarkoittaa.
  • Dimensiomallit ovat deformalisoituja ja optimoituja nopeaa tietojen kyselyä varten. Monet relaatiotietokanta-alustat tunnistavat tämän mallin ja optimoivat kyselyjen suoritussuunnitelmat suorituskyvyn parantamiseksi.
  • Dimensionaalinen mallintaminen tietovarastossa luo skeeman, joka on optimoitu suurta suorituskykyä varten. Se tarkoittaa vähemmän yhdistämisiä ja auttaa tietojen redundanssin minimoimisessa.
  • Dimensiomalli auttaa myös parantamaan kyselyiden suorituskykyä. Se on enemmän denormalisoitu, joten se on optimoitu kyselyjä varten.
  • Dimensionaaliset mallit pystyvät mukautumaan muutoksiin mukavasti. Dimensiotaulukoihin voidaan lisätä lisää sarakkeita ilman, että se vaikuttaa näitä taulukoita käyttäviin nykyisiin business intelligence -sovelluksiin.

Mikä on moniulotteinen tietomalli tietovarastossa?

Moniulotteinen tietomalli tietovarastossa on malli, joka edustaa tietoja datakuutioiden muodossa. Sen avulla voidaan mallintaa ja tarkastella tietoja useissa ulottuvuuksissa, ja se määritellään ulottuvuuksien ja faktojen avulla. Moniulotteinen tietomalli on yleensä luokiteltu keskeisen teeman ympärille, ja se esitetään faktataulukon avulla.

Yhteenveto:

  • Dimensiomalli on tietovarastotyökaluja varten optimoitu tietorakennetekniikka.
  • Faktat ovat liiketoimintaprosessin mittauksia/mittareita tai faktoja.
  • Dimensio tarjoaa liiketoimintaprosessin tapahtumaan liittyvän kontekstin.
  • Attribuutit ovat ulottuvuusmallinnuksen eri ominaisuuksia.
  • Faktataulu on ensisijainen taulukko ulottuvuusmallissa.
  • Dimensiotaulu sisältää faktan ulottuvuudet.
  • Faktoja on kolmea eri tyyppiä: 1. Faktoja on kolmea tyyppiä. Additiiviset 2. Ei-additiiviset 3. Puoli-additiiviset .
  • Dimensiotyyppejä ovat Muodostettu, Outrigger, Kutistettu, Roolitettu, Dimensio dimensiotaulukkoon, Junk, Degeneroitunut, Vaihdettava ja Askel-dimensiot.
  • Dimensiomallinnuksen viisi vaihetta ovat 1. Tunnista liiketoimintaprosessi 2. Identify Grain (yksityiskohtaisuuden taso) 3. Tunnista ulottuvuudet 4. Tunnista faktat 5. Rakenna tähti
  • Tietovaraston dimensiomallinnusta varten on varmistettava, että jokaiseen faktatauluun liittyy päivämääräulottuvuustaulukko.

Vastaa

Sähköpostiosoitettasi ei julkaista.