Hvad er en lodret database?

En lodret database er en, hvor det fysiske layout af data er kolonne for kolonne snarere end række for række. I stedet for at blive arrangeret i vandrette poststrukturer og behandlet lodret, er data i en lodret database arrangeret i lodrette strukturer, kendt som predikat træer eller P-træer, og behandles vandret.

Data Mining

Horisontale databaser er velegnede til applikationer, hvor det ønskede resultat er et sæt vandrette poster, men mindre for applikationer som datamining, hvor forskere typisk er interesserede i resultater, der kan udtrykkes kortfattet. P-træer er på den anden side velegnet til datamining. P-træer oprettes normalt ved at nedbryde hver attribut eller søjle i en tabel med vandrette poster i separate bitvektorer eller array-datastrukturer. P-træer kan være endimensionelle, todimensionale eller flerdimensionale; hvis de data, der skal gemmes i databasen, har naturlige dimensioner - for eksempel geospatiale data eller geografiske oplysninger - matches P-træets dimensioner med dataene.

Ydeevne

Data i en lodret database behandles gennem hurtige logiske operatorer, såsom AND, OR, eksklusiv OR og komplement. Ved at arrangere data kolonnemæssigt snarere end rækkevis er det desuden muligt at udføre forespørgsler eller søgninger på dataene uden at få adgang til sider på en harddisk, der ikke påvirkes af forespørgslen, og dermed øge hastigheden på datahentning . Dette er en vigtig overvejelse, når data mining i meget store datalagre.

Sidestørrelse

En anden fordel ved lodrette databaser er, at de gør det muligt at gemme data på store sider. En stor sidestørrelse betyder, at et stort antal relevante dataelementer kan hentes i en enkelt læseoperation. Derimod henter en enkelt læsning i en vandret database ikke kun relevante dataelementer, men også attributter eller kolonner, der ikke er relevante for den pågældende forespørgsel og favoriserer små sidestørrelser.

Videnskabelige anvendelser

Vertikale databaser har fået fornyet interesse fra det videnskabelige samfund i de senere år. Antallet af samtidige brugere i videnskabelige databaseapplikationer er typisk meget mindre end i kommercielle applikationer, men brugere har tendens til at indsende mere komplekse, uforudsete forespørgsler. Derudover skal videnskabelige databaseapplikationer typisk give et mere automatiseret svar på komplekse forespørgsler på grund af fraværet af database- og systemstøttemedarbejdere. Videnskabelige brugere foretrækker typisk at arbejde med dedikerede, interne computersystemer, så videnskabelige databaseapplikationer skal være bærbare mellem forskellige computermodeller. Lodrette databaser er bedre på alle disse punkter end deres vandrette modstykker.