OLTP vs OLAP



Den følgende blog fortæller kort om OLTP vs OLAP og de forskellige brugssager.

OLTP vs OLAP

OLTP siges at være mere et online transaktions- eller datalagringssystem, hvor brugeren foretager mange onlinetransaktioner ved hjælp af datalageret. Det siges også, at der sker flere ad-hoc-læsninger / -skrivninger i realtid.





OLAP er mere en offline datalager. Det er tilgængeligtantal gangeoffline mode. For eksempel læses bulk-logfiler og skrives derefter tilbage til datafiler. Nogle af de fælles områder, hvor OLAP bruges, er Log Jobs, Data mining Jobs osv.

Cassandra siges at være mere af OLTP, da det er i realtid, mens Hadoop er mere af OLAP, da det bruges til analyse og masseskrivning.



Hvorfor integrere OLAP & OLTP?

Hvis du er på udkig efter den billigste pris for hotelbooking de næste 365 dage, har du et enormt datasæt til Cassandra og vil have anbefaling til en database i realtid, en kampagne køres baseret på pris.

I et sådant scenario skal vi gentage alle poster og holde analyser oven på det, hvilket er et kæmpe offlinejob, der ofte skal startes. Her kommer Hadoop i spil for Bulk data crunching.

Den anden fordel er, at vi kan køre en klynge og afbryde kørsel af en anden Hadoop-klynge.



Den tredje fordel er, at man også kan reducere en masse driftsomkostninger.

videregivelse af kommandolinjeargumenter i java

Givet et scenarie, hvor, hvis en bruger er fortrolig med forskellige Hadoop Eco-systemer, som Hive, Pig Latin og har brug for at integrere data i det, så skal man plug-in en datakilde i Cassandra og forsøge at køre Map Reducer også job.

Der er et mærkbart mønster mellem OLTP og OLAP. I OLTP er der færre antal skrivninger, f.eks. Hoteloplysninger. Forudsat at prisændringerne sker hver 5000 gange i sekundet, kan læsningerne være mere her. I et sådant scenario kan der være 1 skrivning pr. Sekund, men læsninger kan udvises til hundreder og tusinder. Så forholdet her er omkring 1: 1000.

Det er en interessant observation, at Cassandra let kan passe ind i denne model, som inkluderer modeller, hvor læs / skriv er lige. Også når det kommer til OLTP, selvom man kommer ind i en afstemningsbar og stærk konsistensmodel, kan man se et millisekundskel mellem eventuelle konsistente modeller og stærkeste konsistente modeller. Således kan Cassandra passe ind i OLTP.

hvad er et stik i java

Når man kommer til OLAP, kan man se forskellige OLAP-mønstre, hvilket betyder, at der sker flere skrivninger samtidigt. I OLAP dumper vi data i et skud, dvs. alle logfiler placeres i datalager, og derefter begynder vi behandlingen. Datamønsteret eller adgangsmønsteret er nøjagtigt det modsatte af OLTP-applikationstypen. Her vil Hadoop eller MapReduce være nyttigt.

Har du et spørgsmål til os? Nævn dem i kommentarfeltet, så vender vi tilbage til dig.

Relaterede indlæg:

Top 5 grunde til at lære Cassandra