Hvorfor skal du blande dig, når du allerede kan deltage i tabletten?



Datablanding i tablet - en metode, der bruges, når der er relaterede data i flere datakilder, som du vil analysere sammen i en enkelt visning.

I en verden, der genererer og bruger 2,5 kvm byte data om dagen, er organisationer nødt til at lede efter nye metoder til at transformere og kombinere data for at opnå optimal effektivitet. En sådan metode til at kombinere data er Datablanding i tablet .

Nu, fordi dette tjener et så vigtigt formål i datacyklussen for en given organisation, giver det et meget vigtigt modul i de fleste . I denne blog vil vi diskutere følgende begreber:





Hvorfor har du brug for datablanding i Tableau?

Antag, du er en Udviklerbord der har transaktionsdata gemt i Salesforce og kvotedata gemt i Access. De data, du vil kombinere, er gemt i forskellige databaser, og granulariteten af ​​de data, der er fanget i hver tabel, er forskellig i de to datakilder, så datablanding er den bedste måde at kombinere disse data på.

Datablanding er nyttig under følgende betingelser:



  1. Du vil kombinere data fra forskellige databaser, der ikke understøttes af krydsdatabaseforbindelser.

    Cross-database sammenføjninger understøtter ikke forbindelser til kuber (for eksempel Oracle Essbase) eller til nogle forbindelser, der kun er ekstraheret (f.eks. Google Analytics). I dette tilfælde skal du oprette individuelle datakilder til de data, du vil analysere, og derefter bruge datablanding til at kombinere datakilderne på et enkelt ark.

  2. Data er på forskellige detaljeringsniveauer.

    Nogle gange indfanger et datasæt data ved hjælp af forskellige niveauer af detaljer dvs. større eller mindre granularitet end det andet datasæt.

    Antag for eksempel, at du analyserer transaktionsdata og kvotedata. Transaktionsdata registrerer muligvis alle transaktioner. Dog kan kvotedata muligvis samle transaktioner på kvartalsniveau. Da transaktionsværdierne er fanget på forskellige detaljeringsniveauer i hvert datasæt, skal du bruge datablanding til at kombinere dataene.



Hvad er datablanding i Tableau?

Data Blending er en meget kraftig funktion i Bestyrelse . Det bruges, når der er relaterede data i flere datakilder, som du vil analysere sammen i en enkelt visning. Det er en metode til at kombinere data, der supplerer en datatabel fra en datakilde med kolonner med data fra en anden datakilde.

Normalt bruger du sammenføjninger til at udføre denne form for datakombination, men der er tidspunkter, afhængigt af faktorer som datatypen og dens granularitet, når det er bedre at bruge datablanding.

Hvordan adskiller det sig fra datatilslutning?

Datablanding simulerer en traditionel venstre sammenføjning. Den største forskel mellem de to er hvornår sammenføjningen udføres med hensyn til aggregering.

Venstre deltager

Når du bruger en venstre sammenføjning til at kombinere data, sendes en forespørgsel til den database, hvor sammenføjningen udføres. Brug af en venstre sammenføjning returnerer alle rækker fra venstre tabel og eventuelle rækker fra højre tabel, der har en tilsvarende række, i venstre tabel. Resultaterne af sammenføjningen sendes derefter tilbage til og aggregeres af Tableau.

hvordan man kører atom python

Antag for eksempel, at du har følgende tabeller. Hvis de almindelige kolonner er bruger ID , en venstre sammenføjning tager alle data fra den venstre tabel såvel som alle data fra den højre tabel, fordi hver række har et tilsvarende række match i den venstre tabel.

Data sammenføjning - Data blanding i Tableau - EdurekaDatablanding

Når du bruger datablanding til at kombinere data, sendes en forespørgsel til databasen for hver datakilde, der bruges på arket. Resultaterne af forespørgslerne, inklusive de aggregerede data, sendes tilbage og kombineres af Tableau. Visningen bruger alle rækker fra den primære datakilde, den venstre tabel og de samlede rækker fra den sekundære datakilde, den højre tabel, baseret på dimensionen af ​​de sammenkædende felter.

Du kan ændre sammenkædningsfeltet eller tilføje flere sammenkædningsfelter for at inkludere forskellige eller yderligere datarækker fra den sekundære datakilde i blandingen ved at ændre de samlede værdier.

Antag for eksempel, at du har følgende tabeller. Hvis de sammenkædende felter er bruger ID i begge tabeller blander dine data alle data fra venstre tabel og supplerer venstre tabel med data fra højre tabel. I dette tilfælde kan ikke alle værdier være en del af den resulterende tabel på grund af følgende:

  • En række i den venstre tabel har ikke en tilsvarende række i den højre tabel, som angivet med nulværdien.
  • Der er flere tilsvarende værdier i rækkerne i højre tabel, som angivet med stjernen (*).

Antag at du har de samme tabeller som ovenfor, men den sekundære datakilde indeholder et nyt felt kaldet Formål . Igen, hvis linkefeltet er bruger ID , at blande dine data tager alle data fra venstre tabel og supplerer dem med data fra højre tabel. I dette tilfælde ser du den samme nulværdi og stjerner i det foregående eksempel ud over følgende:

  • Fordi Formål felt er et mål, kan du se rækkeværdierne forFormålfelt aggregeret før dataene i højre tabel kombineres med dataene i venstre tabel.
  • Som med det foregående eksempel har en række i venstre tabel ikke den tilsvarende række for Formål felt, som angivet med den anden nulværdi.

Hvornår skal jeg erstatte tilmelding til Blanding

1. Data skal rengøres.

Hvis dine tabeller ikke stemmer overens med hinanden korrekt efter en sammenføjning, skal du oprette datakilder til hver tabel, foretage de nødvendige tilpasninger (dvs. omdøbe kolonner, ændre kolonnedatatyper, oprette grupper, bruge beregninger osv.) Og brug derefter datablanding til at kombinere dataene.

2. Sammenføjninger forårsager duplikatdata.

Kopierede data efter en sammenkædning er et symptom på data på forskellige detaljeringsniveauer. Hvis du bemærker duplikatdata, skal du i stedet for at oprette en sammenkædning bruge datablanding til at blande en fælles dimension i stedet.

3. Du har masser af data.

Typisk anbefales sammenføjninger til kombination af data fra den samme database. Forbindelser håndteres af databasen, som gør det muligt for sammenføjninger at udnytte nogle af databasens oprindelige muligheder. Men hvis du arbejder med store datasæt, kan sammenkædninger lægge en belastning på databasen og i væsentlig grad påvirke ydeevnen. I dette tilfælde kan datablanding måske hjælpe. Da Tableau håndterer kombinationen af ​​data, efter at dataene er samlet, er der færre data at kombinere. Når der er færre data at kombinere, forbedres ydeevnen generelt.

Blanding af dine data i Tableau

Du kan bruge datablanding, når du har data i separate datakilder, som du vil analysere sammen på et enkelt ark. Tableau har to indbyggede datakilder navngivet Prøve-superbutik og Eksempel på kaffekæde.mdb som vil blive brugt til at illustrere blanding af data.

Trin 1: Opret forbindelse til dine data, og konfigurer datakilderne

  • Opret forbindelse til et datasæt, og konfigurer datakilden på datakildesiden. Et inbuilt datakilde Eksempel på kaffekæde.mdb ,som er en MS Access-databasefil, vil blive brugt til at illustrere datablanding.
  • Gå til Data > Ny datakilde, oprette forbindelse til det andet datasæt.Dette eksempel bruger Prøve - Superstore datakilde. Then opsætter datakilden.
  • Klik på arkfanen for at begynde at opbygge din visning.

Trin 2: Udpeg en primær datakilde

  • Træk mindst et felt fra din primære datakilde til visningen for at angive det som den primære datakilde. I Data Klik på den datakilde, du vil udpege som den primære datakilde. I dette eksempel Prøve kaffekæde er valgt.
  • Følgende skærmbillede viser de forskellige tabeller og sammenføjninger, der er tilgængelige i filen.

Trin 3: Udpeg en sekundær datakilde

  • Felter, der bruges i visningen fra datakilder, der ikke er den primære datakilde eller aktive links, betegner automatisk efterfølgende datakilder som den sekundære datakilde. I dette tilfælde Sample Superstore.

Trin 4: Bland data

  • Nu kan du integrere data fra begge kilder baseret på en fælles dimension ( Stat , I dette tilfælde). Bemærk, at et lille linkbillede vises ved siden af ​​dimensionen - tilstand. Dette angiver den fælles dimension mellem de to datakilder.
  • Antag at du opretter et søjlediagram med Resultatforhold i søjlehylden og Stat i rækkehylden viser diagrammet, hvordan fortjenstforholdet varierer for hver stat i både supermarked og kaffekædebutikker.

Begrænsninger for datablanding i Tableau

  1. Der er nogle datablandingsbegrænsninger omkring ikke-additive aggregater, f.eks MEDIAN og RAWSQLAGG .
  2. Datablanding kompromitterer forespørgselshastigheden i høj granularitet.
  3. Når du prøver at sortere efter et beregnet felt, der bruger blandede data, vises det beregnede felt ikke i rullelisten Felt i dialogboksen Sorter.
  4. Kubedatakilder kan kun bruges som den primære datakilde til blanding af data i Tableau. De kan ikke bruges som sekundære datakilder.

Jeg håber, at I alle nu har en god idé om Datablanding i tablet fra denne blog. Sulten efter mere viden? Bare rolig, denne video giver dig en bedre forståelse af konceptet.