Målet med ethvert BI-værktøj er at give Dataanalyse et bedre flow. Hvis man som professionel står over for vanskelighederne med at bruge værktøjet, mens man løser et problem, er strømningstilstanden brudt. En almindelig årsag til dette problem er behovet for at arbejde med data, der er samlet til forskellige Detaljeringsniveau i tabletten (LOD) .
Tableau, der placeres oven på bunken for 6. gang i træk, på Gartners Magic Quadrant, siger bestemt noget om sin efterspørgsel på markedet. Dette er sandsynligvis det bedste tidspunkt at .
Denne blog hjælper dig med at forstå LOD-udtryk og diskutere følgende emner:
- Hvorfor har du brug for detaljeringsniveau i Tableau?
- Hvad er detaljeringsniveauet i Tableau?
- Række niveau & Vis niveau udtryk
- Typer af LOD-udtryk
- Aggregering og LOD-udtryk
- Filtre og LOD-udtryk
- Oprettelse af LOD-udtryk
- Datakilder, der understøtter detaljeringsniveau i tabletten
- Tabelberegninger versus detaljeringsniveau i tabletten
- Begrænsninger af detaljeringsniveau i tabletten
Tableau LOD: Hvorfor har du brug for LOD?
Der er ofte spørgsmål, som man kommer til at komme på tværs af, når man analyserer data. Disse spørgsmål er ofte enkle at stille, men svære at besvare. De lyder ofte noget som:
For at løse disse typer spørgsmål blev der introduceret en ny syntaks kaldet Niveau for detaljer i Tableau 9.0. Denne nye syntaks både forenklet og udvidet Tableaus beregningssprog ved at gøre det muligt at adressere disse spørgsmål direkte.
Tableau LOD: Hvad er LOD?
LOD-udtryk repræsenterer en elegant og effektiv måde at besvare spørgsmål, der involverer flere niveauer af granularitet i en enkelt visualisering.
blanding af tableddata fungerer ikke
Detaljeringsniveau i Tableau- eller LOD-udtryk giver dig mulighed for at beregne værdier på datakildeniveau og visualiseringsniveau. LOD-udtryk giver dig dog endnu mere kontrol på det granularitetsniveau, du vil beregne. De kan udføres på en mere granulær niveau (INCLUDE Calculation), a mindre kornet niveau (EXCLUDE Calculation) eller et helt uafhængig mild l (FAST beregning).
Tableau LOD: Række niveau & Vis niveau udtryk
Række niveau
I Tableau refererer udtryk uaggregeret datakildekolonner beregnes for hver række i den underliggende tabel. I dette tilfælde er udtrykkets dimensionalitet række niveau . Et eksempel på et udtryk på række-niveau er:
[Salg] / [Profit]
Denne beregning evalueres i hver række i databasen. Salgsværdien i hver række divideres med fortjenstværdien i den række og producerer en ny kolonne med resultatet af multiplikationen (et fortjenesteforhold).
Hvis du opretter en beregning med denne definition, skal du gemme den med navnet [ProfitRatio], og træk den derefter fra Datarude til en hylde, Tableau aggregerer typisk det beregnede felt for visningen:
SUM [ProfitRatio]
Visningsniveau
I modsætning hertil henvisninger til udtryk aggregeret datakildekolonner beregnes med den dimensionalitet, der er defineret af dimensionerne i visningen. I dette tilfælde er udtryksdimensionaliteten visningsniveau. Et eksempel på et udtryk på visningsniveau er:
SUM (salg) / SUM (fortjeneste)
Hvis du trækker denne beregning til en hylde (eller skriver den direkte på en hylde som en ad hoc-beregning), lukker Tableau den i en AGG-funktion :
AGG (SUM (salg) / SUM (fortjeneste))
Dette er hvad der er kendt som en Samlet beregning .
Tableau LOD: Aggregering og LOD-udtryk
LOD-udtryk er grovere end udsigtsniveauet
Et udtryk har et grovere detaljeringsniveau end visningen, når det refererer til a delmængde af dimensionerne i udsigten.
For eksempel til en visning, der indeholdt dimensionerne [Kategori] og [Segment], kan du oprette et detaljeringsniveau i Tableau, der kun bruger en af disse dimensioner:
{FAST [Segment]: SUM ([salg])}
I dette tilfælde har udtrykket et grovere detaljeringsniveau end udsigten. Det baserer sine værdier på en dimension ([Segment]), hvorimod udsigten baserer sin opfattelse på to dimensioner ([Segment] og [Kategori]).
Resultatet er, at brug af detaljeringsniveauet i visningen får visse værdier til at replikeres - det vil sige til vises flere gange .
LOD-ekspression er finere end udsigtsniveauet
Et udtryk har et finere detaljeringsniveau end visningen, når det refererer til a overmængde af dimensionerne i udsigten.
Når du bruger et sådant udtryk i visningen, samler Tableau resultater op til visningsniveauet. For eksempel refererer det følgende detaljeringsniveau i Tableau til to dimensioner:
{FAST [Segment], [Kategori]: SUM ([Salg])}
Når dette udtryk bruges i en visning, der kun har [Segment] som detaljeringsniveau, er værdierne skal aggregeres . Her er hvad du ville se, hvis du trak dette udtryk til en hylde:
AVG ([{FAST [Segment]], [Kategori]]: SUM ([Salg]]}}))
En sammenlægning (i dette tilfælde gennemsnit) tildeles automatisk af Tableau. Du kan ændre sammenlægningen efter behov.
Tilføjelse af et LOD-udtryk til visningen
Om et detaljeringsniveau i Tableau-udtryk er aggregeret eller replikeret i visningen bestemmes af ekspressionstype og granularitet .
- INKLUDER udtryk har enten det samme niveau af detaljer som udsigten eller et finere detaljeringsgrad end udsigten. Derfor replikeres værdier aldrig.
- FASTE udtryk kan have et finere detaljeringsniveau end udsigten, et grovere detaljeringsniveau eller det samme niveau af detaljer. Behovet for at samle resultaterne af et FIKTET detaljeringsniveau afhænger af, hvilke dimensioner der er i visningen.
- EXCLUDE-udtryk får altid replikerede værdier til at vises i visningen. Når beregninger inklusive EXCLUDE niveau af detaljeringsudtryk placeres på en hylde, er Tableau som standard standardindstillingen ATTR-aggregering i modsætning til SUM eller AVG, for at indikere, at udtrykket faktisk ikke aggregeres, og at ændring af aggregering ikke har nogen effekt på udsigten.
Detaljeringsniveauudtryk pakkes altid automatisk sammen, når de føjes til en hylde i visningen, medmindre de bruges som dimensioner.
Tableau LOD: Filtre og LOD-udtryk
Billedet her viserrækkefølge for udførelse af filtre fra top til bund.Teksten til højre viser, hvor LOD-udtryk evalueres i denne sekvens.
Uddragsfiltre (i orange) er kun relevante, hvis du opretter en Tableau-uddrag fra en datakilde. Tabelberegningsfiltre (mørkeblå) anvendes, når beregningerne er udført, og skjuler derfor mærker uden at filtrere de underliggende data, der er brugt i beregningerne.
FASTE beregninger anvendes før dimensionsfiltre, så medmindre du promoverer felterne på din filterhylde for at forbedre visningsydelsen med kontekstfiltre, ignoreres de.
Tableau LOD: Typer af LOD-udtryk
INKLUDERER Beregning
INCLUDE beregner værdier ved hjælp af de angivne dimensioner ud over de dimensioner, der er i visningen. Dette detaljeringsniveau er mest nyttigt, når man inkluderer en dimension, der ikke er i visningen.
For eksempel: {INCLUDE [Customer Name]: SUM ([Sales])}
EKSKLUDERING Beregning
UDELUKKE fjerner eksplicit dimensioner fra udtrykket - det vil sige, de trækker dimensioner fra detaljeringsniveauet. Dette niveau af detaljer i Tableau er mest nyttigt til at eliminere en dimension i visningen.
For eksempel: {EXCLUDE [Region]: SUM ([Sales])}
FAST beregning
FIXED beregner værdier ved hjælp af de angivne dimensioner uden henvisning til detaljeringsniveauet - det vil sige uden henvisning til andre dimensioner i visningen. Dette detaljeringsniveau ignorerer også alle filtre i visningen bortset fra kontekstfiltre, datakildefiltre og ekstraktfiltre.
For eksempel: {FAST [Region]: SUM ([Salg])}
stigende rækkefølge c ++
Tableau LOD: Oprettelse af LOD-udtryk
Syntaks for et LOD-udtryk
Et detaljeringsniveau har følgende struktur:
OMFATTE
Trin 1: Opsæt visualiseringen
- Åbn Tableau Desktop, og opret forbindelse til Prøve-Superstore gemt datakilde.
- Naviger til et nyt regneark.
- Fra Data træk under Dimensioner Område til Kolonner Hylde.
- Fra Data træk under Mål Salg til Rækker Hylde. Der vises et søjlediagram, der viser summen af salget for hver region.
Trin 2: Opret LOD-udtrykket
I stedet for summen af alt salg pr. Region, vil du måske også se det gennemsnitlige salg pr. Kunde for hver region. Du kan bruge et LOD-udtryk til at gøre dette.
- Vælg Analyse > Opret beregnet felt.
- Gør følgende i beregningseditoren, der åbnes:
- Navngiv beregningen, salg pr. Kunde.
- Indtast følgende LOD-udtryk:
{INCLUDE [Customer Name]: SUM ([Sales])}
- Når du er færdig, skal du klikke på Okay. Det nyoprettede LOD-udtryk føjes til dataruden under Målinger.
Trin 3: Brug LOD-udtrykket i visualiseringen
- Fra Data træk under Mål Salg pr. Kunde til Rækker hylden og placer den til venstre for SUM (salg).
- Højreklik på rækkehylden Salg pr. Kunde og vælg Mål (sum) > Gennemsnit. Du kan nu se både summen af alt salg og det gennemsnitlige salg pr. Kunde for hver region. For eksempel kan du se, at salget i den centrale region udgjorde ca. 500.000 USD med et gennemsnitligt salg for hver kunde på ca. 800 USD .
Tableau LOD: Datakilder, der understøtter LOD-udtryk
Datakilde | Understøttet / Ikke understøttet |
Actian Vectorwise | Ikke understøttet. |
Amazon EMR Hadoop Hive | Understøttet Hive 0.13 og fremefter. |
Amazon Redshift | Understøttet. |
Aster-database | Understøttet version 4.5 og fremefter. |
Cloudera Hadoop | Understøttet Hive 0.13 og fremefter. |
Cloudera Impala | Understøttet Impala 1.2.2 og fremefter. |
Kuber (flerdimensionelle datakilder) | Ikke understøttet. |
DataStax Enterprise | Ikke understøttet. |
EXASOL | Understøttet. |
Firebird | Understøttet version 2.0 og fremefter. |
Generisk ODBC | Begrænset. Afhænger af datakilde. |
Google Big Query | Understøttes til Standard SQL, ikke Legacy. |
IBM DB2 | Understøttet version 8.1 og fremefter. |
MarkLogic | Understøttet version 7.0 og fremefter. |
SAP HANA | Understøttet. |
SAP Sybase ASE | Understøttet. |
SAP Sybase IQ | Understøttet version 15.1 og fremefter. |
Gnist SQL | Understøttet. |
Splunk | Ikke understøttet. |
Dataekstraktabel | Understøttet. |
Teradata | Understøttet. |
Vertica | Understøttet version 6.1 og fremefter. |
Microsoft Access | Ikke understøttet. |
Microsoft Jet-baserede forbindelser | Ikke understøttet. |
Hortonworks Hadoop Hive | Understøttet Hive 0.13 og fremefter. På version 1.1 af HIVE er LOD-udtryk, der producerer krydsforbindelser, ikke pålidelige. |
IBM BigInsights | Understøttet. |
Microsoft SQL Server | Understøttet SQL Server 2005 og fremefter. |
MySQL | Understøttet. |
IBM PDA (Netezza) | Understøttet version 7.0 og fremefter. |
Oracle | Understøttet version 9i og fremefter. |
Actian Matrix (ParAccel) | Understøttet version 3.1 og fremefter. |
Pivotal Greenplum | Understøttet version 3.1 og fremefter. |
PostgreSQL | Understøttet version 7.0 og fremefter. |
Fremskridt OpenEdge | Understøttet. |
Tableau LOD: Tabelberegninger vs LOD
LOD-udtryk er ikke en ny form for tabelberegninger. Selvom de kan erstatte mange tabelberegninger, er deres hovedmål at åbne nye muligheder.LOD-udtryk og tabelberegninger fungerer forskelligt.
Tabelberegninger | LOD-udtryk |
Tabelberegninger genereres af Forespørgselsresultater . | LOD-udtryk genereres som en del af forespørgslen til underliggende datakilde . De udtrykkes som et indlejret valg, så det afhænger af DBMS-ydeevne. |
Tabelberegninger kan producerer kun resultater, der er lig med eller mindre granulære end den nævnte LOD. | LOD kan producere resultater uafhængig af nævnte LOD . |
Dimensioner, der styrer operationerne i en tabel, er adskilt fra beregningssyntaxen. | Dimensioner, der styrer operationerne af et LOD-udtryk er indlejret i udtrykket sig selv. |
Tabelberegninger bruges som aggregerede foranstaltninger . | LOD-udtryk kan bruges i andre konstruktioner. |
Filtre i tabelberegninger fungerer som en SKJULE . | Filtre på LOD fungerer som en UDELUKKE . |
Tableau LOD: Begrænsninger af LOD
Følgende er de begrænsninger, der gælder for LOD-udtryk.
- LOD-udtryk, der henviser til mål med flydende punkt, har tendens til at opføre sig upålideligt, når de bruges i en visning, der kræver en sammenligning af værdierne i udtrykket.
- LOD vises ikke på datakildesiden.
- Når der henvises til en parameter i en dimensionalitetserklæring, skal du altid bruge parameternavnet og ikke parameterværdien.
- Når data blandes, skal linkfeltet fra den primære datakilde være i visningen, før du kan bruge et detaljeringsniveauudtryk fra den sekundære datakilde.
Derudover har nogle datakilder kompleksitetsgrænser. Tableau deaktiverer ikke beregninger for disse databaser, men forespørgselsfejl er en mulighed, hvis beregninger bliver for komplekse.