Python Seaborn Tutorial: Hvad er Seaborn og hvordan man bruger det?



Python Seaborn tutorial sammen med forskellen mellem seaborn og matplotlib. Lær også om de forskellige funktioner og tilpasninger, der er tilgængelige i havfødte.

Python er et lagerhus med mange uhyre magtfulde biblioteker og rammer. Blandt dem er Seaborn, hvilket er en dominerende datavisualisering bibliotek, hvilket giver endnu en grund til, at programmører skal gennemføre . I denne Python Seaborn Tutorial vil du læne alle evnerne til datavisualisering ved hjælp af Seaborn.

Før vi går videre, skal vi kigge igennem alle diskussionsemnerne i denne artikel:





Så lad os først begynde med at begrunde vigtigheden af ​​Python Seaborn.

Hvorfor bruge Python Seaborn?

Som tidligere nævnt bruges Python Seaborn-biblioteket til at lette den udfordrende opgave med datavisualisering, og den er baseret på . Seaborn tillader oprettelse af statistisk grafik gennem følgende funktioner:



  • En API, der er baseret på datasæt, der muliggør sammenligning mellem flere variabler

  • Understøtter net med flere plot, der igen letter bygning af komplekse visualiseringer

  • Univariate og bivariate visualiseringer tilgængelige til sammenligning mellem delmængder af data



  • Tilgængelighed af forskellige farvepaletter for at afsløre forskellige slags mønstre

  • Skøn og plot automatisk

Så hvis du spekulerede på, hvorfor du bruger Seaborn, når du allerede har Matplotlib, er her svaret på det.

Python Seaborn vs Matplotlib:

”Hvis Matplotlib“ forsøger at gøre lette ting lette og hårde ting mulige ”, forsøger seaborn også at gøre et veldefineret sæt hårde ting let” - Michael Waskom (skaber af Seaborn).
Faktisk er Matplotlib god, men Seaborn er bedre. Der er grundlæggende to mangler ved Matplotlib, som Seaborn løser:

  1. Matplotlib kan tilpasses, men det er svært at finde ud af, hvilke indstillinger der kræves for at gøre plot mere attraktivt. På den anden side kommer Seaborn med adskillige tilpassede temaer og grænseflader på højt niveau for at løse dette problem.

  2. Når du arbejder med Pandaer , Matplotlib fungerer ikke godt, når det kommer til at håndtere DataFrames, mens Seaborn-funktioner faktisk fungerer på DataFrames.

Hvordan installeres Seaborn?

For at installere Python Seaborn-biblioteket kan du bruge følgende kommandoer baseret på den platform, du bruger:

pip installere søfødt

metodeoverbelastning og metodeoverstyring i java

eller

conda installere seaborn

Når dette er installeret, skal du bare sørge for at installere de pakker og biblioteker, som seaborn er afhængige af.

Installation af Python Seaborn-afhængigheder:

Obligatoriske afhængigheder for søfødte er:

Der er også en anbefalet afhængighed, som er:

  • statsmodels

For at installere disse biblioteker kan du bruge de samme kommandoer som tidligere vist for Seaborn med deres respektive navne. Når de er installeret, kan de importeres let. Seaborn giver dig mulighed for at indlæse ethvert datasæt fra bruger load_dataset () fungere. Du kan også se alle de tilgængelige datasæt ved hjælp af get_dataset_names () -funktionen som følger:

EKSEMPEL:

importer søfødte som sns sns.get_dataset_names ()

Dette returnerer en liste over alle tilgængelige datasæt.
Nu hvor du har indstillet dit miljø til at arbejde med seaborn, lad os gå videre for at se, hvordan du bruger dets plottefunktioner i .

Seaborn Plotting-funktioner

Visualisering af statistiske forhold:

Processen med at forstå forholdet mellem variabler i et datasæt, og hvordan disse forhold afhænger af andre variabler kaldes statistisk analyse. Lad os nu se nærmere på de nødvendige funktioner til dette:

relplot ():

Dette er en figur-niveau-funktion, der gør brug af to andre aksefunktioner til visualisering af statistiske forhold, som er:

  • scatterplot ()
  • lineplot ()

Disse funktioner kan specificeres ved hjælp af 'kind' parameteren for relplot (). Hvis denne parameter er angivet, tager den standard, som er scatterplot (). Før du begynder at skrive din kode, skal du sørge for at importere de nødvendige biblioteker som følger:

import numpy som np import pandas som pd import matplotlib.pyplot som plt import søfødt som sns sns.set (style = 'darkgrid')

Bemærk, at stilattributten også kan tilpasses og kan have en hvilken som helst værdi som mørkrist, flåter osv., Som jeg vil diskutere senere i afsnittet plot-æstetik. Lad os nu se på et lille eksempel:

EKSEMPEL:

f = sns.load_dataset ('fly') sns.relplot (x = 'passagerer', y = 'måned', data = f)

PRODUKTION:

Flights1-Python Seaborn Tutorial-Edureka

Som du kan se, er punkterne afbildet i 2-dimensioner. Du kan dog tilføje en anden dimension ved hjælp af 'nuance'-semantikken. Lad os se på et eksempel på det samme:

EKSEMPEL:

f = sns.load_dataset ('fly') sns.relplot (x = 'passagerer', y = 'måned', farvetone = 'år', data = f)

Du får vist følgende output:

PRODUKTION:

Der er dog mange flere tilpasninger, som du kan prøve, såsom farver, stilarter, størrelse osv. Lad mig bare vise, hvordan du kan ændre farven i følgende eksempel:

EKSEMPEL:

sns.set (style = 'darkgrid') f = sns.load_dataset ('Flights') sns.relplot (x = 'passagerer', y = 'måned', nuance = 'år', palette = 'ch: r = - .5, l = .75 ', data = f)

PRODUKTION:

lineplot ():

Denne funktion giver dig mulighed for at tegne en kontinuerlig linje for dine data. Du kan bruge denne funktion ved at ændre parameteren 'kind' som følger:

EKSEMPEL:

a = pd.DataFrame ({'Dag': [1,2,3,4,5,6,7], 'Købmand': [30,80,45,23,51,46,76], 'Tøj' : [13,40,34,23,54,67,98], 'Redskaber': [12,32,27,56,87,54,34]}, indeks = [1,2,3,4,5 , 6,7]) g = sns.relplot (x = 'Day', y = 'Tøj', kind = 'line', data = a) g.fig.autofmt_xdate ()

PRODUKTION:

Standard for lineplot er y som en funktion af x. Det kan dog ændres, hvis du ønsker det. Der er mange flere muligheder, som du kan prøve videre.

Lad os nu se på, hvordan man tegner kategoriske data.

Planlægning med kategoriske data:

Denne tilgang kommer ind i billedet, når vores vigtigste variabel yderligere er opdelt i diskrete grupper (kategoriske). Dette kan opnås ved hjælp af funktionen catplot ().

katplot ():

Dette er en figur-niveau-funktion som relplot (). Det kan karakteriseres ved tre familier af akseniveaufunktioner, nemlig:

  1. Scatterplots - Disse inkluderer stripplot (), swarmplot ()

    hvordan man forhindrer blokering i java
  2. Distribution Plots - som er boxplot (), violinplot (), boxenplot ()

  3. Estimatplots - nemlig pointplot (), barplot (), countplot ()

Lad os nu tage et par eksempler for at demonstrere dette:

EKSEMPEL:

import søfødt som sns import matplotlib.pyplot som plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', data = a)

PRODUKTION:

Som du kan se, har jeg i ovenstående eksempel ikke indstillet 'kind' parameteren. Derfor har den returneret grafen som standardspredningsdiagram. Du kan angive en hvilken som helst af akseniveaufunktionen for at ændre grafen efter behov. Lad os også tage et eksempel på dette:

EKSEMPEL:

import søfødt som sns import matplotlib.pyplot som plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', kind = 'violin', data = a)

PRODUKTION:

Ovenstående output viser violinplottet til tipdatasættet. Lad os nu prøve at finde ud af, hvordan vi visualiserer distributionen af ​​et datasæt.

Visualisering af distributionen af ​​et datasæt:

Dette handler grundlæggende med at forstå datasæt med kontekst til at være univariate eller bivariate. Før du starter med dette, skal du bare importere følgende:

import numpy som np import pandas som pd import søfødt som sns import matplotlib.pyplot som plt fra scipy import stats sns.set (color_codes = True)

Når dette er gjort, kan du fortsætte med at tegne univariate og bivariate distributioner.

Planlægning af univariate distributioner:

For at plotte dem kan du bruge distplot () -funktionen som følger:

EKSEMPEL:

a = np. tilfældig.normal (loc = 5, størrelse = 100, skala = 2) sns.distplot (a)

PRODUKTION:

Som du kan se i ovenstående eksempel, har vi tegnet en graf for variablen a hvis værdier genereres af den normale () funktion ved hjælp af distplot.

Planlægning af bivariate distributioner:

Dette kommer ind i billedet, når du har to tilfældige uafhængige variabler, hvilket resulterer i en sandsynlig begivenhed. Den bedste funktion til at plotte denne type grafer er jointplot (). Lad os nu tegne en bivariat graf ved hjælp af jointplot ().

EKSEMPEL:

x = pd.DataFrame ({'Dag': [1,2,3,4,5,6,7], 'Købmand': [30,80,45,23,51,46,76], 'Tøj' : [13,40,34,23,54,67,98], 'Redskaber': [12,32,27,56,87,54,34]}, indeks = [1,2,3,4,5 , 6,7]) y = pd.DataFrame ({'Day': [8,9,10,11,12,13,14], 'Supermarked': [30,80,45,23,51,46, 76], 'Tøj': [13,40,34,23,54,67,98], 'Redskaber': [12,32,27,56,87,54,34]}, indeks = [8,9 , 10,11,12,13,14]) gennemsnit, cov = [0, 1], [(1, .5), (.5, 1)] data = np. tilfældig.multivariat_normal (gennemsnit, cov, 200 ) med sns.axes_style ('hvid'): sns.jointplot (x = x, y = y, kind = 'kde', color = 'b')

PRODUKTION:

Nu hvor du har forstået de forskellige funktioner i Python Seaborn, skal vi gå videre med at opbygge strukturerede multi-plot gitre.

Multi-Plot-gitre:

Python Seaborn giver dig mulighed for at plotte flere gitre side om side. Disse er grundlæggende plotter eller grafer, der er tegnet ved hjælp af samme skala og akser for at hjælpe med sammenligning mellem dem. Dette hjælper igen programmøren med at skelne hurtigt mellem plotene og få store mængder information.

Overvej følgende eksempel på facetgrid () -funktion for at plotte disse grafer.

EKSEMPEL:

sns.set (style = 'darkgrid') a = sns.load_dataset ('iris') b = sns.FacetGrid (a, col = 'species') b.map (plt.hist, 'sepal_length')

PRODUKTION:

Ovenstående output viser tydeligt sammenligningen mellem de tip, der gives under frokost og middag. Du kan også plotte ved hjælp af PairGrid-funktionen, når du har et par variabler, du kan sammenligne. Overvej følgende eksempel.

EKSEMPEL:

sns.set (style = 'ticks') a = sns.load_dataset ('Flights') b = sns.PairGrid (a) b.map (plt.scatter)

PRODUKTION:

Som du kan se, sammenligner ovenstående output klart mellem året og antallet af passagerer på forskellige måder.

Seaborn tillader også tilpasninger vedrørende æstetik, som diskuteres yderligere.

Plot-æstetik:

Dette segment af Python Seaborn tutorial handler om at gøre vores plot mere attraktivt og dejligt.

Python Seaborn Figur-æstetik:

Den første funktion, som jeg skal diskutere, er indstillet (). Jeg har brugt parameteren 'stil' for denne funktion før. Denne parameter handler grundlæggende om søfødte temaer. På nuværende tidspunkt er der fem af dem tilgængelige, nemlig mørkrist, flåter, hvidgitter, hvid og mørk.

Overvej følgende eksempel, der demonstrerer det hvide tema.

EKSEMPEL:

importer søfødt som sns import matplotlib.pyplot som plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'day', y = 'total_bill', data = a)

PRODUKTION:

I ovenstående output kan du bemærke, at temaet er ændret til hvidt. Du kan også udforske dem yderligere ved hjælp af de andre temaer. Hvis du bemærker i den forrige output, er der akser til stede rundt om i grafen. Dette kan dog også tilpasses ved hjælp af funktionen despine (). Se eksemplet nedenfor.

EKSEMPEL:

importer søfødt som sns import matplotlib.pyplot som plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'day', y = 'total_bill', data = a) sns.despine (offset = 10, trim = True)

PRODUKTION:



Bemærk forskellen mellem de to foregående udgange. Der er dog mange flere muligheder, som du selv kan udforske.

Python Seaborn farvepaletter:

Farve er dybest set den funktion, der nærmer sig de menneskelige øjne ud over enhver anden funktion. Seaborn giver dig mulighed for at lege med farver ved hjælp af forskellige funktioner såsom color_palette (), hls_palette (), husl_palette () osv. Se på de farver, der i øjeblikket findes inden for seaborn.

EKSEMPEL:

importer numpy som np import søfødt som sns import matplotlib.pyplot som plt sns.set () presentcolors = sns.color_palette () sns.palplot (presentcolors)

PRODUKTION:

hvad er __init__ i python

Ovenstående billede viser de farver, der er til stede inden for havfødte. Jeg har gjort det ved hjælp af palplot () -funktionen. For dybere variationer kan du bruge hls_palette (), husl_palette () osv.

Dette bringer os til slutningen af ​​Python Seaborn Tutorial. Jeg håber, du har forstået alt klart. Sørg for at øve så meget som muligt .

Har du et spørgsmål til os? Nævn det i kommentarfeltet i denne 'Python Seaborn Tutorial' -blog, og vi vender tilbage til dig hurtigst muligt.

For at få dybtgående viden om Python sammen med dens forskellige applikationer kan du tilmelde dig live med 24/7 support og livstidsadgang.