Tutorial Python Seaborn: què és Seaborn i com utilitzar-lo?



Tutorial Python Seaborn sobre la diferència entre seaborn i matplotlib. Apreneu també sobre les diverses funcions i personalitzacions disponibles a Seaborn.

Python és un magatzem de nombroses biblioteques i marcs immensament potents. Entre ells, hi ha Nascut al mar, que és un dominant visualització de dades biblioteca, atorgant una altra raó perquè els programadors finalitzin . En aquest tutorial de Python Seaborn, us inclindreu a tots els coneixements de la visualització de dades mitjançant Seaborn.

Abans de continuar, fem un cop d'ull a tots els temes de discussió d'aquest article:





Comencem, doncs, primer raonant la importància de Python Seaborn.

Per què utilitzar Python Seaborn?

Com s’ha esmentat anteriorment, la biblioteca Python Seaborn s’utilitza per facilitar la desafiadora tasca de visualització de dades i es basa en . Seaborn permet la creació de gràfics estadístics mitjançant les següents funcionalitats:



  • Una API que es basa en conjunts de dades que permeten la comparació entre múltiples variables

  • Admet graelles de diverses trames que al seu torn faciliten la creació de visualitzacions complexes

  • Visualitzacions univariants i bivariants disponibles per comparar entre subconjunts de dades



  • Disponibilitat de diferents paletes de colors per revelar diversos tipus de patrons

  • Estimacions i parcel·les automàticament

Per tant, si us preguntàveu per què utilitzar Seaborn quan ja teniu Matplotlib, aquí teniu la resposta.

Python Seaborn contra Matplotlib:

'Si Matplotlib' intenta que les coses fàcils siguin fàcils i les coses difícils siguin possibles ', Seaborn intenta facilitar també un conjunt ben definit de coses difícils' - Michael Waskom (Creador de Seaborn).
De fet, Matplotlib és bo, però Seaborn és millor. Bàsicament, hi ha dues mancances de Matplotlib que corregeix Seaborn:

  1. Matplotlib es pot personalitzar, però és difícil esbrinar quins paràmetres es necessiten per fer que les parcel·les siguin més atractives. D'altra banda, Seaborn inclou nombrosos temes personalitzats i interfícies d'alt nivell per resoldre aquest problema.

  2. Quan es treballa amb pandes , Matplotlib no serveix bé a l’hora de tractar amb DataFrames, mentre que les funcions de Seaborn realment funcionen en DataFrames.

Com instal·lar Seaborn?

Per instal·lar la biblioteca Python Seaborn, podeu utilitzar les ordres següents basades en la plataforma que utilitzeu:

pip instal·lar seaborn

o bé

instal·lar conda seaborn

Un cop instal·lat, assegureu-vos d'instal·lar els paquets i les biblioteques que depèn de seaborn.

Instal·lació de dependències de Python Seaborn:

Les dependències obligatòries dels nadons marins són:

També hi ha una dependència recomanada que és:

  • models d'estat

Per instal·lar aquestes biblioteques, podeu utilitzar les mateixes ordres que es mostren anteriorment per Seaborn amb els seus respectius noms. Un cop instal·lats, es poden importar fàcilment. Seaborn us permet carregar qualsevol conjunt de dades utilitzant el load_dataset () funció. També podeu veure tots els conjunts de dades disponibles mitjançant la funció get_dataset_names () de la següent manera:

EXEMPLE:

importa seaborn com sns sns.get_dataset_names ()

Això tornarà una llista de tots els conjunts de dades disponibles.
Ara que ja heu configurat el vostre entorn per treballar amb seaborn, anem més endavant per veure com utilitzar les seves funcions de traçat a .

Funcions de traçat Seaborn

Visualització de relacions estadístiques:

El procés d’entendre les relacions entre variables d’un conjunt de dades i com aquestes relacions, al seu torn, depenen d’altres variables, es coneix com anàlisi estadística. Analitzem ara les funcions necessàries per fer-ho:

relplot ():

Aquesta és una funció de nivell de figura que fa ús de dues funcions d’altres eixos per visualitzar les relacions estadístiques que són:

  • gràfic de dispersió()
  • lineplot ()

Aquestes funcions es poden especificar mitjançant el paràmetre ‘kind’ de relplot (). En cas que es doni aquest paràmetre, pren el predeterminat que és scatterplot (). Abans de començar a escriure el codi, assegureu-vos d'importar les biblioteques necessàries de la manera següent:

importar numpy com np importar pandes com pd importar matplotlib.pyplot com plt importar seaborn com sns sns.set (style = 'darkgrid')

Tingueu en compte que l’atribut d’estil també es pot personalitzar i pot prendre qualsevol valor, com ara darkgrid, paparres, etc., que parlaré més endavant a la secció d’estètica i argument. Vegem ara un petit exemple:

EXEMPLE:

f = sns.load_dataset ('vols') sns.relplot (x = 'passatgers', y = 'mes', dades = f)

SORTIDA:

Vols1-Python Seaborn Tutorial-Edureka

Com podeu veure, els punts es representen en dues dimensions. Tot i això, podeu afegir una altra dimensió mitjançant la semàntica 'tonalitat'. Vegem un exemple del mateix:

què és ressò a php

EXEMPLE:

f = sns.load_dataset ('vols') sns.relplot (x = 'passatgers', y = 'mes', tonalitat = 'any', dades = f)

Veureu la següent sortida:

SORTIDA:

Tanmateix, hi ha moltes més personalitzacions que podeu provar, com ara colors, estils, mida, etc. Deixeu-me mostrar com podeu canviar el color a l'exemple següent:

EXEMPLE:

sns.set (style = 'darkgrid') f = sns.load_dataset ('vols') sns.relplot (x = 'passatgers', y = 'mes', tonalitat = 'any', paleta = 'ch: r = - .5, l = .75 ', dades = f)

SORTIDA:

lineplot ():

Aquesta funció us permetrà dibuixar una línia contínua per a les vostres dades. Podeu utilitzar aquesta funció canviant el paràmetre 'kind' de la següent manera:

EXEMPLE:

a = pd.DataFrame ({'Dia': [1,2,3,4,5,6,7], 'Botiga de queviures': [30,80,45,23,51,46,76], 'Roba' : [13,40,34,23,54,67,98], 'Utensilis': [12,32,27,56,87,54,34]}, índex = [1,2,3,4,5 , 6,7]) g = sns.relplot (x = 'Dia', y = 'Roba', tipus = 'línia', dades = a) g.fig.autofmt_xdate ()

SORTIDA:

El valor predeterminat per a la línia de trames és y en funció de x. Tot i això, es pot canviar si ho voleu fer. Hi ha moltes més opcions que podeu provar més.

Vegem ara com es representen les dades categòriques.

Representació gràfica amb dades categòriques:

Aquest enfocament apareix quan la nostra variable principal es divideix en grups discrets (categòrics). Això es pot aconseguir mitjançant la funció catplot ().

catplot ():

Aquesta és una funció de nivell de figura com relplot (). Es pot caracteritzar per tres famílies de funcions de nivell d’eixos:

  1. Scatterplots: inclouen stripplot (), swarmplot ()

  2. Parcel·les de distribució: que són boxplot (), violinplot (), boxenplot ()

  3. Parcel·les estimatives - a saber, pointplot (), barplot (), countplot ()

Prenguem ara alguns exemples per demostrar-ho:

EXEMPLE:

importar seaborn as sns importar matplotlib.pyplot as plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', dades = a)

SORTIDA:

Com podeu veure, a l’exemple anterior no he definit el paràmetre ‘kind’. Per tant, ha retornat el gràfic com a diagrama de dispersió per defecte. Podeu especificar qualsevol funció de nivell d’eixos per canviar el gràfic segons sigui necessari. Posem un exemple d'això:

EXEMPLE:

importar seaborn as sns importar matplotlib.pyplot as plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', kind = 'violí', dades = a)

SORTIDA:

La sortida anterior mostra la trama del violí per al conjunt de dades de consells. Ara intentem trobar com visualitzar la distribució d'un conjunt de dades.

Visualització de la distribució d'un conjunt de dades:

Això tracta bàsicament d’entendre conjunts de dades amb context a ser univariants o bivariants. Abans de començar amb això, només cal importar el següent:

importar numpy com np importar pandes com pd importar seaborn com sns importar matplotlib.pyplot com plt des de les estadístiques d’importació scipy sns.set (color_codes = True)

Un cop fet això, podeu continuar traçant distribucions univariants i bivariants.

Representació de distribucions univariants:

Per traçar-los, podeu fer servir la funció distplot () de la següent manera:

EXEMPLE:

a = np.random.normal (loc = 5, mida = 100, escala = 2) sns.distplot (a)

SORTIDA:

Com podeu veure a l'exemple anterior, hem representat un gràfic per a la variable a els valors de la qual són generats per la funció normal () mitjançant distplot.

Representació de distribucions bivariants:

Això apareix quan teniu dues variables independents aleatòries que donen lloc a algun esdeveniment probable. La millor funció per traçar aquest tipus de gràfics és jointplot (). Representem ara un gràfic bivariant mitjançant jointplot ().

EXEMPLE:

x = pd.DataFrame ({'Dia': [1,2,3,4,5,6,7], 'Botiga de queviures': [30,80,45,23,51,46,76], 'Roba' : [13,40,34,23,54,67,98], 'Utensilis': [12,32,27,56,87,54,34]}, índex = [1,2,3,4,5 , 6,7]) y = pd.DataFrame ({'Dia': [8,9,10,11,12,13,14], 'Botiga de queviures': [30,80,45,23,51,46, 76], 'Roba': [13,40,34,23,54,67,98], 'Estris': [12,32,27,56,87,54,34]}, índex = [8,9 , 10,11,12,13,14]) mitjana, cov = [0, 1], [(1, 0,5), (, 5, 1)] dades = np.random.multivariate_normal (mitjana, cov, 200 ) amb sns.axes_style ('blanc'): sns.jointplot (x = x, y = y, kind = 'kde', color = 'b')

SORTIDA:

Ara que heu entès les diverses funcions de Python Seaborn, anem a construir quadrícules estructurades de diverses parcel·les.

Reixetes de diverses parcel·les:

Python Seaborn us permet traçar diverses quadrícules una al costat de l’altra. Es tracta bàsicament de gràfics o gràfics que es representen mitjançant la mateixa escala i eixos per ajudar a comparar-los. Això, al seu torn, ajuda el programador a diferenciar ràpidament entre les trames i obtenir grans quantitats d'informació.

Penseu en el següent exemple de funció facetgrid () per traçar aquests gràfics.

EXEMPLE:

sns.set (style = 'darkgrid') a = sns.load_dataset ('iris') b = sns.FacetGrid (a, col = 'species') b.map (plt.hist, 'sepal_length')

SORTIDA:

La sortida anterior mostra clarament la comparació entre els consells que es donen durant el dinar i el sopar. També podeu traçar mitjançant la funció PairGrid quan tingueu un parell de variables per comparar. Penseu en el següent exemple.

EXEMPLE:

sns.set (style = 'ticks') a = sns.load_dataset ('vols') b = sns.PairGrid (a) b.map (plt.scatter)

SORTIDA:

Com podeu veure, la producció anterior es compara clarament entre l'any i el nombre de passatgers de diferents maneres.

Seaborn també permet personalitzar l'estètica, que es discutirà més endavant.

Trama-Estètica:

Aquest segment del tutorial Python Seaborn tracta de fer que les nostres parcel·les siguin més atractives i encantadores.

Figura-Estètica de Python Seaborn:

La primera funció que parlaré és set (). Abans he estat fent servir el paràmetre ‘style’ d’aquesta funció. Aquest paràmetre tracta bàsicament de temes nascuts al mar. En l'actualitat, hi ha cinc disponibles disponibles, és a dir, graella fosca, paparres, graella blanca, blanc i fosc.

Penseu en el següent exemple que demostra el tema blanc.

EXEMPLE:

importar seaborn com sns importar matplotlib.pyplot com plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'day', y = 'total_bill', dades = a)

SORTIDA:

A la sortida anterior, podeu notar que el tema ha canviat a blanc. Podeu explorar-los encara més utilitzant els altres temes. Si es nota a la sortida anterior, hi ha eixos presents al voltant del gràfic. Tot i això, també es pot personalitzar mitjançant la funció despine (). Mireu l'exemple següent.

EXEMPLE:

importar seaborn com sns importar matplotlib.pyplot com plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'day', y = 'total_bill', dades = a) sns.despine (offset = 10, trim = True)

SORTIDA:



Tingueu en compte la diferència entre les dues sortides anteriors. No obstant això, hi ha moltes més opcions que podeu explorar per vosaltres mateixos.

Paletes de colors Python Seaborn:

El color és bàsicament la característica que s’acosta als ulls humans més enllà de qualsevol altra característica. Seaborn us permet jugar amb els colors mitjançant diverses funcions com color_palette (), hls_palette (), husl_palette (), etc. Feu una ullada als colors que actualment hi ha a seaborn.

EXEMPLE:

import numpy as np import seaborn as sns import matplotlib.pyplot as plt sns.set () presentcolors = sns.color_palette () sns.palplot (presentcolors)

SORTIDA:

java convertint doble a int

La imatge superior mostra els colors que hi ha a l'interior del mar. Ho he fet amb la funció palplot (). Per a variacions més profundes, podeu utilitzar hls_palette (), husl_palette (), etc.

Això ens porta al final del tutorial de Python Seaborn. Espero que ho hagueu entès tot amb claredat. Assegureu-vos de practicar el màxim possible .

Tens alguna pregunta? Si us plau, mencioneu-ho a la secció de comentaris d’aquest bloc “Python Seaborn Tutorial” i us respondrem el més aviat possible.

Per obtenir coneixements en profunditat sobre Python juntament amb les seves diverses aplicacions, podeu inscriure-us a la publicació amb assistència les 24 hores del dia, els 7 dies de la setmana i accés permanent