SQL per a ciències de dades: solució única per a principiants



Aquesta entrada de blog sobre SQL for Data Science us ajudarà a comprendre com es pot utilitzar SQL per emmagatzemar, accedir i recuperar dades per realitzar anàlisis de dades.

Atès que Data Science s’ha classificat en el número 1 per ser la feina més prometedora de l’època, tots intentem unir-nos a la carrera de . Aquesta entrada de blog sobre SQL for Data Science us ajudarà a comprendre com es pot utilitzar SQL per emmagatzemar, accedir i recuperar dades per realitzar anàlisis de dades.

Aquí teniu una llista de temes que hi haurà tractat en aquest bloc:





    1. Per què és necessari SQL per a la ciència de dades?
    2. Què és SQL?
    3. Conceptes bàsics de SQL
    4. Instal·lació de MySQL
    5. Mans amunt

Per què és necessari SQL per a la ciència de dades?

Sabíeu que generem més de 2,5 quintilions de bytes de dades cada dia? Aquest ritme de generació de dades és el motiu de la popularitat de tecnologies de gamma alta com ara Ciències de les dades , , etcètera.

Obtenir informació útil a partir de dades és el que s’anomena ciència de dades. La ciència de dades consisteix a extreure, processar i analitzar tones de dades. Actualment el que necessitem és que es pot utilitzar per emmagatzemar i gestionar aquesta gran quantitat de dades.



Què és la ciència de dades - Edureka

Aquí és on SQL entra.

SQL es pot utilitzar per emmagatzemar, accedir i extreure grans quantitats de dades per tal de dur a terme tot el procés de Data Science amb més fluïdesa.



Què és SQL?

SQL que significa Structured Query Language és un llenguatge de consulta dirigit a gestionar bases de dades relacionals.

Però, què és exactament una base de dades relacional?

Una base de dades relacional és un grup de taules ben definides des de les quals es pot accedir a les dades, editar-les, actualitzar-les, etc., sense haver d’alterar les taules de la base de dades. SQL és l’estàndard (API) per a bases de dades relacionals.

Tornant a SQL, la programació SQL es pot utilitzar per realitzar múltiples accions sobre dades com ara consultar, inserir, actualitzar i suprimir registres de bases de dades. Alguns exemples de bases de dades relacionals que utilitzen SQL inclouen MySQL Database, Oracle, etc.

Per obtenir més informació sobre SQL, podeu consultar el fitxer següents blocs:

  1. Descripció dels tipus de dades SQL: tot el que heu de saber sobre els tipus de dades SQL
  2. CREA TAULA a SQL: tot el que heu de saber sobre la creació de taules a SQL

Abans de començar amb una demostració sobre SQL, coneixem les ordres bàsiques de SQL.

Conceptes bàsics de SQL

SQL proporciona un conjunt d’ordres simples per modificar les taules de dades. Anem a veure algunes de les ordres bàsiques de SQL:

com fer un jframe a Java
  • CREA LA BASE DE DADES - crea una nova base de dades
  • CREA TAULA - crea una taula nova
  • INSERIR A - insereix dades noves a una base de dades
  • SELECCIONA - extreu dades d'una base de dades
  • ACTUALITZACIÓ - actualitza les dades d'una base de dades
  • ELIMINA - suprimeix les dades d'una base de dades
  • ALTER DATABASE - modifica una base de dades
  • ALTER TAULA - modifica una taula
  • TAULA DE GOTA - suprimeix una taula
  • CREA ÍNDEX - crea un índex per cercar un element
  • DROP INDEX - suprimeix un índex

Per entendre millor SQL, instal·leu MySQL i vegem com podeu jugar amb les dades.

Instal·lació de MySQL

Instal·lar MySQL és una tasca senzilla. Aquí hi ha un guia pas a pas això us ajudarà a instal·lar MySQL al vostre sistema.

Un cop hàgiu acabat la instal·lació MySQL, seguiu la secció següent per obtenir una demostració senzilla que us mostrarà com podeu inserir, manipular i modificar les dades.

SQL per a ciències de dades: demostració de MySQL

En aquesta demostració, veurem com crear bases de dades i processar-les. Es tracta d’una demostració de nivell per a principiants per començar amb l’anàlisi de dades a SQL.

Comencem, doncs,

Pas 1: creeu una base de dades SQL

Una base de dades SQL és un magatzem d’emmagatzematge on es poden emmagatzemar dades en un format estructurat. Ara anem a crear una base de dades mitjançant MySQL :

CREA LA BASE DE DADES edureka USEU edureka

Al codi anterior, hi ha dues ordres SQL:

Nota : Les ordres SQL es defineixen amb majúscules i s’utilitza un punt i coma per finalitzar una ordre SQL.

  1. CREA BASE DE DADES: aquesta ordre crea una base de dades anomenada 'edureka'

  2. ÚS: aquesta ordre s’utilitza per activar la base de dades. Aquí activem la base de dades ‘edureka’.

Pas 2: creeu una taula amb les funcions de dades necessàries

Crear una taula és tan senzill com crear una base de dades. Només cal definir les variables o les característiques de la taula amb els seus respectius tipus de dades. Vegem com es pot fer això:

CREA TAULES joguines (TID INTEGER NO NULL PRIMARY KEY AUTO_INCREMENT, Item_name TEXT, Price INTEGER, Quantity INTEGER)

Al fragment de codi anterior es produeixen les coses següents:

  1. Utilitzeu l’ordre ‘CREA TAULA’ per crear una taula anomenada joguines.
  2. La taula de joguines conté 4 funcions, a saber, TID (identificador de transacció), nom_element, preu i quantitat.
  3. Cada variable es defineix amb els seus tipus de dades respectius.
  4. La variable TID es declara com a clau principal. Una clau primària designa bàsicament una variable que pot emmagatzemar un valor únic.

Podeu comprovar encara més els detalls de la taula definida mitjançant l'ordre següent:

DESCRIBIR les joguines

algorisme de Fibonacci c ++

Pas 3: inserir dades a la taula

Ara que hem creat una taula, omplim-la amb alguns valors. Abans en aquest bloc, esmentava com podeu afegir dades a una taula amb només fer servir una sola ordre, és a dir, INSERT INTO.

Vegem com es fa això:

INSERT INTO Toys VALUES (NULL, 'Train', 550, 88) INSERT INTO Toys VALUES (NULL, 'Hotwheels_car', 350, 80) INSERT INTO Toys VALUES (NULL, 'Magic_Pencil', 70, 100) INSERT INTO Toys VALUES ( NULL, 'Dog_house', 120, 54) INSERT INTO toys valors (NULL, 'Skateboard', 700, 42) INSERT INTO toys valors (NULL, 'GI Joe', 300, 120)

Al fragment de codi anterior, simplement hem inserit 6 observacions a la taula de 'joguines' mitjançant l'ordre INSERT INTO. Per a cada observació, entre parèntesis, he especificat el valor de cada variable o característica que es definia en crear la taula.

La variable TID s'estableix en NULL, ja que s'incrementa automàticament a partir d'1.

Ara mostrem totes les dades presents a la nostra taula. Això es pot fer mitjançant l'ordre següent:

SELECCIÓ * DE Joguines


Pas 4: Modifiqueu les entrades de dades

Diguem que heu decidit augmentar el preu del G.I. Joe, ja que t’aconsegueix molts clients. Com actualitzaria el preu de la variable en una base de dades?

És senzill, només cal que utilitzeu l'ordre següent:

ACTUALITZACIÓ DE Joguines PREU = 350 ON TID = 6

L'ordre UPDATE us permet modificar els valors / variables emmagatzemats a la taula. El paràmetre SET us permet seleccionar una característica concreta i el paràmetre WHERE s'utilitza per identificar la variable / valor que voleu canviar. A l'ordre anterior, he actualitzat el preu de l'entrada de dades que té un TID de 6 (G.I. Joe).

Ara vegem la taula actualitzada:

SELECCIÓ * DE Joguines

També podeu modificar el que voleu que es mostri només fent referència a les columnes que voleu visualitzar. Per exemple, l'ordre següent només mostrarà el nom de la joguina i el seu preu respectiu:

SELECCIONA Nom_element, preu DES de joguines

Pas 5: recuperació de dades

Per tant, després d’inserir i modificar les dades, per fi és hora d’extreure i recuperar les dades segons els requisits empresarials. Aquí és on es poden recuperar les dades per analitzar-les i modelar-les.

Tingueu en compte que és un exemple senzill per començar a utilitzar SQL, però, en escenaris del món real, les dades són molt més complicades i de mida gran. Malgrat això, les ordres SQL segueixen sent les mateixes i això és el que fa que SQL sigui tan senzill i entenedor. Pot processar conjunts de dades complexos amb un conjunt d’ordres SQL senzilles.

Ara recuperem dades amb un parell de modificacions. Consulteu el codi següent i intenteu entendre què fa sense mirar el resultat:

SELECCIÓ * DEL LIMIT 2 de les joguines

Ho has endevinat! Mostra les dues primeres observacions presents a la meva taula.

Provem alguna cosa més interessant.

SELECCIÓ * DE LES Joguines ORDRE PER PREU ASC

Com es mostra a la figura, els valors s’ordenen respecte a l’ordre ascendent de la variable preu. Si voleu buscar els tres articles que més es compren amb freqüència, què faríeu?

És molt senzill!

SELECCIÓ * DE Joguines ORDRE PER Quantitat LÍMIT DESC 3

Provem-ne un de més.

SELECCIÓ * DE Joguines ON Preu> 400 COMANDA PER Preu ASC


Aquesta consulta extreu els detalls de les joguines el preu de les quals és superior a 400 i organitza la sortida per ordre ascendent del preu.

Així doncs, és així com podeu processar dades mitjançant SQL. Ara que ja coneixeu els conceptes bàsics de SQL for Data Science, estic segur que teniu curiositat per obtenir més informació. Aquí teniu un parell de blocs per començar:

  1. Què és la ciència de dades? Una guia per a principiants de ciència de dades
  2. Tutorial MySQL: una guia per a principiants per aprendre MySQL

Si voleu inscriure-us a un curs complet d’Intel·ligència Artificial i Aprenentatge Automàtic, Edureka disposa d’un programa especialitzat que us farà dominar tècniques com l'aprenentatge supervisat, l'aprenentatge no supervisat i el processament del llenguatge natural. Inclou formació sobre els darrers avenços i enfocaments tècnics en intel·ligència artificial i aprenentatge automàtic, com ara aprenentatge profund, models gràfics i aprenentatge de reforç.