R Tutorial: una guia per a principiants per aprendre la programació de R



Aquest bloc sobre R Tutorial us presenta l'eina R i us ajuda a entendre els diversos fonaments de la programació R amb exemples.

R és l'eina d'anàlisi de dades més popular, ja que és de codi obert, flexible, ofereix diversos paquets i té una comunitat enorme. Està dissenyat tant per a programadors de programari, estadístics com per a miners de dades i, per tant, dóna lloc a la popularitat de .En aquest bloc R Tutorial, us donaré una idea completa sobre R amb exemples.

A continuació es detallen els temes d’aquest bloc R Tutorial que tractaré en la següent seqüència:





  1. Per què necessitem Analytics? ?
  2. Què és Business Analytics ?
  3. Per què R i qui utilitza R ?
  4. Instal·lació de R
  5. Operadors de dades
  6. Tipus de dades
  7. Control de cabal

com utilitzar swing java

R Tutorial: per què necessitem analítiques?

Abans de respondre a la pregunta, permeteu-me informar-vos sobre alguns dels problemes i les seves solucions a R en diversos dominis.



banca - Tutorial R - Edureka

Banca :

Cada dia es genera una gran quantitat de dades de clients als bancs. WTot i tractar regularment amb milions de clients, es fa difícil fer un seguiment de les seves hipoteques.



Solució :

R crea un model personalitzat que manté els préstecs concedits a cada client que ens ajuda a decidir la quantitat que ha de pagar el client al llarg del temps.

Assegurança :

L’assegurança depèn en gran mesura de la previsió. És difícildecidir quina política acceptar o rebutjar.

Solució:

En utilitzar l'informe de crèdit continu com a entrada, podem crear un model en R que no només avaluarà la gana pel risc, sinó que també farà una previsió predictiva.

Atenció sanitària:

Cada any ingressen milions de persones a l'hospital i es gasten milers de milions anuals només en el procés d'admissió.

Solució :

Donats els antecedents i la història clínica del pacient, es pot construir un model predictiu per identificar qui està en risc d’ingrés hospitalari i fins a quin punt s’hauria d’escalar l’equip mèdic.

Ara sabem com l’anàlisi de dades ajuda les organitzacions a aprofitar les seves dades i a utilitzar-les per identificar noves oportunitats. Si parlem de la necessitat d’anàlisi en una organització, heu de trobar aquests 4 aspectes:

A continuació, anem endavant al bloc de tutories de R, on primer entendrem què és exactament l'anàlisi empresarial.

R Tutorial: què és Business Analytics?

L’anàlisi empresarial és un procés per examinar grans conjunts de dades i aconseguir patrons, correlacions i altres coneixements ocults. Bàsicament, us ajuda a entendre totes les dades que heu recopilat, ja siguin dades d’organització, dades d’investigació de mercats o de productes o qualsevol altre tipus de dades. Es fa més fàcil prendre millors decisions, millors productes, millors estratègies de màrqueting, etc. Consulteu la imatge següent per comprendre millor:

Si mireu la figura anterior, les dades de la primera imatge estan disperses. Ara bé, si voleu alguna cosa específic, com ara un registre concret en una base de dades, es torna complicat. Per simplificar-ho, necessiteu una anàlisi. Amb l’anàlisi, es fa fàcil trobar una correlació entre les dades. Un cop hàgiu establert què heu de fer, us serà molt fàcil prendre decisions com ara quin camí voleu seguir o, en termes d’anàlisi d’empreses, quin camí us conduirà a millorar la vostra organització.

Però no podeu esperar que la gent de la cadena anterior entengui sempre les dades brutes que els proporcioneu després de les analítiques. Per superar aquest buit, tenim un concepte de visualització de dades .

Visualització de dades : La visualització de dades és un accés visual a grans quantitats de dades que heu generat després de l'anàlisi. La ment humana processa imatges visuals i els gràfics visuals són millor que comparar-los amb dades brutes. Sempre és fàcil entendre que un gràfic circular o un gràfic de barres es comparin amb els nombres bruts. Ara us podeu preguntar com podeu aconseguir aquesta visualització de dades a partir de les dades que ja heu analitzat?
Hi ha diverses eines disponibles al mercat per a la visualització de dades:

Us heu de preguntar que ja hi ha tantes eines que us ajudaran a visualitzar les dades i a una certa quantitat d’anàlisis, per què anar amb R?

Així, doncs, el següent tema del bloc de tutories R tracta de 'per què R' i 'qui utilitza R'?

Tutorial R: Per què R i qui utilitza R?

Per què R?

R és un llenguatge estadístic i de programació.

R s'utilitza per a l'anàlisi i visualització de dades.

R és senzill i fàcil d’aprendre, llegir i escriure.

R és un exemple de FLOSS (programari lliure i lliure) que permet distribuir lliurement còpies d’aquest programari, llegir-ne el codi font, modificar-lo, etc.

Qui fa servir R?

  • L’Oficina de protecció financera del consumidor utilitza R per a l’anàlisi de dades
  • Els estadístics de John Deere utilitzen R per al modelatge de sèries temporals i l’anàlisi geoespacial d’una manera fiable i reproduïble.
  • Bank of America utilitza R per informar.
  • R forma part de la pila de tecnologia darrere del famós motor de recomanacions de Foursquare.
  • ANZ, el quart banc més gran d'Austràlia, utilitza R per a l'anàlisi del risc de crèdit.
  • Google fa servir R per predir l’activitat econòmica.
  • Mozilla, la fundació responsable del navegador web Firefox, utilitza R per visualitzar l’activitat al web.

A continuació es mostren alguns dels dominis on s’utilitza R:

Ara, anem avançant al bloc de tutorial R i instal·lem R.

R Tutorial: Instal·lació de R

Permeteu-me guiar-vos durant el procés d’instal·lació de R al vostre sistema. Simplement seguiu els passos següents:

Pas 1 : Aneu a l’enllaç- https://cran.r-project.org/

Pas 2 : Descarregueu i instal·leu R 3.3.3 al vostre sistema.

Consulteu la captura de pantalla següent per obtenir una millor comprensió.

Seguint els passos anteriors, heu acabat amb la part d’instal·lació de R. Ara, podeu començar a codificar directament en R descarregant RStudio IDE. Per descarregar-lo, seguiu els passos següents:

Pas 1 : Aneu a l'enllaç https://www.rstudio.com/

Pas 2 : Descarregueu i instal·leu Rstudio al vostre sistema.

Després d’instal·lar-ho tot, ja esteu preparats per codificar.

R Tutorial per a principiants | R Tutorial de programació | Edureka

A continuació, avancem al bloc R Tutorial i entenem què són els operadors de dades a R.

R Tutorial: Operadors de dades a R

Hi ha principalment cinc tipus diferents d’operadors, que s’enumeren a continuació:

  1. Operadors aritmètics : Realitzar operacions aritmètiques com ara suma, resta, multiplicació, divisió, etc.
  2. Operadors de tasques :Els operadors d'assignació s'utilitzen per assignar valors. Per exemple:
  • Operador de tasques =
    Sintaxi:
    nom de la variable = valor
> X = 5 >x 
Sortida: [1] 5
  • Operador de tasques<-
    Sintaxi:
    nom de la variable<- value

    > x<- 15 > x
    Sortida: [1] 15
  • Operador de tasques<<-
    Sintaxi:
    nom de la variable<<- value
> x<<- 2 > x
Sortida: [1] 2
  • Operador de tasques ->
    Sintaxi:
    valor -> nom de la variable

    > 25 -> x > x 
    Sortida: [1] 25

3. Operador relacional : Defineix una relació entre dues entitats. Per exemple: ,<=,!= etc.

> Xx! = 2
Sortida:[1] CERT

4. Operadors lògics : Aquests operadors comparen les dues entitats i normalment s'utilitzen amb valors booleans (lògics) com &, | i!.

> x2 i 3
Sortida:[1] CERT

5. Operadors especials : Aquests operadors s'utilitzen per a propòsits específics, no per a càlcul lògic. Per exemple:

  • Crea la sèrie de nombres en seqüència per a un vector.

    > xx
    Sortida: [1] 2 3 4 5 6 7 8
  • % en% Aquest operador s'utilitza per identificar si un element pertany a un vector.
    Exemple

    > xyy% a% x
    Sortida: [1] CERT

R Tutorial: tipus de dades

Els tipus de dades s’utilitzen per emmagatzemar informació. A R, no necessitem declarar una variable com a tipus de dades. Les variables s’assignen amb objectes R i el tipus de dades de l’objecte R es converteix en el tipus de dades de la variable.Hi ha principalment sis tipus de dades presents a R:

tutorial sql i pl sql

Anem a detallar cadascun d'ells:

Vector : Un vector és una seqüència d'elements de dades del mateix tipus bàsic. Exemple:

vtr = (1, 3, 5, 7 9)

o bé

vtr<- (1, 3, 5 ,7 9)

Hi ha 5 vectors atòmics, també anomenats cinc classes de vectors.

Llista : Les llistes són els objectes R que contenen elements de diferents tipus, com ara números i menys, cadenes, vectors i una altra llista.

> n = c (2, 3, 5) > s = c ('aa', 'bb', 'cc', 'dd', 'ee') > x = llista (n, s, TRUE) > x

Sortida -

[[1]] [1] 2 3 5 [[2]] [1] 'aa' 'bb' 'cc' 'dd' 'ee' [[3]] [1] CERT

Matrius : Les matrius són els objectes de dades R que poden emmagatzemar dades en més de dues dimensions. Pren vectors com a entrada i utilitza els valors del paràmetre dim per crear una matriu.

vector1<- c(5,9,3) vector2<- c(10,11,12,13,14,15) resultat<- array(c(vector1,vector2),dim = c(3,3,2))

Sortida -

,, 1 [, 1] [, 2] [, 3] [1,] 5 octubre 13 [2,] 9 11 14 [3,] 3 desembre 15,, 2 [, 1] [, 2] [, 3 ] [1,] 5 octubre 13 [2,] 9 11 14 [3,] 3 desembre 15

matrius : Les matrius són els objectes R en què els elements estan disposats en una disposició rectangular bidimensional. Es crea una matriu mitjançant la funció matrix (). Exemple: matriu (dades, nrow, ncol, byrow, dimnames) on,

dades és el vector d'entrada que es converteix en els elements de dades de la matriu.

nrow és el nombre de files a crear.

ncol és el nombre de columnes a crear.

byrow és una pista lògica. Si és TRUE, els elements vectorials d’entrada s’ordenen per fila.

dimname són els noms assignats a les files i columnes.

> Mat<- matrix(c(1:16), nrow = 4, ncol = 4 ) > Mat
Sortida :
[, 1] [, 2] [, 3] [, 4] [1,] 1 maig 13 set [2,] 2 jun 14 oct [3,] 7 mar 15 nov [4,] 4 8 12 16

Factors : Els factors són els objectes de dades que s’utilitzen per classificar les dades i emmagatzemar-les com a nivells. Poden emmagatzemar cadenes i enters. Són útils en l'anàlisi de dades per a la modelització estadística.

> dades<- c('East','West','East','North','North','East','West','West“,'East“) > dades_factor<- factor(data) > dades_factor

Sortida :

[1] Est oest est nord nord est oest oest est Nivells: est nord-oest

Marcs de dades : Un marc de dades és una taula o una estructura de matriu bidimensional en què cada columna conté valors d'una variable i cada fila conté un conjunt de valors de cada columna.

> std_id = c (1: 5) > std_name = c ('Rick', 'Dan', 'Michelle', 'Ryan', 'Gary') > marques = c (623,3,515,2,611,0,729,0,843,25) > std.data<- data.frame(std_id, std_name, marks) > std.data

Sortida :

std_id marques std_name 1 1 Rick 623,30 2 2 i 515,20 Març 3 Michelle 611.00 4 4 Ryan 729,00 5 5 Gary 843,25

Amb això, arribem al final de diferents tipus de dades a R. A continuació, anem avançant al bloc R Tutorial i entenem un altre concepte clau: les declaracions de control de flux.

R Tutorial: declaracions de control de flux

Les declaracions de control de flux tenen un paper molt important, ja que us permeten controlar el flux d'execució d'un script dins d'una funció. Les declaracions de control de flux més utilitzades es representen a la imatge següent:

Ara, parlem de cadascun d’ells amb exemples.

R Tutorial: declaracions del selector

  • Declaració de control : Aquesta instrucció de control avalua una sola condició. És bastant fàcil, ja que només té una sola paraula clau 'si' seguida de la condició i, a continuació, cert conjunt d'afirmacions que cal executar en cas que sigui cert. Consulteu el diagrama de flux següent per obtenir una millor comprensió:

En aquest diagrama de flux, el codi respondrà de la següent manera:

  1. En primer lloc, entrarà al bucle on comprova l'estat.
  2. Si la condició és certa, s'executarà el codi condicional o les sentències escrites.
  3. Si la condició és falsa, les declaracions s’ignoren.

A continuació es mostra un exemple de si instrucció de control a R. Proveu d'executar aquest exemple a R Studio.

x = 2 repeteix {x = x ^ 2 print (x) if (x> 100) {break}

Sortida:

[1] 4 [1] 16 [1] 256
  • Declaració de control Si no :Examens tipus de declaració de controlavalua un grup de condicions i selecciona les afirmacions. Consulteu el diagrama de flux següent per obtenir una millor comprensió:

En aquest diagrama de flux, el codi respondrà de la següent manera:

  1. En primer lloc, entrarà al bucle on comprova l'estat.
  2. Si la condició és certa, s'executaran les primeres sentències 'if'.
  3. Si la condició és falsa, passa a la condició 'else if' i, si és certa, s'executarà el codi 'else if'.
  4. Finalment, si el codi ‘else if’ també és fals, passarà al codi ‘else’ i s’executarà. Això vol dir que si cap d’aquestes condicions no és certa, la sentència ‘else’ s’executa.

A continuació es mostra un exemple de si una altra cosa instrucció de control a R. Proveu d'executar aquest exemple a R Studio.

x5) {imprimir ('x és superior a 5')} elseif (x == 5) {imprimir ('x és igual a 5')} else {imprimir ('x no és superior a 5')}

Sortida:

[1] 'x és igual a 5'
  • Instruccions de commutació : Aquestes declaracions de control s’utilitzen bàsicament per comparar una expressió determinada amb un valor conegut. Consulteu el diagrama de flux següent per obtenir una millor comprensió:

En aquest diagrama de flux de majúscules i minúscules, el codi respondrà en els passos següents:

  1. Primer de tot, entrarà en el cas de commutació que té una expressió.
  2. A continuació, passarà a la condició del cas 1, comprova el valor que es passa a la condició. Si és cert, s'executarà el bloc Instrucció. Després d'això, es trencarà d'aquest cas de commutació.
  3. En cas que sigui fals, canviarà al següent cas. Si la condició del cas 2 és certa, executarà la sentència i es trencarà d'aquest cas, en cas contrari tornarà a saltar al cas següent.
  4. Imaginem que no heu especificat cap cas o que hi ha alguna entrada incorrecta de l'usuari; llavors passarà al cas predeterminat on imprimirà la vostra declaració predeterminada.

A continuació es mostra un exemple d’instrucció switch a R. Proveu d’executar aquest exemple a R Studio.

vtr<- c(150,200,250,300,350,400) option <-'mean' switch(option, 'mean' = print(mean(vtr)), 'mode' = print(mode((vtr))), 'median' = print(median((vtr))) ) 

Sortida:

[1] 275

R Tutorial: declaracions de bucle

Els bucles us ajuden a repetir certes accions de manera que no hagueu de realitzar-les repetidament. Imagineu que heu de realitzar una operació 10 vegades, si comenceu a escriure el codi per a cada vegada, la durada del programa augmenta i us resultaria difícil entendre-ho més endavant. Però, al mateix temps, mitjançant un bucle, si escric la mateixa sentència dins d’un bucle, estalvia temps i facilita la llegibilitat del codi. També s’optimitza respecte a l’eficiència del codi.

A la imatge anterior, ‘ repetir ' i ' mentre 'Les declaracions us ajuden a executar un determinat conjunt de regles fins que la condició sigui certa, però' per a és una sentència de bucle que s'utilitza quan se sap quantes vegades es vol repetir un bloc de sentències. Ara, si sabeu que el voleu repetir 10 vegades, anireu amb la sentència 'for', però si no esteu segur de quantes vegades voleu que es repeteixi el codi, anireu amb 'repeat' bucle 'mentre que'.

Analitzem cadascun d’ells amb exemples.

  • Repetiu : El bucle de repetició ajuda a executar el mateix conjunt de codi una i altra vegada fins que es compleixi una condició d'aturada. Consulteu el diagrama de flux següent per obtenir una millor comprensió:

Al diagrama de flux anterior, el codi respondrà en els passos següents:

  1. En primer lloc, introduirà i executarà un conjunt de codi.
  2. A continuació, comprovarà l'estat, si és cert, tornarà enrere i executarà de nou el mateix conjunt de codi fins que es vulgui que sigui fals.
  3. Si es troba que és fals, sortirà directament del bucle.
  • Mentre : La sentència while també ajuda a executar el mateix conjunt de codi una i altra vegada fins que es compleixi una condició d'aturada. Consulteu el diagrama de flux següent per obtenir una millor comprensió:

Al diagrama de flux anterior, el codi respondrà en els passos següents:

  1. En primer lloc, comprovarà l'estat.
  2. Si es troba que és cert, executarà el conjunt de codi.
  3. A continuació, torna a comprovar l'estat, si és cert, executarà de nou el mateix codi. Tan bon punt es troba que la condició és falsa, surt immediatament del bucle.

A continuació es mostra un exemple de sentència while a R. Proveu d'executar aquest exemple a R Studio.

x = 2 mentre (x<1000) { x=x^2 print(x) } 

Sortida:

4 16.256 65536

Per tant, us heu de preguntar en què difereixen aquestes dues afirmacions? Deixeu-me aclarir el vostre dubte!
Aquí la diferència principal entre la declaració de repetir i mentre és que canvia respecte a la vostra condició. Mentre loop defineix bàsicament quan aneu a entrar al bucle per executar les sentències i repetir bucle es defineix quan surti del bucle després de l'execució de les sentències. Per tant, aquestes dues afirmacions es coneixen com a bucle de control d’entrada i bucle de control de sortida. És així com les afirmacions de while i repeat són diferents.

  • Per a bucle: Per a bucles s'utilitzen quan cal executar un bloc de codi diverses vegades. Consulteu el diagrama de flux següent per obtenir una millor comprensió:

Al diagrama de flux anterior, el codi respondrà en els passos següents:

  1. Primer de tot hi ha la inicialització on especifiqueu quantes vegades voleu que es repeteixi el bucle.
  2. A continuació, comprova l'estat. Si la condició és certa, executarà el conjunt de codi el nombre de vegades especificat.
  3. Tan bon punt es troba que la condició és falsa, surt immediatament del bucle.

A continuació es mostra un exemple de sentència for a R. Proveu d'executar aquest exemple a R Studio.

vtr<- c(7,19,25,65, 45) for( i in vtr) { print(i) } 

Sortida:

7 19 25 65 45

A continuació, anem al nostre darrer conjunt d’afirmacions del bloc R Tutorial, és a dir, salta les declaracions.

R Tutorial: Jump Statements

Declaració de trencament : Les sentències Break ajuden a finalitzar el programa i reprenen el control a la següent sentència després del bucle. Aquestes sentències també s’utilitzen en majúscules i minúscules. Consulteu el diagrama de flux següent per obtenir una millor comprensió:

Al diagrama de flux anterior, el codi respondrà en els passos següents:

  1. En primer lloc, entrarà al bucle on comprova l'estat.
  2. Si la condició del bucle és falsa, surt directament del bucle.
  3. Si la condició és certa, es comprovarà la condició de trencament.
  4. Si la condició de trencament és certa, existeix des del bucle.
  5. Si la condició de trencament és falsa, executarà les sentències que queden al bucle i repetirà els mateixos passos.

A continuació es mostra un exemple d’instrucció de salt a R. Proveu d’executar aquest exemple a R Studio.

x<- 1:5 for (val in x) { if (val == 3){ break } print(val) } 

Sortida:

[1] 1. [1] 2

Propera declaració : S'utilitza una sentència següent quan voleu saltar la iteració actual del bucle sense acabar-la. La següent afirmació és bastant similar a la de 'continuar' en un altre llenguatge de programació. Consulteu el diagrama de flux següent per obtenir una millor comprensió:

Al diagrama de flux anterior, el codi respondrà en els passos següents:

  1. En primer lloc, entrarà al bucle on comprova l'estat.

  2. Si la condició del bucle és falsa, surt directament del bucle.

  3. Si la condició del bucle és certa, executarà instruccions del bloc 1.

  4. Després, comprovarà si hi ha una declaració 'següent'. Si és present, les sentències posteriors no s'executaran en la mateixa iteració del bucle.

  5. Si no hi ha la declaració 'següent', s'executaran totes les declaracions posteriors.

A continuació es mostra un exemple de la següent declaració a R. Proveu d'executar aquest exemple a R Studio.

marc basat en dades en seleni
per a (i a 1:15) {if ((i %% 2) == 0) {següent} imprimir (i)}

Sortida:

1 3 5 7 9 11 13 15

Aquest és el final del bloc de tutories R. Espero que vostès tinguin clars tots els conceptes que he comentat anteriorment. Estigueu atents, el meu pròxim bloc estarà a l’entrenament de R, on explicaré detalladament alguns conceptes més de R amb l’exampli.

Ara que heu entès els conceptes bàsics de R, consulteu el fitxer per Edureka, una empresa d'aprenentatge en línia de confiança amb una xarxa de més de 250.000 estudiants satisfets repartits per tot el món. La formació sobre dades sobre edició de R i Edureka us ajudarà a obtenir experiència en programació R, manipulació de dades, anàlisi exploratòria de dades, visualització de dades, mineria de dades, regressió, anàlisi de sentiments i l’ús de R Studio per a estudis de casos reals sobre venda al detall, xarxes socials.

Tens alguna pregunta? Si us plau, mencioneu-lo a la secció de comentaris d’aquest bloc “R Tutorial” i us respondrem el més aviat possible.