Estadístiques d’aprenentatge automàtic: una guia per a principiants



Aquest article sobre Estadístiques per a l'aprenentatge automàtic és una guia completa sobre els diversos conceptes d'estadístiques amb exemples.

Comprendre les dades i poder crear-ne valor és l’habilitat de la dècada. L’aprenentatge automàtic és una d’aquestes habilitats bàsiques que ajuda les empreses a complir-la. Tot i això, per començar, heu de construir els fonaments correctament. Per tant, en aquest article, tractaré alguns conceptes bàsics i us proporcionaré pautes per iniciar el vostre viatge en Machine Learning. Per tant, en aquest article sobre estadístiques d’aprenentatge automàtic, es debatran els temes següents:

  1. Probabilitat
  2. Estadístiques
  3. Àlgebra linial

Probabilitat i estadístiques d'aprenentatge automàtic:





Què és la probabilitat?

La probabilitat quantifica la probabilitat que es produeixi un esdeveniment. Per exemple, si llanceu un dau just i imparcial, llavors la probabilitat de 1 augmentar és 1/6 . Ara, si us pregunteu why? Llavors, la resposta és molt senzilla.

Això es deu al fet que hi ha sis possibilitats i totes són iguals de probables (mort just). Per tant, podem afegir 1 + 1 + 1 + 1 + 1 + 1 = 6. Però, ja que ens interessa el esdeveniment on apareix 1 . Hi ha només es pot produir un esdeveniment. Per tant,



Probabilitat que aparegui 1 = 1/6

Similar és el cas de la resta de nombres, ja que tots els esdeveniments són igualment probables. Senzill, oi?

Doncs bé, semblaria una definició freqüentista de probabilitat per a aquest exemple: la probabilitat que aparegui 1 és la proporció del nombre de vegades que ha aparegut 1 fins al nombre total de vegades que s’ha llançat el dau si es va llançar un dau infinit vegades.Com té sentit això?



Fem-ho més interessant. Penseu en els dos casos: heu llançat un dau just 5 vegades. En un cas, la seqüència de nombres que apareixen és - [1,4,2,6,4,3]. En l’altre cas, obtenim - [2,2,2,2,2,2]. Quina creieu que és més probable?

Tots dos són igualment probables. Sembla estrany no?

Ara, considerem un altre cas on hi hagi tots els 5 rotlles de cada cas independent . És a dir, un rotlle no afecta l’altre. En el primer cas, quan apareixen 6, no tenia ni idea que apareguessin 2 abans. Per tant, és probable que tots els cinc rotlles siguin iguals.

De la mateixa manera, els 2s rectes en el segon cas es poden entendre com una seqüència d'esdeveniments independents. I tots aquests esdeveniments són igualment probables. En general, ja que tenim els mateixos daus, la probabilitat que aparegui un nombre concret en cas que un sigui la mateixa que en el cas dos. A continuació, en aquest article sobre estadístiques d’aprenentatge automàtic, entenem el terme Independència.

Independència

Dos esdeveniments Es diu que A i B són independents si l’aparició d’A no afecta l’esdeveniment B . Per exemple, si llanceu una moneda i llanceu un dau, el resultat del dau no té cap efecte sobre si la moneda mostra cap o cua. També, per dos esdeveniments independents A i B , el probabilitat que A i B es puguin produir junts . Així, per exemple, si voleu que la probabilitat que la moneda mostri capçals i matrius sigui 3.

P (A i B) = P (A) * P (B)

Per tant, P = & frac12 (probabilitat que els caps augmentin) * ⅙ (probabilitat que 3 pugin) = 1/12

A l'exemple anterior, per als dos casos, P = ⅙ * ⅙ * ⅙ * ⅙ * ⅙ * ⅙.

Ara parlem d’esdeveniments que no són independents. Considereu la taula següent:

Obeses No és obès
Problemes cardíacs4515
Sense problemes cardíacs1030

Es va fer una enquesta a 100 persones. 60 tenien problemes cardíacs i 40 no. Dels 60 amb problemes cardíacs, 45 eren obesos. Dels 40 que no tenien problemes cardíacs, 10 eren obesos. Si algú et pregunta:

  1. Quina és la probabilitat de tenir un problema cardíac?
  2. Quina és la probabilitat de tenir un problema cardíac i no ser obès?

La resposta a les primeres preguntes és fàcil: 60/100. Per al segon, seria 15/100. Ara considerem la tercera pregunta: es va escollir una persona a l’atzar. Es va trobar que tenia malalties del cor. Quina és la probabilitat que sigui obès?

com utilitzar l'iterador a Java

Ara pensa en la informació que t’ha donat: se sap que té malalties del cor. Per tant, no pot ser dels 40 que no tenen malalties del cor. Només hi ha 60 opcions possibles (la fila superior de la taula). Ara, entre aquestes possibilitats reduïdes, la probabilitat que sigui obès és de 45/60. Ara que ja sabeu què són els esdeveniments independents, a continuació, en aquest article sobre estadístiques per a l’aprenentatge automàtic, entenem les probabilitats condicionals.

Probabilitats condicionals

Per entendre les probabilitats condicionals, continuem la nostra discussió amb l'exemple anterior. L’estat d’ésser obès i l’estat d’haver patit problemes cardíacs no són independents. Si el fet d’ésser obès no afectés els problemes cardíacs, el nombre de casos obesos i no obesos en persones amb problemes cardíacs hauria estat el mateix.

A més, se’ns va indicar que la persona té problemes cardíacs i vam haver d’esbrinar la probabilitat que sigui obesa. Per tant, es diu que la probabilitat, en aquest cas, està condicionada al fet que té un problema cardíac. Si la probabilitat que es produeixi l’esdeveniment A està condicionada a l’esdeveniment B, el representem com

P (A | B)

Ara hi ha un teorema que ens ajuda a calcular aquesta probabilitat condicional. Es diu el Regla de Bayes .

P (A | B) = P (A i B) / P (B)

Podeu comprovar aquest teorema connectant l’exemple que acabem de parlar. Si fins ara ho heu entès, podeu començar amb el següent - Naive Bayes . Utilitza probabilitats condicionals per classificar si un correu electrònic és un correu brossa o no. Pot realitzar moltes altres tasques de classificació. Però, bàsicament, la probabilitat condicional està al centre de .

Estadístiques:

Les estadístiques són s’utilitza per resumir i fer inferències sobre un gran nombre de punts de dades. A Ciències de les dades i aprenentatge automàtic, sovint trobareu la terminologia següent

  • Mesures de centralitat
  • Distribucions (especialment normals)

Mesures de centralitat i mesures de diferencials

Significar:

Mean és només un mitjana de nombres . Per esbrinar la mitjana, heu de sumar els nombres i dividir-los amb el nombre de nombres. Per exemple, la mitjana de [1,2,3,4,5] és 15/5 = 3.

mean-statistics-for-machine-learning

Mitjana:

La mediana és la element mitjà d’un conjunt de nombres quan es disposen en ordre ascendent. Per exemple, els nombres [1,2,4,3,5] s’ordenen en un ordre ascendent [1,2,3,4,5]. El mitjà és 3. Per tant, la mediana és 3. Però, què passa si el nombre de nombres és parell i, per tant, no té cap número mitjà? En aquest cas, agafeu la mitjana de les dues xifres més mitjanes. Per a una seqüència de 2n nombres en ordre ascendent, prometeu l'enèsima i (n + 1)thnúmero per obtenir la mediana. Exemple - [1,2,3,4,5,6] té la mediana (3 + 4) / 2 = 3,5

Mode:

El mode és simplement el nombre més freqüent en un conjunt de nombres . Per exemple, el mode de [1,2,3,3,4,5,5,5] és 5.

Desacord:

La variació no és una mesura de centralitat. Mesura com es distribueixen les vostres dades al voltant de la mitjana . Es quantifica com

xés la mitjana de N números. Agafes un punt, restes la mitjana, agafes el quadrat d’aquesta diferència. Feu això per a tots els N números i prometeu-los. L’arrel quadrada de la variància s’anomena desviació estàndard. A continuació, en aquest article sobre estadístiques d’aprenentatge automàtic, entenem la distribució normal.

Distribució normal

La distribució ens ajuda entendre com es difonen les nostres dades . Per exemple, en una mostra d’edats, podem tenir joves més que adults majors i, per tant, valors d’edat més petits que valors majors. Però, com definim una distribució? Considereu l'exemple següent

L'eix y representa la densitat. El mode d'aquesta distribució és 30, ja que és el pic i, per tant, el més freqüent. També podem localitzar la mediana. La mitjana es troba al punt de l’eix x on es cobreix la meitat de l’àrea sota la corba. L'àrea sota qualsevol distribució normal és 1 perquè la suma de probabilitats de tots els esdeveniments és 1. Per exemple,

La mitjana en el cas anterior és al voltant de 4. Això vol dir que l'àrea sota la corba abans de 4 és la mateixa que després de 4. Considereu un altre exemple

mostra com crear un conjunt

Veiem tres distribucions normals. Les blaves i vermelles tenen la mateixa mitjana. El vermell té una variant més gran. Per tant, està més estès que el blau. Però com que l'àrea ha de ser 1, el pic de la corba vermella és més curt que la corba blava, per mantenir l'àrea constant.

Espero que hàgiu entès les estadístiques bàsiques i les distribucions normals. Ara, a continuació, en aquest article sobre estadístiques d’aprenentatge automàtic, anem a conèixer l’àlgebra lineal.

Àlgebra linial

La IA moderna no seria possible sense l’àlgebra lineal. Forma el nucli de Aprenentatge profund i s'ha utilitzat fins i tot en algorismes senzills com . Comencem sense cap demora.

Heu de familiaritzar-vos amb els vectors. Són una mena de representacions geomètriques a l’espai. Per exemple, un vector [3,4] té 3 unitats al llarg de l'eix x i 4 unitats al llarg de l'eix y. Penseu en la imatge següent:

El vector d1 té 0,707 unitats al llarg de l’eix x i 0,707 unitats al llarg de l’eix y. Un vector té 1 dimensió. Té necessàriament una magnitud i una direcció. Per exemple,

La imatge anterior té un vector (4,3). La seva magnitud és de 5 i fa 36,9 graus amb l’eix x.

Ara, què és una matriu? Matrix és una matriu multidimensional de nombres. Per a què serveix? Ho veurem endavant. Però primer, vegem com s’utilitza.

Matriu

Una matriu pot tenir moltes dimensions. Considerem una matriu bidimensional. Té files (m) i columnes (n). Per tant, té m * n elements.

Per exemple,

Aquesta matriu té 5 files i 5 columnes. Anomenem-la A. Per tant, A (2,3) és l’entrada de la segona fila i la tercera columna que és 8.

Ara, ja que sabeu què és una matriu, ens permet examinar les diferents operacions de la matriu.

Operacions de matriu

Addició de matrius

Dues matrius del mateix es poden afegir dimensions. L’afegit passa per elements.

Multiplicació escalar

Una matriu es pot multiplicar per una quantitat escalar. Aquesta multiplicació condueix a que cada entrada de la matriu es multipliqui per l'escalar. Un escalar és només un número

què és el mètode a javascript

Transposició de matriu

La transposició de matriu és senzilla. Per a una matriu A (m, n), sigui A ’la seva transposició. Llavors

A '(i, j) = A (j, i)

Per exemple,

Multiplicació de matrius

Probablement sigui una mica complicat que altres operacions. Abans d’endinsar-nos-hi, definim el producte punt entre dos vectors.

Considereu el vector X = [1,4,6,0] i el vector Y = [2,3,4,5]. A continuació, el producte punt entre X i Y es defineix com

X.y = 1 * 2 + 4 * 3 + 6 * 4 + 0 * 5 = 38

Per tant, es tracta de multiplicar i sumar elements. Ara,considerem dues matrius A (m, n) i B (n, k), on m, n, k són dimensions i, per tant, enters. Definim la multiplicació de matrius com

En l'exemple anterior, el primer element del producte (44) s'obté amb el producte punt de la primera fila de la matriu esquerra amb la primera columna de la matriu dreta. De la mateixa manera, el 72 s’obté amb el producte punt de la primera fila de la matriu esquerra amb la segona columna de la matriu dreta.

Tingueu en compte que per a la matriu esquerra, el nombre de columnes ha de ser igual al nombre de files de la columna dreta. En el nostre cas, el producte AB existeix però no BA ja que m no és igual a k. Per a dues matrius A (m, n) i B (n, k), es defineix el producte AB i la dimensió del producte és (m, k) (la majoria de dimensions externes de (m, n), (n, k )). Però BA no es defineix tret que m = k.

Amb això, arribem al final d’aquest article sobre Estadístiques per a l’aprenentatge automàtic. Espero que hagueu entès alguns dels argots d’aprenentatge automàtic. Però no acaba aquí. Per assegurar-vos que esteu preparat per a la indústria, podeu consultar els cursos d’Edureka sobre ciència de dades i IA. Es poden trobar