Què és una xarxa neuronal? Introducció a les xarxes neuronals artificials



Aquest bloc sobre què és una xarxa neuronal us presentarà els conceptes bàsics de xarxes neuronals i com poden resoldre problemes complexos basats en dades.

Amb l’avenç en l’aprenentatge automàtic, ha agafat una carretera alta. L’aprenentatge profund es considera la tecnologia més avançada construïda per resoldre problemes complexos que fan servir conjunts de dades massius. Aquest bloc sobre què és una xarxa neuronal us presentarà els conceptes bàsics de xarxes neuronals i com poden resoldre problemes complexos basats en dades.

Per obtenir un coneixement profund d’Intel·ligència Artificial i Aprenentatge Profund, podeu inscriure-us per viure per Edureka amb assistència les 24 hores del dia, els 7 dies de la setmana i accés permanent.





Aquí teniu una llista de temes que s’hi tractaran bloc:

  1. Què és una xarxa neuronal?
  2. Què és l'aprenentatge profund?
  3. Diferència entre IA, ML i, DL
  4. Necessitat d'aprenentatge profund
  5. Cas d’ús d’aprenentatge profund
  6. Com funcionen les xarxes neuronals?
  7. Xarxa neuronal explicada amb un exemple

Definició simple d'una xarxa neuronal

Modelat d’acord amb el cervell humà, a Neural Network es va crear per imitar la funcionalitat d’un cervell humà . El cervell humà és una xarxa neuronal formada per múltiples neurones, de manera similar, una xarxa neuronal artificial (ANN) està formada per múltiples perceptrons (explicat més endavant).



Xarxa neuronal - Què és una xarxa neuronal - Edureka

Una xarxa neuronal consta de tres capes importants:

  • Capa d'entrada: Com el seu nom indica, aquesta capa accepta totes les entrades proporcionades pel programador.
  • Capa oculta: Entre la capa d'entrada i la de sortida hi ha un conjunt de capes conegudes com a capes ocultes. En aquesta capa, es realitzen càlculs que donen lloc a la sortida.
  • Capa de sortida: Les entrades passen per una sèrie de transformacions a través de la capa oculta que finalment resulta en la sortida que es lliura mitjançant aquesta capa.

Abans d’entrar en les profunditats del funcionament d’una xarxa neuronal, comprenguem què és l’aprenentatge profund.



Què és l'aprenentatge profund?

L’aprenentatge profund és un camp avançat d’aprenentatge automàtic que utilitza els conceptes de xarxes neuronals per resoldre casos d’ús altament computacionals que impliquen l’anàlisi de dades multidimensionals. Automatitza el procés d’extracció de funcions, assegurant-se que cal una intervenció humana mínima.

Llavors, què és exactament Deep Learning?

L’aprenentatge profund és un avançat subcamp d'aprenentatge automàtic que utilitza algoritmes inspirats en l'estructura i la funció del cervell anomenats Xarxes Neurals Artificials.

Diferència entre IA, ML i DL (Intel·ligència artificial vs aprenentatge automàtic vs aprenentatge profund)

Sovint la gent sol pensar-ho , , i Aprenentatge profund són iguals ja que tenen aplicacions comunes. Per exemple, Siri és una aplicació d’IA, aprenentatge automàtic i aprenentatge profund.

Llavors, com estan relacionades aquestes tecnologies?

  • Intel · ligència artificial és la ciència d’aconseguir que les màquines imitin el comportament dels humans.
  • Aprenentatge automàtic és un subconjunt d’Intel·ligència Artificial (IA) que se centra a aconseguir que les màquines prenguin decisions alimentant-les amb dades.
  • Aprenentatge profund és un subconjunt de Machine Learning que utilitza el concepte de xarxes neuronals per resoldre problemes complexos.

En resum, l’IA, l’aprenentatge automàtic i l’aprenentatge profund són camps interconnectats. L’aprenentatge automàtic i l’aprenentatge profund ajuden a la intel·ligència artificial proporcionant un conjunt d’algoritmes i xarxes neuronals per resoldre problemes basats en dades.

Ara que ja coneixeu els conceptes bàsics, entenguem què va conduir a la necessitat d’un aprenentatge profund.

Necessitat d'aprenentatge profund: limitacions dels algorismes i tècniques tradicionals d'aprenentatge automàtic

L’aprenentatge automàtic va suposar un gran avenç en el món tècnic, va conduir a l’automatització de tasques monòtones i que requereixen molt de temps, va ajudar a resoldre problemes complexos i a prendre decisions més intel·ligents. No obstant això, hi havia alguns inconvenients en l'aprenentatge automàtic que van conduir a l'aparició de l'aprenentatge profund.

com utilitzar anaconda per a python

Aquí hi ha algunes limitacions de l’aprenentatge automàtic:

  1. No es poden processar dades d'alta dimensió: L’aprenentatge automàtic només pot processar petites dimensions de dades que contenen un petit conjunt de variables. Si voleu analitzar dades que contenen centenars de variables, no es pot utilitzar l'aprenentatge automàtic.
  2. L'enginyeria de funcions és manual: Penseu en un cas d’ús en què tingueu 100 variables predictores i que només cal restringir les significatives. Per fer-ho, heu d'estudiar manualment la relació entre cadascuna de les variables i esbrinar quines són importants per predir la sortida. Aquesta tasca és extremadament tediosa i requereix molt de temps per als desenvolupadors.
  3. No és ideal per realitzar deteccions d'objectes i processament d'imatges: Com que la detecció d'objectes requereix dades d'alta dimensió, l'aprenentatge automàtic no es pot utilitzar per processar conjunts de dades d'imatges, només és ideal per a conjunts de dades amb un nombre restringit de funcions.

Abans d’entrar a les profunditats de Xarxes neuronals, considerem un cas d’ús real en què s’aplica l’aprenentatge profund.

Aplicació i casos d’ús d’aprenentatge profund

Sabíeu que PayPal processa més de 235.000 milions de dòlars en pagaments de quatre mil milions de transaccions per part dels seus més de 170 milions de clients? Utilitza aquesta gran quantitat de dades per identificar possibles activitats fraudulentes entre altres motius.

Amb l’ajut d’algoritmes d’aprenentatge profund, PayPal va extreure dades de l’historial de compres dels seus clients, a més de revisar els patrons de frau probable emmagatzemats a les seves bases de dades per predir si una transacció en concret és o no fraudulenta.

La companyia fa uns deu anys que confia en la tecnologia Deep Learning i Machine Learning. Inicialment, l’equip de control de fraus feia servir models lineals senzills. Però amb el pas dels anys l’empresa va passar a una tecnologia d’aprenentatge automàtic més avançada anomenada Deep Learning.

El responsable de risc de frau i científic de dades de PayPal, Ke Wang, va citar:

'El que ens agrada de l'aprenentatge automàtic més modern i avançat és la seva capacitat de consumir moltes més dades, gestionar capes i capes d'abstracció i poder' veure 'coses que una tecnologia més senzilla no seria capaç de veure, fins i tot els éssers humans no ser capaç de veure '.

Un model lineal simple és capaç de consumir al voltant de 20 variables. Tot i això, amb la tecnologia Deep Learning es poden executar milers de punts de dades. Per tant, implementant Amb la tecnologia Deep Learning, PayPal pot analitzar milions de transaccions per identificar qualsevol fraudulenta activitat.

Ara anem a aprofundir en una xarxa neuronal i entenem com funcionen.

Com funciona una xarxa neuronal?

Per entendre les xarxes neuronals, hem de descompondre-les i entendre la unitat més bàsica d’una xarxa neuronal, és a dir, un Perceptron.

Què és un Perceptron?

Un Perceptron és una xarxa neuronal d’una sola capa que s’utilitza per classificar dades lineals. Té 4 components importants:

  1. Entrades
  2. Pesos i biaixos
  3. Funció de suma
  4. Funció d'activació o transformació

La lògica bàsica darrere d’un Perceptron és la següent:

Les entrades (x) rebudes de la capa d’entrada es multipliquen amb els pesos assignats w. A continuació, s’afegeixen els valors multiplicats per formar la suma ponderada. La suma ponderada de les entrades i els seus pesos respectius s'aplica a una funció d'activació pertinent. La funció d'activació assigna l'entrada a la sortida respectiva.

Pesos i biaixos en l'aprenentatge profund

Per què hem d'assignar pesos a cada entrada?

Una vegada que s'alimenta una variable d'entrada a la xarxa, s'assigna un valor triat aleatòriament com a pes d'aquesta entrada. El pes de cada punt de dades d’entrada indica la importància que té aquesta entrada per predir el resultat.

El paràmetre de biaix, d'altra banda, permet ajustar la corba de la funció d'activació de manera que s'aconsegueixi una sortida precisa.

Funció de suma

Una vegada que les entrades tenen assignat algun pes, es pren el producte de les entrades i el pes respectius. Si afegiu tots aquests productes, s’obté la suma ponderada. Això es fa mitjançant la funció de suma.

Funció d'activació

L'objectiu principal de les funcions d'activació és assignar la suma ponderada a la sortida. Les funcions d'activació com tanh, ReLU, sigmoid, etc. són exemples de funcions de transformació.

Per obtenir més informació sobre les funcions dels perceptrons, podeu fer-ho bloc.

Abans de nosaltres conclou aquest bloc, posem un exemple senzill per entendre com funciona una xarxa neuronal.

Xarxes neuronals explicades amb un exemple

Penseu en un escenari en el qual vulgueu crear una xarxa de neurones artificials (ANN) que classifiqui les imatges en dues classes:

  • Classe A: que conté imatges de fulles no malaltes
  • Classe B: que conté imatges de fulles malaltes

Llavors, com es crea una xarxa neuronal que classifiqui les fulles en cultius malalts i no malalts?

El procés sempre comença amb el processament i la transformació de l'entrada de manera que es pugui processar fàcilment. En el nostre cas, cada imatge de fulla es desglossarà en píxels en funció de la dimensió de la imatge.

Per exemple, si la imatge es compon de 30 per 30 píxels, el nombre total de píxels serà de 900. Aquests píxels es representen com a matrius, que després s’introdueixen a la capa d’entrada de la xarxa neuronal.

De la mateixa manera que els nostres cervells tenen neurones que ajuden a construir i connectar pensaments, un ANN té perceptrons que accepten les entrades i les processen passant-les de la capa d’entrada a la capa oculta i finalment a la de sortida.

A mesura que l'entrada es passa de la capa d'entrada a la capa oculta, s'assigna un pes aleatori inicial a cada entrada. Les entrades es multipliquen amb els seus pesos corresponents i la seva suma s'envia com a entrada a la següent capa oculta.

Aquí s’assigna un valor numèric anomenat biaix a cada perceptró, que s’associa amb el pes de cada entrada. A més, cada perceptró es passa mitjançant una funció d’activació o transformació que determina si s’activa o no un perceptró concret.

S’utilitza un perceptró activat per transmetre dades a la següent capa. D'aquesta manera, les dades es propaguen (propagació cap endavant) a través de la xarxa neuronal fins que els perceptrons arriben a la capa de sortida.

A la capa de sortida, es deriva una probabilitat que decideix si les dades pertanyen a la classe A o a la classe B.

Sembla senzill, oi? Bé, el concepte darrere de les xarxes neuronals es basa únicament en el funcionament del cervell humà. Necessiteu un coneixement profund de diversos conceptes i algorismes matemàtics. Aquí teniu una llista de blocs per començar:

  1. Què és l'aprenentatge profund? Introducció a l'aprenentatge profund
  2. Aprenentatge profund amb Python: Guia per a principiants d’aprenentatge profund

Si heu trobat aquest bloc rellevant, consulteu el per Edureka, una empresa d'aprenentatge en línia de confiança amb una xarxa de més de 250.000 estudiants satisfets repartits per tot el món. El curs d’Edureka Deep Learning with TensorFlow Certification Training ajuda els estudiants a convertir-se en experts en formació i optimització de xarxes neuronals bàsiques i convolucionals mitjançant projectes i assignacions en temps real, juntament amb conceptes com la funció SoftMax, les xarxes neuronals de codificador automàtic, la màquina restringida de Boltzmann (RBM).