Quins són els requisits previs per a l'aprenentatge automàtic?



Aquest bloc sobre els requisits previs per a l'aprenentatge automàtic us ajudarà a entendre els conceptes bàsics que heu de conèixer abans de començar amb l'aprenentatge automàtic.

L’aprenentatge automàtic és, sens dubte, la tecnologia més demandada de l’època. Si sou un principiant que comença amb l’aprenentatge automàtic, és important que conegueu els requisits previs per a l’aprenentatge automàtic. Aquest bloc us ajudarà a entendre els diferents conceptes que heu de conèixer abans de començar amb l'aprenentatge automàtic.

Per obtenir un coneixement en profunditat d’Intel·ligència Artificial i Aprenentatge Automàtic, podeu inscriure-us per viure per Edureka amb assistència les 24 hores del dia, els 7 dies de la setmana i accés permanent.





Aquí teniu una llista de temes tractat en aquest bloc:

  1. Requisits previs per a l'aprenentatge automàtic
  2. Comprendre l'aprenentatge automàtic amb un cas d'ús

Requisits previs per a l'aprenentatge automàtic

Per començarAprenentatge automàtic: heu de familiaritzar-vos amb els conceptes següents:



tutorial amazon ec2 per a principiants
  1. Estadístiques
  2. Àlgebra linial
  3. Càlcul
  4. Probabilitat
  5. Llenguatges de programació

Estadístiques

Les estadístiques contenen eines que es poden utilitzar per obtenir algun resultat de les dades. Hi ha estadístiques descriptives que s’utilitzen per transformar dades brutes en alguna informació important. A més, es poden utilitzar estadístiques inferencials per obtenir informació important d'una mostra de dades en lloc d'utilitzar un conjunt de dades complet.

Per obtenir més informació Estadístiques que podeu consultar a través dels següents blocs:

Àlgebra linial

Ofertes d’àlgebra linealamb vectors, matrius i transformacions lineals. És molt important en l’aprenentatge automàtic, ja que es pot utilitzar per transformar i realitzar operacions al conjunt de dades.



Càlcul

El càlcul és un camp important en matemàtiques i té un paper integral en molts algorismes d’aprenentatge automàtic. Hi ha un conjunt de dades amb diverses funcionss’utilitza per construir models d’aprenentatge automàtic, ja que les funcions són múltiples. El càlcul multivariable té un paper important per construir un model d’aprenentatge automàtic. Les integracions i les diferenciacions són imprescindibles.

Probabilitat

La probabilitat ajuda a predir la probabilitat que es produeixin. Ens ajuda a raonar que la situació pot tornar a passar o no. Per a l’aprenentatge automàtic, la probabilitat és a fonament.

Mathematics

Per obtenir més informació sobre Probabilitat, podeu fer-ho bloc.

Llenguatge de programació

És fonamental conèixer llenguatges de programació com R i Python per implementar tot el procés d’aprenentatge automàtic. Python i R ofereixen biblioteques integrades que faciliten la implementació d’algoritmes d’aprenentatge automàtic.

A part de tenir coneixements bàsics de programació, també és important que sàpiga extreure, processar i analitzar dades. Aquesta és una de les habilitats més importants necessàries per a l’aprenentatge automàtic.

Per obtenir més informació sobre la programació idiomes per a l’aprenentatge automàtic, podeu consultar els següents blocs:

  1. Les millors biblioteques Python per a ciències de dades i aprenentatge automàtic

Cas d’ús d’aprenentatge automàtic

L’aprenentatge automàtic consisteix a crear un algoritme que pugui aprendre de les dades per fer una predicció, com ara quins tipus d’objectes hi ha a la imatge, o el motor de recomanacions, la millor combinació de medicaments per curar certes malalties o el filtratge de correu brossa.

L’aprenentatge automàtic es basa en els requisits previs matemàtics i si sabeu per què s’utilitzen les matemàtiques en l’aprenentatge automàtic, el farà divertit. Heu de conèixer les matemàtiques darrere de les funcions que utilitzeu i quin model és adequat per a les dades i per què.

Comencem, doncs, amb un interessant problema de predir els preus de les cases, amb un conjunt de dades que conté un historial de diferents característiques i preus, per ara, considerarem l’àrea de la superfície habitable en peus quadrats i els preus.

Ara tenim un conjunt de dades que conté dues columnes com es mostra a continuació:

Hi ha d’haver alguna correlació entre aquestes dues variables per saber que haurem de construir un model que pugui predir el preu de les cases, com ho podem fer?

com utilitzar la plataforma Google Cloud

Representem gràficament aquestes dades i vegem el seu aspecte:

Aquí l’eix X és el preu per metre quadrat de superfície habitable i l’eix Y és el preu de la casa. Si representem tots els punts de dades obtindrem un diagrama de dispersió que es pot representar mitjançant una línia com es mostra a la figura anterior i, si introduïm algunes dades, predirem algun resultat. Idealment, hauríem de trobar una línia que talli el màxim de punts de dades.

Aquí intentem crear una línia que s'anomena:

Y = mX + c

Aquest mètode de predicció de la relació lineal entre l'objectiu (variable dependent) i la variable predictora (variable independent) s'anomena regressió lineal. Ens permet estudiar i resumir una relació entre dues variables.

  • X = Variable independent
  • I = Dependent variable
  • c = i-intercept
  • m = Desnivell de línia

Si tenim en compte l’equació, tenim valors per a X que és una variable independent, així que només hem de calcular valors per m i c per predir el valor de Y.

Llavors, com podem trobar aquestes variables?

Per trobar aquestes variables, podem provar un munt de valors i intentar esbrinar una línia que talla el nombre màxim de punts de dades. Però, com podem trobar la línia més adequada?

Per tant, per trobar la línia més adequada, podem utilitzar la funció d’error de mínims quadrats que trobarà l’error entre el valor real de y i el valor predit y`.

La funció d'error de mínims quadrats es pot representar mitjançant l'equació següent:

quina és l'etiqueta span en html

Mitjançant aquesta funció podem esbrinar l’error de cada punt de dades predit comparant-lo amb el valor real del punt de dades. A continuació, agafeu la suma de tots aquests errors i els quadreu per esbrinar la desviació de la predicció.

Si afegim el tercer eix al nostre gràfic que conté tots els valors d’error possibles i el representem en un espai tridimensional, quedarà així:

A la imatge anterior, els valors ideals es trobarien a la part negre inferior, que predirà els preus propers al punt de dades real. El següent pas és trobar els millors valors possibles per a mi. Això es pot fer mitjançant la tècnica d’optimització anomenada descens de gradient.

El descens de gradient és un mètode iteratiu, on comencem inicialitzant alguns conjunts de valors per a les nostres variables i millorant-los lentament minimitzant l’error entre el valor real i el valor predit.

Ara bé, si creiem que pràcticament els preus de l'apartament no depenen realment només del preu per peus quadrats, hi ha molts factors, com ara el nombre de dormitoris, banys, etc. Si tenim en compte aquestes característiques, l'equació tindrà un aspecte similar com això

Y = b0 + b1x1 + b2x2 + & hellip .. + bnxn + c

Aquesta és una regressió multilineal que pertany a l'àlgebra lineal, aquí podem utilitzar matrius de mida mxn on m són característiques i n són punts de dades.

Considerem una altra situació en què podem utilitzar la probabilitat per trobar l’estat de la casa per classificar una casa en funció de si està en bon estat o en mal estat. Per a això, per treballar haurem d’utilitzar una tècnica anomenada Regressió Logística que treballa sobre la probabilitat d’ocurrències representades per una funció sigmoide.

En aquest article, hem tractat els requisits previs de l’aprenentatge automàtic i com s’apliquen a l’aprenentatge automàtic. Bàsicament, consisteix en estadístiques, càlculs, àlgebra lineal i teoria de probabilitats. El càlcul té tècniques utilitzades per a l’optimització, l’àlgebra lineal té algorismes que poden funcionar en grans conjunts de dades, amb la probabilitat de predir la probabilitat d’ocurrències i les estadístiques ens ajuden a inferir coneixements útils a partir de la mostra de conjunts de dades.

Ara que ja coneixeu els requisits previs per a l’aprenentatge automàtic, segur que teniu curiositat per obtenir més informació. Aquests són alguns blocs que us ajudaran a començar amb Data Science:

Si voleu inscriure-us a un curs complet d’Intel·ligència Artificial i Aprenentatge Automàtic, Edureka disposa d’un programa especialitzat que us farà dominar tècniques com l'aprenentatge supervisat, l'aprenentatge no supervisat i el processament del llenguatge natural. Inclou formació sobre els darrers avenços i enfocaments tècnics en intel·ligència artificial i aprenentatge automàtic, com ara aprenentatge profund, models gràfics i aprenentatge de reforç.