Tècniques de modelatge a Business Analytics amb R



El bloc presenta una breu introducció de les tècniques de modelatge a Business Analytics amb R.

Diferents tècniques de modelatge:

Podem dividir qualsevol problema en processos més petits:





Classificació - és, on classifiquem les dades. Per exemple. malalties, totes les malalties presenten cert comportament i podem classificar-les.

Per exemple: malalties que redueixen la immunitat, malalties que causen mal de cap, etc.



Regressió - consisteix a esbrinar la relació entre múltiples variables.

Per exemple: com es relaciona el pes d’un ésser humà amb la seva alçada.

AnomoliaDetecció - és bàsicament una fluctuació.



Per exemple: en el cas d’alta tensió o baixa tensió.

Un altre exemple pot incloure un comportament regulat que implica conduir pel costat dret o esquerre en funció del país. L’anomolia aquí és algú que condueix des del contrari.

defineix el camí de classe per a java

Un altre exemple podria ser la intrusió a la xarxa. Aquí, un usuari autenticat inicia sessió al lloc web de la vostra empresa i, si algú no autenticat inicia la sessió,Molta.

Importància dels atributs - Bàsicament dóna múltiples atributs, com ara alçada, pes, temperatura, batecs del cor. Un punt a tenir en compte és que tots aquests atributs són importants per a una tasca.

Per exemple: algú intenta predir, a quina hora arribarà una persona. Cada atribut té un paper important, però no tots són importants.

Normes d'associació - En termes més senzills, consisteix a analitzar o predir el comportament següent, on gira al voltant del motor de recomanació.

Per exemple: una persona que compra pa també pot comprar llet. Si analitzem els comportaments de compra anteriors, tots els articles de la cistella tenen una relació. En aquest cas, hi pot haver la probabilitat que la persona que compra pa també compri llet.

Agrupació - És una de les tècniques més antigues en estadística. De fet, sempre es pot modelar qualsevol problema, ja sigui classificació o agrupació, el que significa agrupar entitats similars.

Per exemple:

1) Agafeu una cistella de pomes i taronges, en què podem separar les pomes de les taronges.

2) Un cas d'ús important per a l'agrupació és l'assistència sanitària. Gairebé totes les estadístiques i anàlisis van començar amb casos d’ús de la sanitat. Per aprofundir, hi ha un terme agrupat anomenat cohorts (persones amb malalties similars), de manera que es poden estudiar per separat dels clients existents. Per exemple, si 10 persones pateixen febre i altres 10 persones tenen mal de cap, trobarem el que és comú entre elles i generarem medicaments.

Extracció de funcions - En l’extracció de funcions, la precisió, la validesa i l’error són força rellevants. En altres paraules, l'extracció de funcions es pot anomenar reconeixement de patrons.

Per exemple:

A la cerca de Google, quan un usuari introdueix un terme, obté resultats. Ara, una pregunta important que cal fer és com sabia, quina pàgina és rellevant i no rellevant per al terme? Es pot respondre amb l'extracció de funcions i el reconeixement de patrons, on s'afegeixen funcions destacades. Diguem que es dóna una foto, que algunes càmeres detecten cares, ressalten la cara per donar belles imatges, que també utilitza el reconeixement de funcions.

exemple de gestió de fitxers a Java

Aprenentatge supervisat vs Aprenentatge no supervisat

a) Categoria de predicció - Les tècniques inclouen regressió, logística, xarxes neuronals i arbres de decisió. Alguns exemples inclouen la detecció de fraus (on un ordinador aprèn i prediu el següent frau a partir de la història anterior de frau). En l’aprenentatge sense supervisió, no es pot predir amb exemples ja que no hi ha dades històriques.

b) Categoria de classificació - Prenent un exemple, tant si la transacció és fraudulenta com si no, entra a la categoria de classificació. Aquí prenem dades històriques i les classifiquem amb arbres de decisió o, en cas que no en prenguem dades històriques, comencem directament a les dades i intentem explotar les funcions pel nostre compte. Per exemple, si necessitem conèixer els empleats, que és probable que abandonin l'organització o que es quedin. En el cas que es tracti d’una organització nova, on no podem utilitzar dades històriques, sempre podem utilitzar el clúster per a l’extracció de dades.

c) Categoria d’exploració - Aquest és un mètode senzill, amb el que vol dir el que significa big data. En l’aprenentatge no supervisat, s’anomena components principals i agrupació.

d) Categoria d'afinitat - Aquí hi ha diversos elements com ara vendes creuades / vendes creuades, anàlisi de cistelles de mercat. A l'anàlisi de la cistella, no hi ha aprenentatge supervisat, ja que no hi ha dades històriques. Per tant, prenem dades directament i trobem associacions, seqüenciació i anàlisi de factors.

Tens alguna pregunta? Esmenta’ls a la secció de comentaris i et respondrem.

Articles Relacionats: