Procés de modelatge típic:
En un procés de modelatge típic, és important començar a elaborar una hipòtesi. Es rep una sol·licitud de proposta (RFP) (Sol·licitud de proposta) i es dibuixa una hipòtesi.
- Determineu la font de dades adequada - Aquí el client pot proporcionar una font de dades, si no, hem de buscar una font de dades. Davant d’un escenari en què intentem avaluar qui guanyaria les eleccions, es fa una anàlisi pública de dades amb fonts que inclouen xarxes socials, canals de notícies o opinió pública. També hem d’entendre la quantitat de dades necessàries per analitzar el problema. En aquest cas, normalment busquem mostres grans, ja que es tracta d’un cas electoral. D’altra banda, si l’anàlisi es fa sobre Healthcare, és difícil optar per una població nombrosa perquè hi ha la possibilitat de no obtenir prou gent per validar la hipòtesi. A més, la qualitat de les dades és molt important.
- Extreure dades - Per exemple, si prenem una mostra de població, podem veure atributs, com ara ingressos alts, ingressos baixos, edat, població activa (fora del lloc / lloc), residents, IRN, cobertura d’hospitals, etc., per iniciar l’estudi. . Aquí és possible que no necessitem tants atributs per a la hipòtesi. Entenem que atributs, com ara ingressos alts i baixos, poden no ser els factors que contribueixen a determinar qui guanyarà les eleccions. Però l’edat pot marcar la diferència, ja que donarà un recompte directe de la quantitat de persones que votaran. Moltes vegades podem excloure atributs menys utilitzats o incloure atributs útils. Podria sortir malament en ambdós casos. Aquesta és la raó per la qual l’anàlisi és un repte.
- Massatge de les dades per adaptar-se a l'eina - Això es deu al fet que no totes les eines poden acceptar totes les dades. Algunes eines només accepten dades CSV o dades Excel. La manca d’eines és un repte.
- Executeu l'anàlisi - Aquesta operació es pot realitzar utilitzant moltes tècniques d’anàlisi.
- Traieu conclusions - L'anàlisi dóna números per ser precisos. Però correspon a un usuari treure conclusions d’aquestes xifres. Per exemple, si diu un 10% o un 20%, hem d’entendre què significa? Deriva correlació entre l'atribut A i l'atribut B?
- Implementar resultats - És important implementar conclusions per veure resultats en els negocis. Per exemple, es pot concloure que 'La gent compra paraigües en temporada de pluges' cosa que pot provocar més negoci. Aquí, hem d’implementar una conclusió en què fem el paraigua disponible a les botigues, però pot tenir problemes de gestió. En el moment que les estadístiques donin resultat, la implementació pot sortir malament.
- Superviseu el progrés - L'últim pas aquí, el control té un paper important. El seguiment pot sortir malament perquè poques organitzacions volen controlar el progrés i es considera un pas insignificant. Però el control és important ja que podem entendre si les nostres investigacions i conclusions van en la direcció correcta.
Consulteu també aquest article' La correlació no significa causació 'cosa que dóna una idea de com els analistes poden sortir malament. Un punt important que cal tenir en compte en aquest gràfic és que l’anàlisi de funcionament és l’únic pas en què la màquina és responsable i, més enllà d’això, correspon a un ésser humà que finalment determinarà com es fa la investigació.
Tens alguna pregunta? Esmenta’ls a la secció de comentaris i et respondrem.
Articles Relacionats: