Dades Massives

Tutorial HBase: Introducció a HBase i cas pràctic de Facebook

Aquest bloc d'aprenentatge HBase us presenta què és HBase i les seves funcions. També cobreix l'estudi de cas de Facebook Messenger per entendre els beneficis de HBase.

Instal·la Titella: instal·la Titella en quatre senzills passos

Aquest bloc és una guia sobre com instal·lar Puppet Master i Puppet Agent. També inclou un exemple per desplegar Apache Tomcat mitjançant el mòdul Puppet Tomcat.

Instal·lació d'Apache Pig a Linux

Aquest bloc és una guia pas a pas per a la instal·lació d'Apache Pig a l'entorn Linux. Instal·larem Apache Pig 0.16.0 i l'executarem en diferents modes.

Arquitectura HBase: model de dades HBase i mecanisme de lectura / escriptura HBase

Aquest bloc sobre HBase Architecture explica el model de dades de HBase i dóna informació sobre HBase Architecture. També explica diferents mecanismes de HBase.

Tutorial de rusc: estudi de casos de l'arquitectura de rusc i la NASA

Aquest bloc d'aprenentatge Hive us proporciona un coneixement profund de l'arquitectura i el model de dades de Hive. També explica l’estudi de casos de la NASA sobre Apache Hive.

Tutorial de transmissió Spark: anàlisi de sentiments mitjançant Apache Spark

Aquest bloc de Spark Streaming us presentarà Spark Streaming, les seves característiques i components. Inclou un projecte d’Anàlisi de sentiments mitjançant Twitter.

MLlib - Biblioteca d'aprenentatge automàtic d'Apache Spark

Aquest blog Spark MLlib us presentarà la biblioteca d’Apache Spark’s Machine Learning. Inclou un projecte de sistema de recomanació de pel·lícules que utilitza Spark MLlib.

Tutorial de Spark GraphX - Analítica de gràfics a Apache Spark

Aquest bloc Tutorial GraphX us presentarà Apache Spark GraphX, les seves característiques i components, inclòs un projecte d’anàlisi de dades de vol.

Tutorial Apache Flume: transmissió de dades de Twitter

Aquest blog de tutorial d’Apache Flume explica els fonaments d’Apache Flume i les seves característiques. També mostrarà la transmissió de Twitter mitjançant Apache Flume.

Tutorial Apache Sqoop: importació / exportació de dades entre HDFS i RDBMS

Tutorial Apache Sqoop: Sqoop és una eina per transferir dades entre bases de dades relacionals i Hadoop. Aquest bloc tracta de la importació i exportació de Sooop des de MySQL.

Tutorial Oozie: apreneu a programar les vostres feines Hadoop

Tutorial d'Apache Oozie: Oozie és un sistema de planificació de flux de treball per gestionar feines Hadoop. És un sistema escalable, fiable i extensible.

Aplicacions de Big Data en temps real en diversos dominis

Les aplicacions de Big Data revolucionen les organitzacions i els ajuden a prendre decisions empresarials més informatives mitjançant l’anàlisi de grans volums de dades.

Introducció a Spark amb Python - PySpark per a principiants

Apache Spark s’ha apoderat del món Big Data & Analytics i Python és un dels llenguatges de programació més accessibles que s’utilitzen a la indústria actualment. Així doncs, aquí, en aquest bloc, coneixerem Pyspark (spark with python) per treure el millor d’ambdós mons.

Tutorial Hadoop YARN: apreneu els fonaments de l'arquitectura YARN

Aquest bloc se centra en Apache Hadoop YARN, que es va introduir a la versió 2.0 de Hadoop per a la gestió de recursos i la planificació de treballs. Explica l'arquitectura YARN amb els seus components i les tasques realitzades per cadascun d'ells. Descriu l'enviament de l'aplicació i el flux de treball a Apache Hadoop YARN.

Articles Més Populars

Categoria

Articles D'Interès