Dades Massives

Spark vs Hadoop: quin és el millor marc de dades grans?

Aquesta entrada al bloc parla sobre l'apache spark vs hadoop. Us donarà una idea de quin és el marc Big Data adequat per triar en diferents escenaris.

Execució de l'aplicació Scala a Eclipse IDE mitjançant Sbteclipse

Aquest bloc us ajuda a entendre com instal·lar i configurar el connector sbteclipse amb instruccions pas a pas per executar l’aplicació Scala a Eclipse IDE.

Hadoop dominat? És hora de començar amb Apache Spark

Aquesta publicació del bloc explica per què heu de començar amb Apache Spark després d’Hadoop i per què aprendre Spark després de dominar hadoop pot fer meravelles per a la vostra carrera.

Drilling Down On Apache Drill, el motor de consultes New-Age

Aquest tutorial d'Apache Drill us proporciona tota la informació que necessiteu per començar amb el motor de consultes d'Apache Drill, ús amb Hadoop, Big Data i Apache Spark.

Apache Spark combineByKey explicat

Aquest bloc de Spark Hadoop us explica tot el que necessiteu saber sobre Apache Spark combineByKey. Cerqueu la puntuació mitjana per estudiant mitjançant el mètode combineByKey.

Apache Falcon: nova plataforma de gestió de dades per a l’ecosistema Hadoop

Apache Falcon és una nova plataforma de gestió de dades per a l’ecosistema Hadoop que simplifica el processament i la gestió de pinsos integrats en clústers de hadoop. Obteniu informació sobre com es configura.

Acumuladors d’espurna explicats: Apache Spark

Aquest blog d’Apache Spark explica detalladament els acumuladors d’espurnes. Apreneu l’ús de l’acumulador d’espurnes amb exemples. Els acumuladors d’espurnes són com els comptadors Hadoop Mapreduce.

Apache Flink: el marc d’anàlisi de dades grans de propera generació per al processament de dades en flux i en lots

Obteniu més informació sobre Apache Flink i com configureu un clúster Flink en aquest bloc. Flink admet el processament per lots i en temps real i és una tecnologia de Big Data obligatòria per a Big Data Analytics.

Memòria cau distribuïda amb variables difoses: Apache Spark

Aquesta entrada al bloc tracta de la memòria cau distribuïda amb variables d’emissió i us permet començar a distribuir eficaçment valors grans a la programació Spark.

Certificacions CCA i CCP de Cloudera: tot el que heu de saber

Les certificacions CCA i CCP de Cloudera han substituït els exàmens CCDH i CCSHB. Aquest bloc us explica tot el que heu de saber sobre les noves certificacions.

Transformacions estatals amb Windowing en Spark Streaming

Aquesta entrada al bloc tracta de les transformacions estatals amb la visualització de finestres a Spark Streaming. Obteniu més informació sobre el seguiment de dades a través de lots mitjançant D-Streams d’estat.

Transformació acumulativa d'estat en Apache Spark Streaming

Aquesta entrada al bloc tracta de les transformacions estatals en Spark Streaming. Obteniu més informació sobre el seguiment acumulatiu i les habilitats per a una carrera de Hadoop Spark.

Big Data en salut: com revoluciona Hadoop Healthcare Analytics

Les tecnologies Hadoop i Big Data revolucionen l’anàlisi sanitària. Aquest bloc de dades massives a la salut parla de com les anàlisis de dades grans poden millorar l’atenció mèdica.

Hadoop Streaming: escriure un programa Hadoop MapReduce a Python

Aquesta entrada de bloc sobre Hadoop Streaming és una guia pas a pas per aprendre a escriure un programa Hadoop MapReduce a Python per processar grans quantitats de Big Data.

Tutorial de Big Data: tot el que heu de saber sobre el Big Data.

Aquest bloc sobre el tutorial de Big Data us proporciona una visió completa de Big Data, les seves característiques, aplicacions i els reptes amb Big Data.

Tutorial HDFS: Introducció a HDFS i les seves funcions

Aquest bloc Tutorial HDFS us ajudarà a entendre HDFS o el sistema de fitxers distribuïts Hadoop i les seves característiques. També explorareu breument els seus components bàsics.

Splunk vs. ELK vs. Sumo Logic: quina us funciona millor?

En aquest tutorial de Splunk, entengueu les diferències entre Splunk vs. ELK i Sumo Logic i determineu quina d'aquestes eines us convé més.

Cas d’ús de Splunk: Cas d’èxit de Domino

En aquest bloc de casos d’ús de Splunk, entendreu com Domino's Pizza va utilitzar Splunk per obtenir informació sobre el comportament dels consumidors i formular les seves estratègies comercials.

Instal·leu Hadoop: configuració d'un clúster Hadoop d'un sol node

Aquest tutorial és una guia pas a pas per instal·lar el clúster Hadoop i configurar-lo en un sol node. Tots els passos d’instal·lació d’Hadoop són per a la màquina CentOS.