Spark vs Hadoop: quin és el millor marc de dades grans?
Aquesta entrada al bloc parla sobre l'apache spark vs hadoop. Us donarà una idea de quin és el marc Big Data adequat per triar en diferents escenaris.
Aquesta entrada al bloc parla sobre l'apache spark vs hadoop. Us donarà una idea de quin és el marc Big Data adequat per triar en diferents escenaris.
Aquest bloc us ajuda a entendre com instal·lar i configurar el connector sbteclipse amb instruccions pas a pas per executar l’aplicació Scala a Eclipse IDE.
Aquesta publicació del bloc explica per què heu de començar amb Apache Spark després d’Hadoop i per què aprendre Spark després de dominar hadoop pot fer meravelles per a la vostra carrera.
Aquest tutorial d'Apache Drill us proporciona tota la informació que necessiteu per començar amb el motor de consultes d'Apache Drill, ús amb Hadoop, Big Data i Apache Spark.
Aquest bloc de Spark Hadoop us explica tot el que necessiteu saber sobre Apache Spark combineByKey. Cerqueu la puntuació mitjana per estudiant mitjançant el mètode combineByKey.
Apache Falcon és una nova plataforma de gestió de dades per a l’ecosistema Hadoop que simplifica el processament i la gestió de pinsos integrats en clústers de hadoop. Obteniu informació sobre com es configura.
Aquest blog d’Apache Spark explica detalladament els acumuladors d’espurnes. Apreneu l’ús de l’acumulador d’espurnes amb exemples. Els acumuladors d’espurnes són com els comptadors Hadoop Mapreduce.
Obteniu més informació sobre Apache Flink i com configureu un clúster Flink en aquest bloc. Flink admet el processament per lots i en temps real i és una tecnologia de Big Data obligatòria per a Big Data Analytics.
Aquesta entrada al bloc tracta de la memòria cau distribuïda amb variables d’emissió i us permet començar a distribuir eficaçment valors grans a la programació Spark.
Les certificacions CCA i CCP de Cloudera han substituït els exàmens CCDH i CCSHB. Aquest bloc us explica tot el que heu de saber sobre les noves certificacions.
Aquesta entrada al bloc tracta de les transformacions estatals amb la visualització de finestres a Spark Streaming. Obteniu més informació sobre el seguiment de dades a través de lots mitjançant D-Streams d’estat.
Aquesta entrada al bloc tracta de les transformacions estatals en Spark Streaming. Obteniu més informació sobre el seguiment acumulatiu i les habilitats per a una carrera de Hadoop Spark.
Les tecnologies Hadoop i Big Data revolucionen l’anàlisi sanitària. Aquest bloc de dades massives a la salut parla de com les anàlisis de dades grans poden millorar l’atenció mèdica.
Aquesta entrada de bloc sobre Hadoop Streaming és una guia pas a pas per aprendre a escriure un programa Hadoop MapReduce a Python per processar grans quantitats de Big Data.
Aquest bloc sobre el tutorial de Big Data us proporciona una visió completa de Big Data, les seves característiques, aplicacions i els reptes amb Big Data.
Aquest bloc Tutorial HDFS us ajudarà a entendre HDFS o el sistema de fitxers distribuïts Hadoop i les seves característiques. També explorareu breument els seus components bàsics.
En aquest tutorial de Splunk, entengueu les diferències entre Splunk vs. ELK i Sumo Logic i determineu quina d'aquestes eines us convé més.
En aquest bloc de casos d’ús de Splunk, entendreu com Domino's Pizza va utilitzar Splunk per obtenir informació sobre el comportament dels consumidors i formular les seves estratègies comercials.
Aquest tutorial és una guia pas a pas per instal·lar el clúster Hadoop i configurar-lo en un sol node. Tots els passos d’instal·lació d’Hadoop són per a la màquina CentOS.
Aquest bloc parla de les diverses ordres HDFS com fsck, copyFromLocal, expunge, cat, etc. que s’utilitzen per gestionar el sistema de fitxers Hadoop.