Com executar scripts Hive?



Aquest és un tutorial sobre com executar Hive Scripts. L’execució d’aquest script reduirà el temps i l’esforç que fem per escriure i executar cada ordre manualment.

Com que és un paquet d’emmagatzematge de dades construït sobre Hadoop, Apache Hive s’acostuma a utilitzar cada cop més per a l’anàlisi de dades, la mineria de dades i el modelatge predictiu. Les organitzacions busquen professionals amb fermesa . En aquesta publicació, vegem com executar Hive Scripts. En general, fem servir els scripts per executar un conjunt d’instruccions alhora. Els scripts Hive s’utilitzen pràcticament de la mateixa manera. Reduirà el temps i l’esforç que fem per escriure i executar cada ordre manualment.

Els scripts Hive són compatibles amb les versions Hive 0.10.0 i posteriors. Com que la versió Hive 0.90 està instal·lada a CDH3, no podem executar scripts Hive a CDH3. Podeu provar els passos següents a CDH4, ja que té instal·lada la versió Hive 0.10.0. Ets conscient de com crear un script Hive? Si no, feu clic a per obtenir més aclariments.





Master-Hive-Now

Ara, vegem com escriure els scripts a Hive i executar-los a CDH4:



Pas 1: escriure un script Hive.

Per escriure l’Hive Script, s’ha de desar el fitxer amb l’extensió .sql. Obriu un terminal a la vostra distribució Cloudera CDH4 i doneu l'ordre següent per crear un script Hive.
Comandament: sudo gedit sample.sql

En executar l'ordre anterior, obrirà el fitxer amb la llista de totes les ordres de Hive que cal executar.



En aquest script, es crearà una taula, es descriurà i es carregaran i recuperaran les dades de la taula.

1. Creació de la taula a Hive:

Comandament: crear producte de taula (productid: int, nom del producte: cadena, preu: flotant, categoria: cadena) format de files camps delimitats finalitzats per ','

Aquí, producte és el nom de la taula i {productid, nom del producte, preu, categoria} són les columnes d’aquesta taula.

Els camps acabats per ',' indiquen que les columnes del fitxer d'entrada estan separades pel símbol ','.

java deep copy vs superficial

Per defecte, els registres del fitxer d'entrada estan separats per una línia nova.

2. Descripció de la taula:

Comandament: descriu el producte

3. Carregant les dades a la taula.

Per carregar les dades a la taula primer, hem de crear un fitxer d’entrada que contingui els registres que cal inserir a la taula.

Creem un fitxer d'entrada.

Comandament: sudo gedit input.txt

Editeu el contingut del fitxer tal com es mostra a la figura.

4. Recuperació de les dades:

Per recuperar les dades, s’utilitza l’ordre select.

Comandament: Seleccioneu * del producte

L'ordre anterior s'utilitza per recuperar el valor de totes les columnes presents a la taula. El guió hauria de ser com es mostra a la imatge següent.

Ara ja hem acabat d’escriure el guió Hive. Ara es pot desar el fitxer sample.sql.

Pas 2: executar l'script Hive

El següent és l'ordre per executar l'script Hive:

Comandament: rusc –f /home/cloudera/sample.sql

Mentre executeu l'script, assegureu-vos que hi hagi tot el camí d'accés de la ubicació del fitxer Script.

Podem veure que totes les ordres s’executen amb èxit.

Així s’executen i s’executen els scripts Hive a CDH4.

Hive és un component crític d’Hadoop i la vostra experiència en Hive us pot aconseguir llocs de treball amb millor pagament de Hadoop. Edureka té un curs especialitzat en Hadoop que us ajuda a dominar conceptes com MapReduce, Yarn, Pig, Hive, HBase, Oozie, Flume i Sqoop. Feu clic al botó següent per començar.

Tens alguna pregunta? Esmenteu-los a la secció de comentaris i us respondrem.

Articles Relacionats:

Ordres del rusc

Models de dades de rusc