Aquesta publicació conté el pas necessari per crear UDF a Apache Pig. Tot UDF hauria d’estendre una funció de filtre i ha de contenir un mètode anomenat exec, que conté una tupla. La lògica que s’aplica aquí és que si la tupla és nul·la o nul·la, us donarà un valor booleà: cert o fals. I ‘IsofAge’ serveix per comprovar si l’edat indicada és correcta o no. La lògica de la funció definida per l’usuari s’escriu en codis Java, on es crearà i exportarà el fitxer JAR. El fitxer JAR es registrarà posteriorment. Aquests fitxers JAR es troben als fitxers de la biblioteca d’Apache Pig en el moment de la càrrega.
classe pública IsOfAge amplia FilterFunc { @Override publicBoolean exec (tupla tupla) throwsIOException { if (tupla == nul·la || tupla.size () == 0) { returnfalse } provar { Object object = tuple.get (0) if (object == nul) { returnfalse } inti = (enter) objecte if (i == 18 || i == 19 || i == 21 || i == 23 || i == 27) { returntrue } més { returnfalse }} catch (ExecExceptione) { thrownewIOException (e) }}}
Com trucar a un UDF Pig?
Un cop creat un UDF, s’ha d’utilitzar l’ordre següent per registrar el fitxer JAR.
registre myudf.jar X = filtre A per IsOfAge (edat)
Passos per crear UDF a Pig:
Hi ha múltiples funcions predefinides a Apache Pig. També tenim la funció de crear la nostra pròpia funció que és la funció definida per l'usuari (UDF). Pig UDF està escrit en Java i això requereix que Pig Library utilitzi les classes predefinides. La biblioteca Apache Pig pig-0.8.0-cdh3u0-core.jar es pot descarregar des d’internet.
titella vs xef vs ansible
Feu clic aquí per obtenir els passos per crear un script Pig amb UDF en mode HDFS.
Tens alguna pregunta? Esmenteu-los a la secció de comentaris i us respondrem.
Articles Relacionats:
té un màster de postgrau
Script Apache Pig amb UDF en mode HDFS
funció de membre estàtic c ++
Operadors d'Apache Pig: primera part: operadors relacionals
Operadors d'Apache Pig: Part 2 - Operadors de diagnòstic