Sto cercando di compilare questo UDF:Come compilo un alveare UDF
package com.dataminelab.hive.udf;
import org.apache.hadoop.hive.ql.exec.UDF;
import org.apache.hadoop.io.Text;
import java.security.*;
/**
* Calculate md5 of the string
*/
public final class Md5 extends UDF {
public Text evaluate(final Text s) {
if (s == null) {
return null;
}
try {
MessageDigest md = MessageDigest.getInstance("MD5");
md.update(s.toString().getBytes());
byte[] md5hash = md.digest();
StringBuilder builder = new StringBuilder();
for (byte b : md5hash) {
builder.append(Integer.toString((b & 0xff) + 0x100, 16).substring(1));
}
return new Text(builder.toString());
} catch (NoSuchAlgorithmException nsae) {
System.out.println("Cannot find digest algorithm");
System.exit(1);
}
return null;
}
}
Cercando di compilare con:
javac Md5.java
Ma ottengo:
Md5.java:2: package org.apache.hadoop.hive.ql.exec does not exist
import org.apache.hadoop.hive.ql.exec.UDF;
^
Md5.java:3: package org.apache.hadoop.io does not exist
import org.apache.hadoop.io.Text;
Presumo questi sono in un file jar da qualche parte ma non sono sicuro su dove posso installarli, quindi non posso aggiungerli al mio classpath. Qualcuno conosce la posizione predefinita o come scoprirlo?
ho trovato uno '/ usr/lib/hadoop-0.20/hadoop-core.jar' di congettura che ha corretto alcuni errori di compilazione, ma ha ancora un errore per' org.apache.hadoop.hive.ql.exec.UDF' – nickponline
GOt esso: '/ usr/lib/hive/lib/hive-exec-0.7.1-cdh3u3.jar' – nickponline