Quando uso Apache Tika per determinare il tipo di file dal contenuto. Il file XML va bene, ma non il json. Se il tipo di contenuto è json, restituirà "text/plain" invece di "application/json".Apache Tika e Json
Qualsiasi aiuto?
public static String tiKaDetectMimeType(final File file) throws IOException {
TikaInputStream tikaIS = null;
try {
tikaIS = TikaInputStream.get(file);
final Metadata metadata = new Metadata();
return DETECTOR.detect(tikaIS, metadata).toString();
} finally {
if (tikaIS != null) {
tikaIS.close();
}
}
}
Chiunque ha suggerimenti se non si ha a che fare con un file o non ci si può fidare dell'estensione del file come suggerimento? – milletron
@milletron Passa ad Apache Tika il contenuto del file, e farà anche il rilevamento basato sulla magia del mimo – Gagravarr
Grazie a @Gagravarr. Sì, posso dire che la funzione di rilevamento mime funziona in generale con una dozzina di flussi di byte diversi che ho trasmesso, ma ancora non distinguo Json separatamente dal testo normale (sebbene con almeno 1.15). Immagino che si dovrebbe scrivere un nuovo rilevatore simile a XML e HTML? Sono solo sorpreso che JSON non sia già incluso. – milletron