Sto lavorando a un programma Spark Streaming che recupera un flusso Kafka, esegue una trasformazione di base nello stream e quindi inserisce i dati in un DB (voltdb se pertinente). Sto provando a misurare la velocità con cui inserisco le righe nel DB. Penso che metrics possa essere utile (usando JMX). Tuttavia non riesco a trovare come aggiungere metriche personalizzate a Spark. Ho guardato il codice sorgente di Spark e ho anche trovato this thread tuttavia non funziona per me. Ho anche abilitato il sink JMX nel file conf.metrics. Cosa non funziona è che non vedo le mie metriche personalizzate con JConsole.Metriche personalizzate di streaming Spark
Qualcuno potrebbe spiegare come aggiungere metriche personalizzate (preferibilmente tramite JMX) per generare lo streaming? O in alternativa come misurare la mia velocità di inserimento sul mio DB (in particolare VoltDB)? Sto usando la scintilla con Java 8.
Hai capito come contare qualsiasi cosa dagli esecutori? Ho un usecase simile in cui scrivo all'endpoint HTTP e voglio contare un sacco di cose dagli esecutori, ma i contatori non si sposteranno. –
Questo è stato in realtà molto tempo fa ma, per quanto ricordo, ho inviato le mie metriche dagli esecutori usando le metriche di codahale e hanno un reporter di grafite e ho appena riassunto tutto in grafite – Gideon
Ah ok, grazie per la risposta. Il mio caso d'uso è un po 'diverso, scrivendo la mia fonte e provando a inviare gli eventi allo strumento di metrica interna. –