2015-08-24 6 views
5

Desidero conoscere la relazione tra il set di dati di allenamento, il set di dati di test e la verità dei gound. Conosco il significato di ognuno separatamente ma non riesco a vedere la relazione tra loro, in particolare la verità di base e i dati di addestramento.Set di dati Truth and training

risposta

6

I dati di allenamento sono ciò su cui si allena il classificatore.

Quindi testare la precisione del modello sul set di test.

verità a terra si riferisce a l'etichetta per ogni campione di formazione si è cioè di sapere a quale categoria/esito ogni campione di formazione appartiene al

+0

E se non riesco a conoscere l'etichetta di ciascun campione nei miei dati di allenamento? Non posso ancora elaborarlo? – Arwa

+0

Puoi, ma vorresti guardare qualcosa chiamato apprendimento non supervisionato a quel punto. Per l'apprendimento supervisionato hai bisogno di etichette perché altrimenti non può imparare che le caratteristiche x, y, z sono associate alla categoria 1, per esempio. – Simon

+0

Ho un'altra domanda, se conosco l'etichetta delle parti del mio allenamento? Posso considerare quella parte come verità e processo di base con il set completo di allenamento? – Arwa

0

C'è un altro importante uso del termine 'verità a terra', dove in problemi di regressione è molto prezioso per conoscere la vera componente deterministica dei dati da modellare.

0

Ground Truth è un dato fattuale che è stato osservato o misurato e può essere analizzato in modo obiettivo. Non è stato dedotto. Se i dati si basano su un'ipotesi, sono soggetti a un'opinione o sono discussi, quindi, per definizione, non si tratta di dati di Ground Truth.

La tua capacità di risolvere un problema utilizzando la scienza dei dati dipende enormemente dal modo in cui inquadra il problema e discernimento senza ambiguità, se riesci a stabilire la verità di base. maggiori informazioni sono dettagliate qui The Importance of Ground Truth in Data Science