Uso l'implementazione Python di XGBoost. Uno degli obiettivi è rank:pairwise
e riduce al minimo la perdita a coppie (Documentation). Tuttavia, non dice nulla sull'ambito dell'output. Vedo numeri tra -10 e 10, ma può essere in linea di principio -inf per inf?Qual è l'output di XGboost usando 'rank: pairwise'?
risposta
buona domanda. si può avere uno sguardo in kaggle competition:
In realtà, in Learning di rango campo, stiamo cercando di prevedere il punteggio relativo di ogni documento ad una query specifica. Cioè, questo non è un problema di regressione o di classificazione. Quindi, se un documento, allegato a una query, ottiene un punteggio di previsione negativo, significa e significa solo che è relativamente meno relativo alla query, quando si confronta con altri documenti, con punteggi positivi.
spero ora sia ok –
Se capisco correttamente il tuo qns, intendi l'output della funzione di previsione su un modello montato usando rank: pairwise.
Prevedi fornisce la variabile prevista (yhat).
Questo è lo stesso per la reg: lineare/binario: logistica, ecc L'unica differenza è che reg: lineare costruisce alberi per MIN (RMSE (y, yhat)), mentre Classifica: alberi di build a due a due a max (mappa (rango (y), rango (yhat))). Tuttavia, l'output è sempre quello.
A seconda dei valori delle variabili dipendenti, l'output può essere qualsiasi cosa. In genere, mi aspetto che l'output sia molto più piccolo nella varianza rispetto alla variabile dipendente. Questo di solito è il caso in quanto non è necessario adattare valori di dati estremi, l'albero ha solo bisogno di produrre predittori che sono grandi/piccoli abbastanza per essere classificati primi/ultimi nel gruppo
Fornisce il punteggio previsto per la classifica. Tuttavia, i punteggi sono validi per la classifica solo nei propri gruppi. Quindi dobbiamo impostare i gruppi per i dati di input.
Per classifica esay, fare riferimento al mio progetto xgboostExtension
sei stato trovato ciò che è l'uscita? –
No. Non ho ancora trovato la risposta. –