Ho dati di molti studenti che sono stati selezionati da alcune università in base ai loro voti. Iam new to machine Learning. Posso avere qualche suggerimento come posso aggiungere Azure Machine Learning per la previsione dei collegi che possono ottenere in base alle loro marchiSuggerimenti di apprendimento automatico
risposta
Prova una regressione logistica multi-class - anche guardare a questo https://gallery.cortanaanalytics.com/Experiment/da44bcd5dc2d4e059ebbaf94527d3d5b?fromlegacydomain=1
parte di regressione logistica, come suggerito da @neerajkh, proverei anche io One vs All classifiers. Questo metodo usa molto bene nei problemi multiclasse (presumo che tu abbia molti input, che sono i segni degli studenti) e molti output (le diverse università).
Per implementare uno o tutti gli algoritmi, utilizzare Support Vector Machines (SVM). È uno degli algoritmi più potenti (fino all'apprendimento approfondito, ma non è necessario qui l'apprendimento profondo)
Se si potesse prendere in considerazione la possibilità di cambiare il framework, suggerirei di utilizzare librerie python. In python è molto semplice calcolare molto velocemente il problema che si sta affrontando.
ottima risposta, penso! –
Per rimanere in linea con i suggerimenti di altri poster di utilizzare la classificazione multi-classe, è possibile utilizzare reti neurali artificiali (ANNs)/percettore multistrato per fare ciò. Ogni nodo di output potrebbe essere un college e, poiché si utilizzerà una funzione di trasferimento sigmoideo (logistico), l'output per ciascuno dei nodi potrebbe essere visto direttamente come la probabilità che il college accetti uno studente particolare (quando tenta di fare previsioni).
Perché non provi la regressione di softmax?
In termini estremamente semplici, Softmax riceve un input e produce la distribuzione di probabilità dell'input appartenente a ciascuna delle classi. Quindi, in altre parole sulla base di alcuni input (voto in questo caso), il tuo modello può emettere la distribuzione di probabilità che rappresenta la "probabilità" che un dato sudent deve essere accettato in ogni college.
So che questo è un thread vecchio, ma andrò avanti e aggiungerò anche i miei 2 centesimi.
Si consiglia di aggiungere un classificatore multi-classe e multi-etichetta. Questo ti permette di trovare più di un college per uno studente. Naturalmente questo è molto più facile da fare con una ANN ma è molto più difficile da configurare (ad esempio con la configurazione della rete, il numero di nodi/nodi nascosti o anche la funzione di attivazione per quella materia).
Il metodo più semplice per farlo come suggerisce @Hoap Humanoid è utilizzare un classificatore di supporto vettoriale.
Per eseguire uno qualsiasi di questi metodi è necessario disporre di un set di dati diversi. Non posso dire il numero di punti dati necessari che devi sperimentare, ma la precisione del modello dipende dal numero di punti dati e dalla sua diversità.
Questo è molto soggettivo. Applicare qualsiasi algoritmo che classifica in categorie non sarà una buona idea. Senza eseguire esplorativa Analisi dei dati e il controllo seguenti cose che non si può essere sicuri di un fare analisi predittiva, a parte i valori mancanti:
- variabile quantitativa e qualitativa.
- Distribuzione univariata, bivariata e multivariata.
- Variabile relazione alla variabile risposta (università).
- Ricerca di valori anomali (multivariato e univariati).
- Trasformazione variabile richiesta.
- Può essere la variabile Y suddivisa in blocchi per la posizione di esempio, ad esempio se un candidato può essere una parte di College in California o New York. Se c'è una maggiore possibilità di California, allora quale college. In questo modo è possibile acquisire relazioni lineari + non lineari.
Per gli studenti di base è possibile montare modello di regressione Softmax o 1 vs tutti regressione logistica che in realtà non conta molto e CART relazione non lineare. Vorrei anche fare K-nn e K-significa controllare gruppi diversi all'interno dei dati e decidere gli studenti predittivi.
Spero che abbia senso!
Il Least-square support vector machine (LSSVM) è un potente algoritmo per questa applicazione. Visita http://www.esat.kuleuven.be/sista/lssvmlab/ per ulteriori informazioni.
uso randomforesttrees e si nutrono di questo algoritmo ML a OneVsRestClassifer che è una classe a più classificatore
Sì, che può essere fatto come regressione logistica dà l'uscita come vero o falso di classe. In questo modo è possibile verificare quale valore dei segni è uguale a True. –